1. 安装依赖

git clone https://github.com/deepseek-ai/DeepSeek-OCR-2.git
conda create -n deepseek-ocr2 python=3.12.9 -y
conda activate deepseek-ocr2
wget https://github.com/vllm-project/vllm/releases/download/v0.8.5/vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl

上面下面的whl,然后执行pip安装

pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu118
pip install vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl
pip install -r requirements.txt

执行下面命令安装会报错。

pip install flash-attn==2.7.3 --no-build-isolation

解决方法是下载这个依赖whl,然后执行pip安装。可以访问点击这里访问代码仓库选择适合的版本下载。

wget https://github.com/Dao-AILab/flash-attention/releases/download/v2.7.3/flash_attn-2.7.3+cu11torch2.6cxx11abiFALSE-cp312-cp312-linux_x86_64.whl

2. 修改配置文件

先去到下面的路径,然后修改config.py文件。

cd DeepSeek-OCR2-master/DeepSeek-OCR2-vllm
vim config.py

修改模型路径为自己下载到本地的模型路径,即修改MODEL_PATH

修改INPIUT_PATH和OUTPUT_PATH为自己想要输入的image或者pdf文件以及保存处理结果的路径。

Q.E.D.


热爱生活,热爱程序