百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

GPU服务器私有化部署OCR服务

wptr33 2025-05-22 14:11 7 浏览

从年初的DeepSeek爆发,到现在各大模型百花齐放,大模型能力正在渗透到生活和工作的方方面面,ocr识别也在大模型能力的加持下,爆发出惊人的能力,今天就在GPU服务器上部署一下OCR服务。

首先要在GPU服务上安装显卡驱动,在之前的文章中也有写到,我们就从NVIDIA官网(
https://www.nvidia.cn/drivers/lookup/)上找出适合GPU型号的驱动:


NVIDIA驱动安装命令如下:

chmod +x NVIDIA-Linux-x86_64-550.120.run

./NVIDIA-Linux-x86_64-550.120.run

安装完就可以通过nvidia-smi命令查看:


该ocr服务需要用到avx2指令集。若机器不支持avx2指令,服务将无法启动。查看机器是否支持avx2指令方法如下:

cat /proc/cpuinfo | grep avx2


然后就是按照docker-ce,由于该服务器无法联网,只能进行离线安装,首先安装docker-ce的依赖包,依赖如下:


通过命令rpm -ivh *.rpm进行安装。然后在安装docker-ce得安装包,如下:


安装完可通过以下命令进行设置:

Bash
# 重新加载systemd配置
systemctl daemon-reload

# 启动并设置开机自启
systemctl enable docker
systemctl start docker


可通过以下命令查看版本:

Bash
docker --version 
docker info


docker安装好之后,还要安装nvidia-docker2,nvidia-docker2NVIDIA推出的一款Docker插件,用于在Docker容器中启用NVIDIA GPU支持。安装包如下:


还是通过 rpm -ivh *.rpm进行安装,安装完之后,重启docker服务,我们就可以启动docker服务,来启动ocr服务了。


vi /etc/docker/daemon.json
{
    "default-runtime": "nvidia",
    "runtimes": {
        "nvidia": {
            "path": "nvidia-container-runtime",
            "runtimeArgs": []
        }
    }
}

首先导入OCR服务镜像包:

命令为:docker load -i ocr-xxxxxx.tar.gz


然后通过docker run来启动,找一张单据图片,调用服务测试一下:



识别结果还是可以,下面的表格也是按照结构化数据识别输出了!

相关推荐

文科生自学Python-生成简单的WORD文档

--天行健君子以自强不息,地势坤君子以厚德载物,学习编程成就更好的自己--Python语言简洁生动,特别适合文科生学习入门IT世界,用几十行代码就能够做一个完整的爬虫脚本,开发效率杠杠的!短时间内即可...

使用Python 爬取京东、淘宝等商品详情页的数据,避开反爬虫机制

以下是爬取京东商品详情的Python3代码,以excel存放链接的方式批量爬取。excel如下...

CV学习笔记(二十四):数据集标注与制作

最近在做一些数据标注的工作,虽然标注数据比较枯燥,但这也是每个做算法的工程师升级打怪的必由之路。使用一些合适的工具往往可以事半功倍,效率UP。一:数据标注流程二:数据处理的一些小代码1:重命名当得到这...

新手常见的python报错及解决方案(如何理解python报错信息)

此篇文章整理新手编写代码常见的一些错误,有些错误是粗心的错误,但对于新手而已,会折腾很长时间才搞定,所以在此总结下我遇到的一些问题。希望帮助到刚入门的朋友们。后续会不断补充。...

殊途同归python第5节:一键管理所有文档

Python自带的os模块,文件和文件夹的小管家,直接上代码importosa=os.getcwd()#获取当前路径,以字符串形式返回当前的绝对路径。os.chdir("动画片收...

1.文件夹的处理 OS(文件夹的操作方法)

os.getcwd()#当前目录os.listdir()#列出目录下的文件os.path.join()#拼接路径os.path.split()#拆分路径os.path.exists...

Linux下分析bin文件的10种方法(linux binary文件)

这世界有10种人,一种人懂二进制,另一种人不懂二进制。——鲁迅大家好,我是良许。二进制文件是我们几乎每天都需要打交道的文件类型,但很少人知道他们的工作原理。这里所讲的二进制文件,是指一些可执行文件,...

文科生自学Python-pandas交叉透视表降维变换

--心有猛虎,细嗅蔷薇,学习编程成就更好的自己--...

史上最全!近万字梳理Python 开发必备的 os 模块(建议收藏)

点赞、收藏、加关注,下次找我不迷路...

工作中必备的12个Git命令(常用git命令清单)

...

Undoing a git rebase(undoing a git rebase)

技术背景在使用Git进行版本控制时,gitrebase是一个强大的命令,它可以将一个分支的修改合并到另一个分支,使提交历史更加线性。然而,在某些情况下,我们可能需要撤销...

【干货】常用的Git命令有哪些?(git 常用命令行入门)

Git是一个开源的分布式版本控制系统,它被广泛用于软件开发中。在使用Git进行版本控制时,有许多常用的命令,本文将对这些命令进行详细的介绍。...

项目中使用 husky 格式化代码和校验 commit 信息

大家好,我是前端西瓜哥。今天我们学习使用husky工具,在commit的时候做一些风格的校验工作,包括commit信息格式化和文件格式化。githook和husky...

Git可视化极简易教程 — Git GUI使用方法

前言...

实际工作中 Git Commit 代码提交规范是什么样的?

...