Skip to content

NJUOCR/universal_cnn

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

软院同学参考学院内网环境下的使用说明下载


依赖

依赖 安装示例
cv2 pip install opencv-python
tensorflow pip install tensorflow==1.11.0
yaml pip install pyyaml
flask pip install Flask
progressbar pip install progressbar2

TODO

  • 添加文件上传功能

使用

OCR服务以web的方式对外提供接口。 推荐使用我们发布的docker镜像,点击下载(不可用),镜像支持linux、mac、windows平台。

安装windows版docker的过程中,请根据提示选择启用hyper-v 特别注意 非windows专业版用户安装docker请参考@惠天宇

在docker中启动服务

1. 更改服务端口

app.py中修改port对应的数值,下面代码中使用4444作为服务端口

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=4444, debug=False, threaded=False)

2. 启动服务

进入项目根目录,并使用python3运行app.py

cd /usr/local/src/universal_cnn
python3 app.py

预训练模型已在docker镜像中配置好,无需额外配置

使用OCR服务

服务接口为标准GET请求: http://$(host):$(port)/?path=$(your_image_path)[&auxiliary=1][&remove_lines=1][&verbose=1]

参数说明

类型 说明
path 必填 your_image_path是需要做识别的图片路径,务必确保它已经位于容器中,或已通过其他方式挂载进容器
auxiliary OCR开发人员可选 是否缓存中间过程图片,可以用来分析识别结果
remove_lines 可选 尝试去除图片中的下划线和表格框
verbose 可选 获取关于识别文字的位置大小等,请参考获取更多信息

示例

使用wget调用服务,建议在URI中加入引号。

wget -O out.txt 'http://[your_host]:[port]/?path=test_data/test0.png&remove_lines=1'

识别结果会写入out.txt

我们在镜像中准备了一些测试用的图片,位置:[project_root]/test_data

Trouble Shooting

在直接使用我们提供的Docker镜像时,一般不会出现下列问题

1. 缺少动态链接库

1.1 Cannot open ** libSM.so.6 ** when import cv2:

apt install -y libsm6 libxext6

by StackOverflow

1.2 Cannot open ** libXrender.so.1 ** when import cv2:

sudo apt-get install libxrender1

by StackOverflow

1.3 Cannot open libGL.so.1

apt install libgl1-mesa-glx

by StackOverflow

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •