软院同学参考学院内网环境下的使用说明下载
依赖 | 安装示例 |
---|---|
cv2 | pip install opencv-python |
tensorflow | pip install tensorflow==1.11.0 |
yaml | pip install pyyaml |
flask | pip install Flask |
progressbar | pip install progressbar2 |
- 添加文件上传功能
OCR服务以web的方式对外提供接口。 推荐使用我们发布的docker镜像,点击下载(不可用),镜像支持linux、mac、windows平台。
安装windows版docker的过程中,请根据提示选择
启用hyper-v
特别注意 非windows专业版用户安装docker请参考@惠天宇
在app.py
中修改port
对应的数值,下面代码中使用4444
作为服务端口
if __name__ == '__main__':
app.run(host='0.0.0.0', port=4444, debug=False, threaded=False)
进入项目根目录,并使用python3运行app.py
cd /usr/local/src/universal_cnn
python3 app.py
预训练模型已在docker镜像中配置好,无需额外配置
服务接口为标准GET请求:
http://$(host):$(port)/?path=$(your_image_path)[&auxiliary=1][&remove_lines=1][&verbose=1]
键 | 类型 | 说明 |
---|---|---|
path | 必填 | your_image_path 是需要做识别的图片路径,务必确保它已经位于容器中,或已通过其他方式挂载进容器 |
auxiliary | OCR开发人员可选 | 是否缓存中间过程图片,可以用来分析识别结果 |
remove_lines | 可选 | 尝试去除图片中的下划线和表格框 |
verbose | 可选 | 获取关于识别文字的位置、大小等,请参考获取更多信息 |
使用wget
调用服务,建议在URI中加入引号。
wget -O out.txt 'http://[your_host]:[port]/?path=test_data/test0.png&remove_lines=1'
识别结果会写入out.txt
我们在镜像中准备了一些测试用的图片,位置:
[project_root]/test_data
在直接使用我们提供的Docker镜像时,一般不会出现下列问题
apt install -y libsm6 libxext6
sudo apt-get install libxrender1
apt install libgl1-mesa-glx