Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

想咨询一下,下个版本的表格识别模型在哪些方面做了优化,是否在复杂的表格识别的准确率上有提升 #12061

Closed
liuzhipengchd opened this issue May 7, 2024 · 9 comments
Assignees

Comments

@liuzhipengchd
Copy link

希望有大佬帮忙回答一下。如果有,下个版本什么时候可以体验到

@hopegithub
Copy link

chatgpt4真的很可以,支持褶皱表格识别

@UserWangZz
Copy link
Collaborator

目前ppocr暂时还没有表格结构的优化,后续会持续进行模型的优化的。想体验最新的通用OCR大模型和文档解析大模型可以关注PaddleX

@TingquanGao
Copy link
Collaborator

针对合并单元格等复杂表格的识别进行了优化。

@liuzhipengchd
Copy link
Author

针对合并单元格等复杂表格的识别进行了优化。

大佬,如果单元格中的文字 有很多竖着的文字,这种情况的识别效果有提升么。(目前模型,对于如果有竖着的文字,识别容易串行)

@UserWangZz
Copy link
Collaborator

这种场景可以考虑微调一下文本检测模型看看效果

@liuzhipengchd
Copy link
Author

这种场景可以考虑微调一下文本检测模型看看效果

大佬,还有2个问题,1、就是可以识别字体的大小,包括颜色这些熟悉吗。2、如果表格识别中,有一个单元格错了,那么整个表格的格式就不能正常在html中展示,这种情况有没有解决办法(可以修复错误单元格,让其正常展示)

@hopegithub
Copy link

@UserWangZz 大佬,我想咨询一下,通用表格模型,能够支持稍微有点褶皱和倾斜的表格,应该使用哪个模型比较好呢

@UserWangZz
Copy link
Collaborator

这种场景可以考虑微调一下文本检测模型看看效果

大佬,还有2个问题,1、就是可以识别字体的大小,包括颜色这些熟悉吗。2、如果表格识别中,有一个单元格错了,那么整个表格的格式就不能正常在html中展示,这种情况有没有解决办法(可以修复错误单元格,让其正常展示)

第一个问题,我理解的话字体的大小是否可以通过检测模型box的长宽来过滤,颜色的话简单训练一个分类器是不是就可以了?
第二个问题,目前html解码是根据模型输出做的,因此很难在后处理阶段来对错误进行修复。

@UserWangZz
Copy link
Collaborator

@UserWangZz 大佬,我想咨询一下,通用表格模型,能够支持稍微有点褶皱和倾斜的表格,应该使用哪个模型比较好呢

目前仓库提供的模型都没有在这个场景中进行训练过,所以可能表现不会很好

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

4 participants