合合信息智能文档处理技术破解文档识别难题

最新信息

2024-01-05 19:28:00

本报记者施露
　　1月5日，合合信息联合琶洲实验室、中国图象图形学学会青年工作委员会共同承办了《垂直领域大模型论坛》。论坛汇聚了高校及行业企业专家，为大模型在垂直领域中的应用寻找新的落脚点。
　　论坛上，合合信息智能技术平台事业部副总经理、高级工程师丁凯博士对GPT-4V在文档处理领域的实际表现进行了解析，并对公司在智能文档处理领域的研究工作进行了分享。丁凯表示，GPT-4V在场景文字识别、语言形态、语言种类等方面的表现非常惊艳，但在场景文字识别，表格识别上，大模型的处理效果距离当前SOTA（State Of The Art）的方法尚有较大差距。
　　“在智能文档处理领域，大模型支持识别和理解的文档元素类型远超传统算法，大幅度拓展了AI技术在文档分析与识别领域的能力边界，端到端实现了文档从识别到理解的全过程。不足在于，目前大模型的OCR精度距离领域最佳模型有较大差距，长文档依赖外部的文档解析引擎。”丁凯表示。
　　目前，合合信息-华南理工大学文档图像分析识别与理解联合实验室针对大模型文档处理中的像素级OCR统一模型、OCR大一统模型等重点技术方向进行了深入研究，相关工作成果在文本去除、文本分割和篡改文本检测任务上得到了广泛验证。
（文章来源：证券日报）

免责申明： 本站部分内容转载自国内知名媒体，如有侵权请联系客服删除。