行业领域:信息传输、软件和信息技术服务业 —— 科技推广和应用服务业
专利信息: 非专利技术
成熟度: 通过中试
技术合作方式: 合作生产
技术推广方式: 正在技术推广
技术交易价格: 面议
联系人:潘先生
联系方式:18758941010
技术成果发布数:1033
邮箱:panankeji@126.com
适用范围
本产品可应用于数字出版、金融科技、电子书、题库、在线教育、咨询、动漫等领域的内容加工与信息挖掘。
成果内容简介
本软件主要功能是版面对象(文字、表格、公式、图形等)的自动识别,包括版面分割、样式识别、表格识别、公式识别、图形解析、文字识别与元数据抽取等。可用于数字内容制作(如点读书热区检测)、文件格式转换(如PDF到EPub)、表单识别与金融文档处理、数学公式识别与结构化拷贝、题库构建与试题检索、漫画制作与检索等。目前支持图像、PS、PDF、Word、EPub、网页等文件格式,支持图书、论文、证券研究报告、试题、表单类数据等。
转化应用前景
通过对于用户输入的图像进行自动分析,从而获取版面中的分镜,并且根据识别的分镜之间的几何位置关系判定其阅读顺序,从而使得图像能更好地在移动设备上阅读。该方法能够自动理解版面,解决了目前方法不能处理复杂布局版面的问题,可以提升处理效率和用户体验。
