从RPA自动化办公软件的角度看智慧文本(Supertext)到底有多智能
文本审核、文本比对、表格识别、关键词抽取、文本纠错、光学字符识别(OCR)……
文档管理发展的必然趋势 数字化时代早期,文档管理在各项技术的推动下,通过信息化使效率得到了部分提升。但简单的信息化,并不能满足文档管理工作跨越式发展的需要。尤其在部分文字密集型行业的日常业务场景中,涉及大量的票据、合同、法务文本等不同类型的文档文件,因信息冗杂、审阅难度大、周期长等难题,制约了业务发展。
当前,由于技术限制和业务要求,文档审核高度依赖人工,然而因为文档繁琐复杂人工核查易出错且人员需求量大,投入产出明显不经济。因此,从文档管理信息化到文档管理智能化已成为发展的必然趋势。
02重新定义文档审阅新模式
针对这一需求,实在智能通过国产全自研的AI能力,重新定义文档审阅模式,全流程赋能文档智能化管理,有效提升提高文档管理的效率及准确性。Supertext智慧文本是人工智能能力在文档分析审阅场景的解决方案,利用了强大的预训练模型,实现内容密集、篇幅长、非结构化文档的分析和审阅。广泛适用各种合同、文件、文章、等审核场景。其智能的关键词/要素/实体等抽取、多版本文档比对、智能纠错,以及个性化风险识别,结合RPA自动化操作,极大提高企业文档处理的效率和准确率。
原理1内置通用模型内置合同、财报等常用模板的通用解析能力,支持开箱即用。内置OCR能力,支持对pdf、图片类文本的处理。
原理2支持增量训练用户可基于已有模型进行自主定制。内置命名实体识别、词性标注等NLP技术,提升自定义规则泛化能力。
原理3提供标注工具帮助用户基于业务需要快速标注需要解析的文本。系统自主训练与人工标注并行,有效提升效率。实在智能AI产品Supertext智慧文本,依托光学字符识别(OCR)、自然语言处理(NLP)、知识图谱(KG)等技术,实现文档管理的智能化。可广泛应用于金融、制造、通信、法律、审计、媒体、政府等各个行业的各种文档处理场景,实现全流程赋能文档管理,提供包括文本审核、文本比对、表格识别、关键词抽取、文本纠错、光学字符识别(OCR)等基础服务,全面提高业务审查效率及准确性。
03文档智能审阅系统核心能力
典型功能一
表格识别与解析可从.doc .docx .wps .pdf .txt .jpg .jpeg .png .tiff .tif等多种类型文件中抽取表格标题及内容。
核心功能1、可识别无边框表格、合并单元格2、多种表格框选修改功能3、自主修复OCR识别结果的内容纠错修改4、识别结果下载为Excel
源文件与解析结果相互对应,准确定位,方便核验。
典型功能二
合同审核内置多种常用合同审核和常见风险点,结合自定义风险点和逻辑运算,可覆盖95%以上合同风险,帮助企业快速发现潜在风险并给出修改建议。
核心功能
1、审核条款展示:语义理解获取合同内容区域目录,快速定位审阅内容。
2、原文风险点定位:内置常见审核点和法律标准审核点,亦可自动添加个性化审核点。
3、自定义风险点:内置常见风险点和法律标准审核点,亦可自动添加个性化风险点。
4、支持逻辑运算校验:支持数值逻辑运算,和业务规则的数据后处理设置。
典型功能三
文本比对实现word、pdf、图片、扫描件等多个格式文本之间的差异点比对,包括标点,页眉页脚等,比对准确率高达99.9%以上,并自动生成对比结果报告。
文本比对核心功能
1、差异点精准定位:精准定位差异点位置,用户直观比较差异点。
2、差异结果下载:支持下载差异报告、高亮文件和源文件,方便用户后续使用。
3、分类展示差异点:差异点分类:添加、删减、改动。
4、表格内容比对:支持文件中嵌套表格内容比对。
5、三屏同步滚动:原文、比对文、差异结果栏三屏同步滚动。
6、文本相似度计算:计算本文相似度,用数据展示比对结果。
表格差异比对
表格文字内容比对:添加、删减、改动
表格格式比对:行、列、单元格增减变化
典型功能四
关键词抽取支持word、pdf、图片、扫描件等多个格式文本之间的关键词信息提取,高达95%以上的准确率获取审阅文档中关键信息。
合同文本解析
核心功能1、秒级响应:90%以上文件均能在毫秒级给出反馈和修改建议。2、自定义抽取模板:对文档进行行业细分归类,可基于现有模型升级自定义模板。3、自定义抽取关键词:自定义抽取的实体和自定义抽取规则。4、准确率高:依托海量数据搭建的多种语义模型,有效提升识别准确率。
典型功能五
文本纠错准确识别输入文本中出现的拼写错别字及其段落位置信息,并针对性给出正确的建议文本内容。
文本纠错
核心功能
1、多种错误类型纠正:支持谐音字、混淆音字、顺序颠倒、形似字错误、语法错误、字词补全等多种错误类型。
2、海量数据积累:基于海量中文互联网数据积累,并有效融合了丰富的各类知识库。
3、识别精度高:结合了树模型和神经网络模型的优势,既保证了基础效果,又保证了对海量数据的高效利用。
4、自定义错误词:自定义个性知识库,新增修改符合个性规则的错误类型。
典型功能六
财报解析支持文档、PDF等多种格式财报上传,通过结构化解析,并结合财务勾稽关系校验整合,完成财务数据的风险审核、结果修改和输出。
财务报表文本解析
核心功能
1、专业精准解析:支持相同指标下同义词的归一与整合。
2、模板格式填写:将财务数据进行结构化抽取,并填列至预定义的模板中。
3、勾稽关系校验:财务勾稽关系+黄色预警+职业逻辑关系校验。
4、解析结果修改:并支持用户在线修改解析结果和下载。
典型功能七
体检报告解析支持文档、pdf等多种格式体检报告结构化输出,并自动归档填入Excel。
体检报告识别
核心功能
1、相同指标同义词归一化:支持相同指标下同义词的归一与整合。
2、超高实用性:支持各类画质下的体检报告片识别。并自动归档填入Excel。
3、投保单模板自定义:支持图片格式投保单识别并结构化输出。支持投保单模板自定义配置及自动填单。
4、识别精度高:结合了树模型和神经网络模型的优势,既保证了基础效果,又保证了对海量数据的高效利用。
核心亮点优势
基于实在智能强大的AI能力和场景沉淀,融合自然语言处理技术(NLP)及计算机视觉技术(CV),实现在处理精度、效率和易用性上做到业界领先地位。
本文由智慧文本提供,https://www.ai-indeed.com
电商RPA,2022年电商必须重视起来的自动化办公软件
人力RPA自动化办公软件,到底能帮HR解决什么工作
关于自然语言处理(NLP)的十大应用你知道多少


