电子发票是现代信息社会的产物,是在购销商品、提供服务或者接受服务以及从事其他经营活动中,开具、收取的数据电文形式的收付款凭证。电子发票与传统发票的区别主要有两点:一是从传统的物理介质发展为数据电文形式,二是打破了纸质发票作为会计记账凭证的传统,具备会计档案电子记账的条件。国家税务总局公告2015年第84号《关于推行通过增值税电子发票系统开具的增值税电子普通发票有关问题的公告》正式规定打印版式电子发票的法律效力、基本用途和基本使用规定等与税务机关监制的增值税普通发票相同。
在传统的方式中,财务会计人员接触最多的是结构化的数据,如三十年前开始采用的会计电算化中使用简单的关系型数据库作为财务信息的存储、查询和报送工具,财务领域最核心的三张表——资产负债表、利润表和现金流量表以及账册,也是结构化数据。随着财务管理越来越向前端延伸去支撑业务,财务工作面对的不仅仅是结构化的财务数据,而可能会面临很多业务数据,比如客户信息、公司产业信息等,在这些大量的业务数据中,相当多的数据可能是非结构化的数据,有些信息甚至可以从社交媒体当中产生,这些信息反映了用户群的偏好和聚焦程度,并可作为投资估值和市场决策依据,在资本市场上也为投资机构和监管部门所关注。对企业来说,财务工作所需的信息不是任凭几张表格就可以囊括的。
对发票来说,数据是相同的,但由于格式可能会有所不同、形式不同,发票中存储的信息成为非结构化数据。如果机器人获得了这种非结构化数据,它可能会突然停止运行。这时通过机器学习,从发票表格中提取元数据并将其输入到记录系统中,一旦输入,机器人就可以使用这些数据进行后续处理。利用搜索功能提取发票中记录的开票日期、金额、货物或应税劳务、服务名称等元数据信息,将加强企业管理整个财务风险组合,加速会计核算人工智能化进程。