事业单位要实现财务数智化,首先需要对会计和业务信息进行数字化处理和提取,即实现信息输入数智化;其次需要实现对信息和流程的实时控制和自动审核,即实现信息处理数智化;最后需要为单位管理决策和业务预测提供准确有效的分析结果,即实现信息输出数智化。因此,基于深度学习的财务数智化的具体应用主要包括三个方面:信息识别和提取、信息控制和审核、信息分析与决策等。
(一)信息识别和提取
对不同渠道、结构各异的信息和数据进行提取和处理是实现财务数智化的基础,是财务数智化后续环节中信息和数据有效性和可靠性的保障。这些信息和数据通常来自纸质单据和凭证,主要包括纸质发票、采购单、交易合同等,提取的信息主要包括单据编号、货物或服务名称、单价和数量、交易时间和地点、交易各方名称等。
传统的单据识别方法主要基于OCR(Optical Character Recognition,光学字符识别)技术,即应用扫描仪等设备通过明、暗模式的检测确定字符形状,然后经过区域定位、信息提取和分类识别等方法将形状转化成计算机文字的过程。传统方法的识别效果对图形成像的质量要求较高,图像所呈现的文本必须清晰规范,对于图像背景复杂、成像模糊、文字形状不规则的单据识别效果的稳定性较低。因此,基于OCR技术的传统识别方法只适用于特定场景下的单据图像检测和文字识别。
随着深度学习在计算机视觉应用的发展,基于深度学习的图像识别和文本提取技术可以把区域定位、信息提取和分类识别过程整合到深度学习模型中,有效提高图像识别和文本提取的效率。按照实现原理不同,基于深度学习的图像识别和文本提取技术主要分为两大类:一是区域候选法,通过选取候选区域预测目标位置,即对每个候选区域进行特征提取、分类和调整,实现高精确度的识别;二是回归法,通过在原图图像上划分网格代替区域候选步骤,对边界框和待识别文本区域的偏移量进行回归计算,以获得目标位置信息,实现较快速度的识别。区域候选法的特点是需要执行区域候选步骤,通常耗时较长,因此适用于对识别精确度要求较高的场合,如汇票和支票等票据防伪识别等。回归法的特点是以牺牲识别精确度换取识别速度,相比区域候选法而言精确度有所降低,因此适用于对识别速度要求较高的场合,如网络单据图像的快速查找与定位等。
对于单据等图像识别和文本提取来说,通常采用上述两种方法的结合,即在回归法的基础上,参考改进的区域候选法,为每个网格设置不同尺度的默认框以适应目标形状,从而在保证检测速度的基础上提升单据识别精确度。以纸质发票为例,深度学习算法将在发票图像基础上,预测发票文本区域的位置,包括发票代码和号码、开票日期和金额、开票内容、销售方名称和纳税识别号等,然后对选定位置的字符序列进行分割、分类识别和合并,最后输出发票文本信息,为后续发票验真、发票查重、财务审核、决策分析等信息处理和输出的智能化提供基础,保证数据真实、准确和完整。
(二)信息控制与审核
在信息识别提取完成后,财务管理工作进入信息控制与审核阶段,需要对业务信息和会计信息进行控制和审核,保证财务管理信息的真实性、准确性和合规性。常见的应用场景包括预算管理和支出核算。以RPA(Robotic Process Automation,机器人流程自动化)技术为基础的财务系统或财务机器人,可以针对财务工作中基于标准化的、大量的、可重复的工作流程设计脚本,以机器自动化替代人工操作,实现控制与审核的自动化。但是,由于RPA技术是按照既定脚本执行业务流程,因此无法通过自主学习和训练以应对非标准化、复杂多变和风险隐蔽的业务。