数电发票作为企业经济活动的重要商事凭证,其票面信息、开具频次、项目构成等,深度契合并直观反映了不同行业的经营逻辑、业务模式与核心特征,成为识别行业属性、分析行业动态的重要依据。
2024年,国家税务总局厦门火炬高技术产业开发区税务局组建“行业智能分类模型”团队,提取数电发票进销项信息,总结行业特征规律,梳理形成涵盖票流信息、经营特性、跨行业关联度3个维度共12项指标的“行业发票基因模型”,实现对企业实际经营行业的精准识别。近两年来,该模型在风险预警、政策适配与经济分析等方面发挥了重要作用。
总结行业特征,纠正归类错误
行业分类是确定企业能否享受特定税费政策的核心依据,直接关系到政策适用的准确性与公平性。行业性税费优惠的享受需以准确的行业分类为前提,然而在实际工作中,企业开办时自主填报的国标行业信息,常因认知偏差或变更滞后导致分类不准确。
“在前期调研中,我们发现,某些制造业企业因行业登记错误,始终未能享受先进制造业加计抵减政策,还有部分企业因行业归类不准确,违规享受了研发费用加计扣除政策。”厦门火炬高技术产业开发区税务局“行业智能分类模型”团队负责人陈海鹏告诉记者,企业的实际经营状况,往往更真实地反映在日常开具和接收的数电发票之中。
数电发票上不仅记录了交易金额、买卖双方等基础信息,更详细载明了商品或服务的名称、规格、数量及单价,这些信息直接反映出企业实际的经营活动和业务特征。即便企业登记行业信息存在错误,其采购与销售的商品结构,仍可客观体现真实运营模式。同一行业的企业,在发票流水中往往会呈现出相似的进销结构和品类特征,保持着内在的一致性。
基于这一发现,厦门火炬高技术产业开发区税务局深入挖掘数电发票数据价值,提取出进销项商品相似度、行业购销比、主营业务开票金额占比等12项具有高度行业区分度的关键指标,构建起“行业发票基因模型”。该模型可以自动识别企业实际经营特征与标准行业特征之间的偏离程度,从而精准发现异常情况。
近期,“行业发票基因模型”扫描发现,某能源科技有限公司的进销项发票品目高度重合,均集中在“太阳能支架”“金属构件”等商品上,且同一品名进销金额占比相近、流转频繁,形成清晰的“购进—销售”闭环,呈现出批发零售业的典型开票特征。然而,该企业登记行业却为“自然科学研究和试验发展”。
“研发类企业应开具技术咨询、服务或设备采购等内容的发票,而该公司发票流水却未体现任何研发活动特征。”陈海鹏说。经实地核实,该企业应归属于批发零售业,税务干部及时辅导企业进行了更正。
自2024年以来,“行业发票基因模型”共识别1564户疑似行业归类错误企业,经税务干部逐户核实,确认1544户存在问题,准确率达98.72%。
模型多元应用,拓展治理场景
“贵金属加工行业通常保持着稳定的贵金属采购与废料处理的完整记录。”陈海鹏介绍,“行业发票基因模型”分析发现,厦门某科技有限公司的贵金属耗用率显著高于行业正常水平,且在连续多个申报期内未发现废料处理的发票记录。经税务干部实地核查,证实该企业大量采购有色金属用于日常生产,并与上游供应商签订了废料回收加工协议,通过“换货模式”将生产过程中产生的贵金属废料按比例置换为等价值的原材料,从而规避了对废料销售收入的申报义务。最终,在税务干部的辅导下,企业依法补缴了相应税款及滞纳金。
除了用于纠正企业分类错误,厦门火炬高技术产业开发区税务局还拓展出优惠政策精准推送与纠偏、电商收入监管、变票虚开识别、虚列成本、废料收入管理等应用场景,构建起更加严密的风险防控体系。
该局利用“行业发票基因模型”对辖区内93户“工艺树脂”制造企业开展分析,发现厦门某工艺品有限公司大量购入二甲苯、工业白油等化学化工制品,缺少酰胺酸等必备生产催化原料,进项商品组成结构与行业主流模式迥异,存在变票虚开风险,遂将其列入风险纳税人管理。
在通过“行业发票基因模型”延伸建立的优惠政策精准推送与纠偏场景下,该局进一步细化出“负面清单行业企业错误享受研发费用加计扣除”“负面清单行业企业错误认定高新技术企业”两个大数据子模型。目前,上述两个模型已在厦门全市推广,累计发现82户企业违规享受税收优惠,准确率96.34%;提示11户企业的高新资质认定存疑,准确率100%。