提升数据质量 拓展应用场景

2025年12月17日 版次:07        作者:刘建华

当前,各级税务部门深入实施数字化转型条件下的税费征管“强基工程”,面对征管基础和日常管理中数字化转型的短板弱项,如何将分散于各环节、游离于系统外的数据进行梳理、整合和运用,释放税收征管数据应用的乘数效应,系统提升“强基工程”工作质效,已成为摆在基层税务部门面前的一道考题。国家税务总局青岛市李沧区税务局坚持“能用数、会用数、用好数”,从数据供给、数据流通、数据应用三个维度破题,立足实践探索一条可行路径。

强化数据供给,破解“基础不稳”难题

目前基层征管数据标准化、智能化和完整性程度均偏低,且缺乏清洗加工,陈旧数据、失真数据、垃圾数据未经剔除,给税收征管数据的整合、分析和利用带来不便。为从根本上解决这一问题,李沧区税务局从数据源头抓起,通过“拓来源、提质量、强智能”三管齐下,全面提升数据质量。

持续拓展数据来源。针对基层征管数据供不出、供得少等问题,创新“场景化”聚数方式,围绕税务登记、发票管理等110项具体业务,明确各部门在不同业务场景下需传递的数据。对内要求各部门依据职责在股权转让、房产交易等具体业务环节,收集整合税务登记、纳税申报、财务信息等多维数据,通过数据传递做好信息提醒和政策衔接,确保各个业务环节不缺失;对外加强与环保、土地、海关等外部门数据交换,不断引来数据“源头活水”。例如,当企业缴纳土地出让金时,及时将相关数据传递至税源管理部门,提醒关注该企业契税、房产税、城镇土地使用税等相关税费变动和后续申报,确保税源监控不脱节。

稳步提高数据质量。探索建立数据采集、数据质量、数据安全等方面的基础制度或流程规范,把好数据入口关,扎口对各类数据进行规范化筛查清洗,剔除失真、失效等垃圾数据,确保数据准确有效、能用可用。例如,建立“在建工程三年未转资”“异地施工预缴不足”等6项数据清洗指标,定期对数据进行筛选清理,并对数据质量问题较多的企业开展辅导培训,持续提升基础数据的准确性和规范性。

提升数据智能化水平。强化算法模型建设,探索借助算法模型实现数据自动提取、自动筛选、自动计算,将系统内外数据充分整合,实现高效供给。例如,打造“驭数临风”智税工作室,搭建出口快递费、异地施工本地预缴不足、投资性房地产等46个风险监控模型。

拓展数据协同,破解“流通不畅”壁垒

数据只有高效流通,才能发挥最大效能。随着信息化的不断推进,税收征管信息系统已解决大部分有工作流支持的税收管理事项,但仍有部分零散化、碎片化的数据资源“沉睡”在各部门、各环节,因缺少传递和提醒,导致主动应用意识不足。为此,李沧区税务局通过“定标准、拓路径、建平台”三步走,构建起纵横贯通、安全高效的数据流通体系,破解数据流通难题。

加强数据标准化建设。聚焦夯实数据流通使用的底层基础,探索从源头统一征管数据格式、技术等规则要求,建立数据标准化录入、提取、校验、供给等机制,实现对各类数据流通的标准化管理,提升数据的准确性、完整性和一致性。例如,制定《李沧区税务局数据要素赋能税收管理工作指引》,依托数据供给和数据应用场景库,明确数据供给内容、供给类型、供给时限等,确保数据来源、质量的同时,稳步提升数据的可读性、可用性和可流通性。

拓宽数据流通路径。探索建立分门别类、管理规范、开放共享的“数据库”,重点建立内部数据共享机制,提升供需匹配效率,实现数据多角度、宽领域的流通使用。例如,在横向流动上,集成法制、税政、征管等部门“碎片化”的征管数据,探索在堵漏增收、质量评价、风险内控等业务管理部门中交互流通,有效盘活“沉睡的数据”;在纵向流动上,结合征管业务实际,探索建立“税政疑点数据扫描—风险疑点扎口管理—税源管理科所落实”等形式的规范化工作格局,实现征管数据精准传递、高效利用。

建立数据共享平台。着眼于为数据高效流通和深度应用提供核心载体,搭建集数据查询、模型分析、成效反馈等功能于一体的智能化应用平台,降低数据应用门槛,将分散的数据转化为可观可感的分析成果和决策支持。例如,依托内网云文档,建立依申请数据供给和依职责数据供给台账,打造集成全局核心业务数据的即时性传递平台,实现数据安全保存、快速获取和高效运用,截至目前已依申请传递数据29批次,依职责传递数据108批次。

深化数据应用,破解“价值单一”瓶颈

数据的价值在于应用,应用的关键在于场景。结合基层实际来看,当前征管数据应用多局限于风险防控等传统单一应用场景,在堵漏增收、新经济新业态监管等特色征管场景方面的拓展延伸相对滞后,且不同应用场景之间缺乏交叉协同应用。李沧区税务局以需求为导向,推动数据应用从“单一优化”向“综合拓展”,再向“创新延伸”逐级深化,实现数据价值的全方位释放。

优化单一应用场景。围绕强化应用驱动,探索以堵漏增收、风险防控、质量监控等重点领域场景应用为先导,建立数据指标体系,深化数据要素开发应用,提升税收征管效能。例如,推动组织收入部门建立组织收入数据应用指标体系,涵盖内控平台、发票管理、增值税等10个应用场景、39项重点工作任务,推动组织收入任务落实;推动法制部门搭建政策适用管理数据应用指标体系,优化完善涵盖减免税、退税等28项优惠政策在内的风险分析指标,编写包含误收多缴、汇算清缴等5类退税业务的《退税审核风险防控指引》,实现政策适用管理精准落地。

拓展综合应用场景。围绕推动数据要素互联互通,在抓好堵漏增收等单一应用场景的基础上,探索一个指标可以从不同角度、不同口径,同时为征管、收入、内控等部门互享互用,确保既抓实堵漏增收,又强化风险防控,还实现质量监控水平提升。例如,将税政部门发现的企业所得税堵漏增收点,及时传递至法制部门开展专项分析,有效规避潜在的税务执法风险。

创新延伸应用场景。围绕深化数据应用场景创新,探索将数据单场景、单部门应用成效延伸至更广领域,通过数据要素跨系统(包括政府、海关、公安、银行等)的高效供给和流通,孕育出更多新的征管方法和服务举措,激活数据要素乘数效应。例如,配合公安部门调查某涉嫌虚开发票案件时,将外部信息与税务系统内部数据进行关联分析和交叉比对,识别出辖区内2家企业与被调查企业存在业务往来,经案头分析、约谈取证,确定了2家企业涉嫌虚开的违法事实。

实践证明,激活乘数效应的关键,不仅在于拥有数据,更在于打破壁垒、创新场景,让数据在流动和应用中创造价值。

(作者系国家税务总局青岛市李沧区税务局党委书记、局长)