人民网
人民网>>政务服务

大模型赋能政务服务的技术矛盾与对策

2024年12月19日14:52 | 来源:人民中科
小字号

原标题:大模型赋能政务服务的技术矛盾与对策

近年来,《国务院关于加强数字政府建设的指导意见》、《国务院办公厅关于依托全国一体化政务服务平台建立政务服务效能提升常态化工作机制的意见》等文件中,都提出要强化政务服务数字赋能,加强对人工智能等新技术的探索与运用。在《国务院关于进一步优化政务服务提升行政效能推动“高效办成一件事”的指导意见》中,更具体提出了“探索应用自然语言大模型等技术,提升线上智能客服的意图识别和精准回答能力,优化智能问答、智能搜索、智能导办等服务,更好引导企业和群众高效便利办事”的要求。

人工智能技术的快速发展为提升政务服务供给能力和行政效能提供了重要支撑,有助于缓解企业和群众办事过程中“难、慢、繁”等实际问题,进一步推动我国数字政府建设。然而,在人工智能赋能政务服务的过程中,也暴露出诸多技术矛盾,尤其在数据治理、算法设计、安全机制和用户体验方面,亟需厘清人工智能赋能政务服务过程中潜在的技术矛盾。

不同于传统“互联网+政务服务”,人工智能赋能政务服务以新一代大模型技术为代表,结合新公共服务理论、整体性治理理论、数字治理理论和协同治理理论,深度变革了政府治理模式;并非数字技术与行政权力的简单结合,而是一种深化。当前,政务数据治理过程复杂,智能算法的准确性和实战性仍需提升,生成内容的安全性难以保障,以及服务事项之间的关联协同不够,导致“标准不统一、业务不协同、服务不便捷”等问题频现,难以有效满足公众日益多样化、个性化的服务需求。

本文从“数据、算法、安全、评估”四个层面分析当前人工智能技术赋能政务服务应用存在的主要技术矛盾,探索智能政务服务的“精准办、协同办、安全办、满意办”的技术路径,进一步提升政务服务的智能化与便利化水平,推动政务服务新质生产力的跃升。

一、技术矛盾与对策

(一)数据层面:口语化用户表达与书面化政务语料之间的矛盾(精准办)

在政务服务领域,大量的政策文件、办事流程、法律法规等文件都是以标准化、规范化、书面化的语言来撰写。而在实际政务服务过程中,用户绝大多数都是以口语化、地域化、非规范化的方式来表达办事的诉求。因此,仅基于政务语料库训练的大模型构建智能问答、智能导办等系统很难快速精准地理解用户的真实意图,从而导致“政务语义鸿沟”问题。而面向政务服务的口语化样本数据获取困难、分布不均、高价值样本稀疏,也导致直接使用有限的口语数据训练模型时,效果难以达到预期。此外,政务数据的地域化和多样性特点,也导致了难以满足跨层级、跨地域的协同办事需求,制约了政务服务事项的流畅执行。为了有效缓解政务语义鸿沟问题,在技术层面上需要重点探索以下关键技术:

1.持续搜集和构建面向政务服务的多地域多语言多事项口语语料库,并以大模型与领域专家协同的方式构建面向政务服务的政务口语知识图谱。

2.借助网络问答社区构建大规模非政务领域口语问答语料库,结合大规模政务语料库,对模型进行预训练;并利用有限的政务服务口语语料进行微调和迁移学习,提升模型的政务口语理解能力,提高对用户口语化查询的理解和响应能力。

3.探索“数据-知识-模型”协同学习的模型训练的新范式和新方法,在有限样本条件下,利用有限高质量数据,在领域专家知识的引导下实现面向政务服务的口语化诉求到书面化表达之间的精准映射。

(二)算法层面:算法堆砌与综合需求之间的矛盾(协同办)

随着深度学习尤其是生成式人工智能技术的快速发展,人工智能在语音识别与生成、自然语言理解与生成、图像/视频理解与生成等领域都取得了突破性进展,各种性能优越的智能算法和技术百花齐放。这也导致很多智能政务服务系统在设计时,一味地追求多种新颖的智能技术的引入,在同一任务中冗余使用不同的人工智能算法,或者在不同任务中重复使用机理近似的算法,从而导致了大量人工智能算法的混乱堆砌,忽视了政务服务应用中的综合性需求的初衷。再加上各种算法或者智能体间协同不足,导致在解决政务服务中的多事项综合性服务时表现效果不佳,实战性能有待提升,难以实现协同自助式办理的服务目标。为了有效缓解这一技术矛盾,在技术层面需要从单智能体性能提升转向多智能体协同角度,主要包括:

1.政务治理的“条块”向“联动”转变。在政务服务中,传统的“条块”模式往往导致各部门孤立工作,难以实现高效协作。通过加强跨部门的“联动”机制,推动智能体之间的协同调度和资源共享,促进政务服务的整体协同效率的提升。

2.加强意图理解、任务拆解与多元信息交互能力,构建“总客服”式的一站式解决方案。对于用户的多元意图,通过多元信息交互方式利用大模型将用户的需求拆解为具体的、可执行的多个任务,分发给不同的智能体;对于单项复杂任务,通过将其转化为系统能够处理的多个具体步骤协同办理,来提升整体的效率和精准度。

3.多智能体协同与信息共享,通过消息传递、任务分配等机制,促进多个智能体之间的信息共享与协作,以实现多部门、跨区域协同,提高政务服务的整体效能。

总之,通过借助多智能体协同机制和灵活的技术架构,保证政务服务能够快速迭代和调整策略,从而实现“协同办”目标,推动政务服务更加高效、协同和智能化。

(三)安全层面:生成内容与安全治理之间的矛盾(安全办)

大模型极大地提升了政务服务中的意图理解、流程推理、以及内容生成的性能和效果。然而,基于黑盒学习的大模型生成的内容存在安全性和合规性风险,面临数据泄露、算法偏见和内容安全等挑战,一定程度上也影响了人工智能赋能政务服务的快速推进。一是技术创新与安全保障的矛盾。人工智能技术的快速发展带来了创新机会,但也引发了新的安全隐患。在政务服务中,确保技术创新与安全保障并行至关重要。二是自动化与人工干预的矛盾。人工智能技术提升了政务服务的自动化水平,但完全依赖模型的自动化能力可能导致安全风险难以被及时发现。然而人工干预必将大大降低自动化的水平和效率,两者之间的平衡至关重要。构建安全可信的政务服务大模型是推进智能政务服务安全性的有效技术手段。主要包括:

1.政务服务大模型与人类价值观对齐。通过对大模型进行价值观对齐,确保其生成的内容符合社会伦理标准与法律法规。

2.政务服务大模型生成内容的智能审核与预警。建立实时监控机制,对政务大模型生成的内容进行识别与预警,防止出现安全性和合规性问题。

3.政务大模型安全性评估。建立全面系统的政务服务大模型的安全评估体系,定期对政务大模型生成的功能安全和内容安全进行主客观结合的系统性评估。

总之,通过加强对技术创新与安全保障的平衡管理,以及推行自动化与人工干预相结合的治理模式,可以有效降低大模型应用中的安全风险,确保政务服务在提高效率的同时,保障生成内容安全,从而实现“安全办”的目标。

(四)评估层面:技术评估与用户体验之间的矛盾(满意办)

对智能政务服务系统进行系统性评估是判断系统建设质量和服务效果的重要技术手段。然而人工智能算法的评估往往都是以测试样本为基础,以定量指标为准则的技术性评估。这种评估方式往往不能完全满足以人为中心的政务服务效果的评估需求。主要体现在:一是静态评价标准与动态服务需求的矛盾。传统的人工智能系统评价标准通常是静态的,主要以准确率、召回率等定量指标为依据。然而,政务服务的需求具有高度的动态性,受政策变化、公众需求波动、地域文化等因素影响。二是技术评价与用户体验的矛盾,人工智能系统的技术表现不一定与用户的主观感受一致。例如,一个技术上高效的政务服务系统,可能由于交互设计不佳而导致用户体验不理想。为了进一步提升政务服务系统评估与用户体验的一致性,需要重点探索:

1.综合评估机制。结合定性与定量、主观与客观的评估方法,既能衡量系统的技术性能,也能考虑用户的主观体验,从而实现全面的评估效果。定量评估可以考虑准确率、召回率、F1等技术指标,而定性评价则通过用户反馈渠道了解他们使用过程中的体验和感受。

2.全过程无感评估机制。当前大多数的评估与真实用户使用过程是脱节的,往往是在实验室环境下对有限的测试用例进行评估,缺乏对完整使用过程中的用户体验评估。亟需探索利用大数据技术,对用户在政务服务平台办理事项的过程中每个环节页面停留时间、操作频率、鼠标状态等数据进行分析,挖掘潜在用户体验感,从而实现全程无感的评估过程。

3.交互式评估与反馈机制。通过整合多元化的用户参与渠道,如网络评议、社交媒体互动等,将民众的实时反馈纳入评估过程,确保政务服务的评估结果与公众的实际体验和需求相契合,从而实现政务服务的动态优化和持续改进。

通过这些技术探索,可以有效提升政务服务的评估机制和用户体验的一致性,推动政务服务的优化与改进,从而实现以“用户满意”为目标的政务服务。

二、总结

人工智能赋能政务服务的技术矛盾分析揭示了当前其在数据、算法、安全和评估多个层面上存在的技术挑战。通过探索政务语义对齐、多智能体协同、可信政务大模型、全过程综合评估等技术,可以有效促进人工智能技术与政务服务需求的深度融合,实现人工智能从数据、算法、应用、评估多层次深入赋能政务服务,推动政务服务的智能化转型,全面提升政府治理能力和公众服务水平。

(本文作者李兵系人民中科研究院院长,阮晓峰、吴方、原春锋、秦晓鲁系人民中科研究院研究员)

来源:人民中科

(责编:刘佳欣、夏迪)

分享让更多人看到

返回顶部