聚焦国际人工智能学术会议：提升系统“可信度”与“可控性”成业界紧迫课题

随着人工智能技术的广泛应用，其可靠性问题日益凸显，成为学术界和产业界关注的焦点。

在1月下旬于新加坡召开的第40届人工智能促进协会年会上，来自全球的研究人员围绕如何提升人工智能系统的准确性和可信度展开了深入讨论。

当前人工智能系统存在的主要问题表现为多个方面。

一些聊天机器人存在答非所问、逻辑混乱的现象，更为严重的是，它们有时会以确定的语气生成虚假信息，这对用户决策造成了直接威胁。

这些表面看似随机的错误，实际上反映了系统设计层面的深层缺陷。

置信度值校准不当是导致人工智能不可靠的重要原因之一。

来自意大利米兰-比可卡大学的研究团队在题为"盲目自信的陷阱"的研究中发现，人工智能系统的置信度表现与实际准确率之间存在严重偏差。

实验中，参与者在人工智能协助下完成逻辑推理任务，结果显示了一个悖论现象：当人工智能表现出高度自信时，用户更倾向于接受其建议，但这些建议往往是错误的；反之，当人工智能表现出犹豫时，用户反而会拒绝正确的建议。

研究成员卡泰丽娜·弗雷戈西指出，许多人工智能系统的置信度值未被正确校准，向使用者传递了误导性信号，这是造成决策失误的关键因素。

除置信度问题外，人工智能在长时间交互过程中出现的"认知疲劳"现象也值得重视。

来自印度和美国的联合研究团队通过实验发现，随着对话时间延长，人工智能模型会逐渐"走神"，表现为偏离原始指令、重复输出内容，甚至以自信的口吻生成不可靠信息。

美国南卡罗来纳大学人工智能研究所的研究成员里朱·玛尔瓦强调，这种现象并非个案，而是一种系统性效应。

研究团队通过追踪注意力衰减等关键指标，成功将人工智能的"疲劳"状态可视化，并开发了实时干预系统。

当系统检测到人工智能开始偏离指令时，会自动重新输入原始指令，将对话拉回正确轨道。

这一发现表明，"认知疲劳"是可以被发现、预测和干预的。

人工智能可靠性问题的影响已经超越学术范畴。

随着智能体技术的发展，从单一聊天机器人到能够自主完成任务的智能体，再到多个智能体组成的协作网络，人工智能系统的应用范围不断扩大。

然而，完全放手让智能体自主运作远比预想复杂。

当前智能体的行动边界极为宽泛，它们能够编写代码、执行计算机操作，这意味着任何系统缺陷都可能被放大。

面对这些挑战，国际研究界提出了新的解决思路。

美国微软人工智能前沿实验室主任埃杰·卡马尔认为，应当将研发重点从追求智能体的自主性转向人类与智能体的协作模式。

建立智能体与人类之间的透明交互机制，使人类能够有效监督和引导人工智能的行为，这具有现实紧迫性。

微软首席科学官埃里克·霍维茨进一步指出，当前人工智能系统的种种不确定性，与人类对其内部运作机制的理解不足密切相关。

因此，提升人工智能的可解释性和透明度，成为改进系统可靠性的重要前提。

从技术层面看，未来的改进方向包括优化置信度校准算法、开发更有效的疲劳检测与干预机制、增强模型的可解释性等。

同时，建立健全的人机协作框架，确保人类在关键决策中保持主导权，也是必然趋势。

当人工智能从实验室走向现实应用，其可靠性已不仅是技术命题，更是关乎社会信任的基础工程。

正如本届会议主题所揭示的，在追求性能突破的同时，更需要建立技术与人性的平衡点。

未来十年，谁能率先构建可信可控的人机协同生态，谁就将掌握智能时代的发展主动权。