苹果 揭露了处理人工智能幻觉和建立更人性化对话的秘密策略

雅加达 - 在人工智能(AI)竞赛中,OpenAI,谷歌和Meta占主导地位之际,苹果无声地做出了可能改变游戏的大幅突破。通过最新的一系列科学研究,苹果研究人员宣布了八本重要论文,重点是了解人工智能错误,更深入的个性化以及如何减少大语言模型(LLM)的幻觉化。

此举是一个强烈的信号,表明苹果不仅希望成为人工智能界的被动参与者,还希望创建一个更道德、更人性化、更可靠的人工智能生态系统——当然,与未来的苹果产品密切融合。

在其最新的论文之一中,苹果推出了大规模多任务代理理解(MMAU),这是一个全面的评估系统,用于在五个重要领域衡量LLM的能力:理解,判断,规划,解决问题和自我纠正能力。

MMAU 包括20项任务,包括3000多个独特 prompt - 提供更清晰、更标准化的基准,而苹果表示以前的方法仍然令人困惑且不足以识别人工智能故障的根源。

“目标是通过了解错误来自何处来来提高人工智能的能力,”苹果研究人员在科内尔科学档案馆发表的一篇文章中写道。

到目前为止,由于长期对话记忆有限,人工智能很难亲自理解用户的对话。为了应对这一挑战,苹果开发了一个名为“大语言模型(PLUM)中的学习用户对话管”的系统。

PLUM不仅仅是记住用户偏好微不足道,而是从之前的互动中提取问题和答案并将其注入系统,从而创造了对用户个人的“更近”和相关的AI。

该技术为苹果的AI提供了大门,不仅呈现先进,而且呈现人性化和一致的对话体验。

Apple 使用外部验证

AI的另一个主要问题是,即使它通常包含错误或偏见,模型如何传达答案,似乎绝对正确。

在题为“Can External Validation Tools Improve Annotation Quality for LLM-as-a-Judge?,一份题为“Can External Validation Tools Improve Annotation Quality for LLM-as-a-a-Judge?,”的文章中,苹果建议使用外部验证工具,如网络搜索和代码执行,以重新检查人工智能答案的真实性。

虽然结果尚未100%准确,但这种方法已被证明经常会提高答案的质量,并且可以成为更透明、更可信的人工智能的重要基础。

苹果不仅出版了论文,还发布了内部研讨会的八个视频演示,名为“人为集中机器学习2024”。这些视频审查了AI界面,UI理解和人工智能在日常使用的背景下的人格化。

此外,苹果将于2025年7月27日至8月1日在维也纳举行的计算语言学会(ACL)年度大会上表现出色。在那里,苹果将展示和赞助18个研讨会,以更人性和负责任的AI主题为主题。

到目前为止,人们认为苹果在AI竞赛中落后,因为它比竞争对手更少。然而,一系列的论文和创新证明,苹果实际上正在以深入,谨慎和用户方的方式构建AI。

以道德、可靠性和个性化为重点的方法,苹果似乎正在为人工智能的突破做准备,这些突破不仅将在市场上竞争,而且可以重塑行业标准。

「苹果希望 AI 更具信任性,更好地了解人性,不受致命的错误。不仅聪明,而且聪明,“苹果人为中心的机器智能总监Jeffrey P. Bigham说。

有了这一切,现在的问题不再是“苹果准备好进入AI吗?”而是更具体地说:“世界准备好欢迎Apple版本的AI吗?”