AI猜测2026年世界杯,准确性开始测试
雅加达 - 2026年世界杯不仅是球员和教练的舞台。在球场外,中国的一些人工智能模型也在竞相猜测比赛结果。
根据6月16日星期二引用的中国日报的报道,一些大型语言模型(LLM),如Qwen,DeepSeek,Kimi和MiniMax,推出了世界杯预测功能。这场比赛是AI读取数据和分析比赛机会的能力测试场。
第23届世界杯由48支球队参加,在美国,加拿大和墨西哥举行。比赛于周四开幕,并持续到7月19日。
中国人工智能协会理事郭涛表示,世界杯为AI公司提供了一个难得的机会,向广大公众展示他们的计算和分析能力。
“作为世界上观看次数最多的体育赛事之一,世界杯为AI公司提供了一个难得的机会,向更广泛的受众展示LLM的计算能力和分析能力,”中国日报援引郭的话说。
一些平台正在制作互动活动。例如,Moonshot AI的Kimi推出了1万亿令牌的奖池。如果用户成功猜出比赛的获胜者和最终冠军,他们可以分享奖品。
令牌是AI模型处理的最小数据单元。同时,阿里巴巴集团旗下的Qwen提供了一个专门的助手,用于预测比赛和人类预测挑战与AI。
然而,世界杯也展示了人工智能能力的局限性。在周日巴西和摩洛哥之间的C组比赛之前,一些大型LLM根据历史数据和统计指标支持巴西。结果,比赛以1-1的平局结束。
郭说,人工智能确实能够读取旧数据和统计模型。然而,运动仍然很难预测,因为它受到许多现实世界因素的影响,这些因素不容易用静态模型来衡量。
这种局限性在上周的BAAI会议上也得到了北京人工智能研究院院长王中元(Wang Zhongyuan)的强调。
王说,LLM越来越能够解决数字世界的问题。然而,物理世界中的许多问题仍然难以触及。因此,AI发展的下一个方向将从“预测下一个令牌”转向“预测下一个物理状态”。
尽管其准确性还不完美,但科技公司仍然进入体育预测。郭认为,这一举措与AI行业的激烈竞争密不可分。
“随着LLM市场的竞争日益激烈,技术差异化变得越来越困难。公司急于寻找新的渠道来区分自己与竞争对手,“郭说。
他说,市场不再只看AI模型的大小。更重要的是,模型是否可以提供真正的服务并帮助解决用户的麻烦。
上海财经大学教授胡彦平表示,LLM和AI代理开始从对话系统转向能够执行任务的系统。它的发展也导致了持续的学习和更广泛的现实世界理解。
“探索性项目,如世界杯比赛预测,可以帮助加速这一演变,”胡说。
胡说,未来的AI代理需要在感知、交互、决策和协作上建立的能力。