雅加达 - Anthropic发布了Claude Sonnet 5,这是一款中档AI模型,旨在以更低的成本执行更独立的任务。这次发布强调了AI竞争的新方向。不再是谁最聪明,而是谁最有效率,最稳定地运行AI代理。

据TechCrunch 7月1日星期三报道,Claude Sonnet 5已成为免费和Pro计划用户的默认模型,并从周二开始提供给所有客户。

该模型被定位为Sonnet 4.6的更强大的版本。Anthropic称Sonnet 5能够计划,使用浏览器和终端等工具,并在几个月前仍然需要更大,更昂贵的模型的水平上自主工作。

在人工智能领域,这种能力通常被称为代理人工智能,即人工智能不仅可以回答问题,还可以更独立地执行一系列任务。

价格是Anthropic的主要武器。截至8月31日,Sonnet 5的价格为每百万输入令牌2美元,每百万输出令牌10美元。之后,费率上升到每百万输入令牌3美元,每百万输出令牌15美元。

令牌是用于计算AI模型使用费用的文本块单位。处理或生成的文本越多,成本就越高。

这一价格使Sonnet 5比OpenAI的Opus 4.8、GPT-5.5和Google的Gemini 3.1 Pro便宜。然而,该模型仍然比Gemini 3.5 Flash更昂贵。

Anthropic声称Sonnet 5的性能接近Opus 4.8,但成本更低。在代理编程基准测试中,Sonnet 5获得了63.2%的得分。这个数字低于Opus 4.8的69.2%,但高于Sonnet 4.6的58.1%。

在基于知识的工作基准上,Sonnet 5甚至略胜于Opus 4.8,后者以其强大的深度研究和复杂决策而闻名。

“Opus 4.8仍然是更高精度的选择,但Sonnet 5为开发人员提供了一个更便宜的选择,其质量比以前要好得多,”Anthropic写道。

根据TechCrunch的说法,Anthropic的举措与OpenAI和Google的方向一致。OpenAI刚刚发布了GPT-5.6 Sol的预览版,而Google此前推出了Gemini 3.5 Flash,作为更适合代理任务的模型。

在安全性方面,Sonnet 5据称优于其前身。该模型被认为更能抵御恶意请求,更能抵抗提示注入攻击,并且更少幻觉或过于服从用户的意愿。

紧急注射是一种潜入命令的尝试,以便AI忽略安全规则。

尽管如此,Sonnet 5在不一致行为方面仍未达到Opus 4.8和Claude Mythos Preview的水平。Anthropic还表示,Sonnet 5执行危险网络安全任务的能力远低于当前Opus模型。

Sonnet 5 的发布表明,AI模型的竞争现在更多地集中在成本和可靠性上。对于开发人员来说,便宜但功能强大的模型可以成为在不牺牲预算的情况下运行日常自动化的重要选择。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Add VOI as a Preferred Source
Follow VOI news updates across Google.
+