Google声称Gemini 3.5 Flash可以像人类团队一样“思考”

雅加达 - 谷歌在2026年Google I/O大会上发布了Gemini 3.5 Flash,再次提高了全球人工智能竞争的标准。这款最新的AI模型被称为谷歌有史以来最强大的“Flash”版本,在编码,推理,多模态理解和长期上下文处理方面的改进很大。

以前,快速AI模型与简短和肤浅的答案相同,Gemini 3.5 Flash试图扭转这一范式。谷歌声称,这种AI能够处理类似于人类工作方式的复杂请求:将大问题分解为多个分析路径,深入理解上下文,然后以自然反应执行。

一些技术记者进行的独立测试表明,Gemini 3.5 Flash不仅速度快,而且在思考上也越来越“有组织”。结果让许多观察家认为,谷歌开始认真追求生成性AI的统治地位,而OpenAI,Anthropic和微软一直在激烈争夺。

最有趣的测试之一是,当Gemini被要求根据复杂的航空航天技术报告制作关于太空垃圾的交互式模拟时。人工智能不是简单地总结数据,而是能够生成长代码来构建完整的可视化模拟,显示卫星碎片和轨道交通如何随着时间的推移而增加。

令人感兴趣的不仅是视觉效果,而且是AI解释其设计背后的原因的方式。Gemini被认为理解用户需要理解太空垃圾是危险的“原因”,而不仅仅是看到统计数字。

在另一项测试中,Gemini 3.5 Flash被要求在美国哈德逊河谷和卡茨基尔地区制定为期四天的旅行计划。人工智能不仅编制了常规行程,还考虑了旅行节奏,沿途美食的位置,以及如果下雨则备用选项。

这种方法展示了“代理计划”的能力,即当AI不仅回应命令,而且开始理解请求背后的情感和逻辑目标。

过程推理能力还通过要求以专业图书管理员的手动方式创建手动装订期刊指南来测试。Gemini被认为能够在技术指令和初学者友好语言之间保持平衡。

AI甚至为学习过程提供了心理方法,称胶水干燥时间不是“空闲时间”,而是制作书籍过程的重要组成部分。

在视觉推理测试中,Gemini被要求查看一张房间乱七八糟的照片,然后制定一个在25分钟内清理房间的策略。人工智能并没有要求用户一次性清理所有东西,而是优先考虑最容易看到的眼睛的区域,以便视觉效果更快。

这种策略被认为表明AI开始理解人类效率的概念,而不仅仅是机械逻辑。

但最荒谬也最有趣的一次测试来自“三只企鹅穿着风衣”的情景。双子座被要求调查一位自称是普通人的潜在室友,但怀疑他实际上是穿着大衣的三只企鹅。

AI的反应实际上展示了Gemini 3.5 Flash的主要功能之一的并行推理能力。AI将调查分为几个独立的“子代理”,从行为分析,社会模式到环境证据。

每个代理都像一个真正的调查小组一样并行工作,然后将结果合并为最终结论。这种方法被认为比上一代人工智能模型更先进,后者倾向于线性处理问题。

这种现象展示了现代AI发展的新的方向。语言模型不再仅仅是回答问题的聊天机器人,而是开始成为能够同时管理许多上下文的“思维系统”。

尽管如此,这一发展也引发了新的担忧。人工智能在理解人类行为方面变得越智能,系统才能以最佳方式运行,就越需要访问用户的个人数据。

在全球人工智能竞赛日益激烈的背景下,Gemini 3.5 Flash表明谷歌在人工智能主导权的斗争中还没有投降。事实上,许多分析师认为谷歌现在开始发现自己的AI身份:像Flash一样快,但开始像一个真正的团队一样思考。

关注VOI Whatsapp频道