GPT-5.2 在简单的测试中无法击败双子座 3

12月11日，OpenAI发布了GPT-5.2更新，距离上一版本发布仅一个月。这个不那么令人满意的发布日期被认为是匆忙的。

在PC Mag进行的测试中，GPT-5.2被称之为“不成熟”，因为它在时间之前被拉出来。这种匆忙的推出被认为是OpenAI故意进行的，以平衡Gemini 3模型的支配地位，该模型也是Google刚刚发布的。

这种“害怕失去竞争”的怀疑不仅源于其相邻的发行日期。如果在标准测试中进行比较，GPT-5.2在许多方面看起来不如Gemini 3。

尽管OpenAI声称其最新的人工智能模型在制作演示文稿和识别图像方面更胜一筹，但GPT-5.2的工作成果与GPT-5.1非常相似。这使得GPT-5.2的改进对用户来说并不那么明显。

在测试一个包含视频游戏数据的电子表格时，GPT-5.2确实比它的前身更准确。然而，早期版本的轻微错误仍然可以通过正常的对话快速修复，因此此更新并不那么明显。

另一方面，Gemini 3显示出更明显的改进。Gemini 3 Flash现在在识别复杂图像组件的细节方面更加准确。此外，与GPT-5.2相比，它的创造性写作能力的作品更加独特。

OpenAI和谷歌之间的激烈竞争确实使消费者受益，因为技术创新变得更快。然而，OpenAI的这种非常匆忙的策略可能会降低他们向公众发布的产品质量标准。