谷歌领先OpenAI，推出金牌级AI推理模型公测版

访客 2025-12-05 14:13:42 36 抢沙发

默认

谷歌领先OpenAI，推出公测版“数学奥赛金牌级”AI推理模型，该模型展现出强大的数学问题解决能力，堪比顶尖数学奥林匹克竞赛选手的水平，谷歌的这一创新技术将重塑人工智能领域，引领AI在逻辑推理方面的新突破，摘要字数控制在100-200字以内。

12月5日消息，科技媒体NeoWin今天（12月5日）发布博文，报道称谷歌面向GeminiUltra订阅（月费249.99美元）用户，推出了Gemini3DeepThink（深度思考）模式。相比较标准版Gemini3Pro模型，DeepThink模式调用了更多计算资源，并采用了全新技术架构。该功能目前已完全集成至GeminiApp中，GoogleAIUltra订阅用户即日起可通过在提示栏中选择“DeepThink”与Gemini3Pro模型搭配使用。
谷歌官方数据显示，DeepThink模式在处理复杂数学、科学及逻辑问题时的推理能力实现了显著飞跃。援引博文介绍，在被誉为“业内最难AI基准测试之一”的Humanity’sLastExam中，该模式取得了41%的高分，确立了新的行业标杆。同时，在GPQADiamond科学知识测试中，其得分高达93.8%；在包含代码执行的ARC-AGI-2严苛测试中，也拿下了45.1%的成绩，均展现出业内顶尖（State-of-the-art）的性能水平。
DeepThink模式之所以能取得如此突破，核心在于运用了先进的并行推理技术（AdvancedParallelReasoning），让模型能够同时探索多种假设路径以寻找最优解。值得注意的是，该模型的变体此前已在国际数学奥林匹克竞赛（IMO）和国际大学生程序设计竞赛（ICPC）世界总决赛中达到了“金牌标准”。特别是在IMO场景下，模型需在无法访问互联网或工具的情况下，于两个4.5小时的考试时段内完成解题并撰写自然语言证明。谷歌此次公测被视为对竞争对手的有力回击。OpenAI曾在今年7月声称其实验性推理大模型达到了数学奥赛金牌水平，但截至目前该模型仍未向公众开放。随着谷歌率先将达到IMO金牌标准的模型推向大众市场，行业普遍预测，这一举动或将迫使OpenAI加快同类产品的发布节奏，大模型领域的“推理能力之战”将进一步升级。

标签：模型模式