谷歌领先OpenAI,推出金牌级AI推理模型公测版
谷歌领先OpenAI,推出公测版“数学奥赛金牌级”AI推理模型,该模型展现出强大的数学问题解决能力,堪比顶尖数学奥林匹克竞赛选手的水平,谷歌的这一创新技术将重塑人工智能领域,引领AI在逻辑推理方面的新突破,摘要字数控制在100-200字以内。12月5日消息,科技媒体NeoWin今天(12月5日)发布博文,报道称谷歌面向GeminiUltra订阅(月费249.99美元)用户,推出了Gemini3DeepThink(深度思考)模式。相比较标准版Gemini3Pro模型,DeepThink模式调用了更多计算资源,并采用了全新技术架构。该功能目前已完全集成至GeminiApp中,GoogleAIUltra订阅用户即日起可通过在提示栏中选择“DeepThink”与Gemini3Pro模型搭配使用。
谷歌官方数据显示,DeepThink模式在处理复杂数学、科学及逻辑问题时的推理能力实现了显著飞跃。援引博文介绍,在被誉为“业内最难AI基准测试之一”的Humanity’sLastExam中,该模式取得了41%的高分,确立了新的行业标杆。同时,在GPQADiamond科学知识测试中,其得分高达93.8%;在包含代码执行的ARC-AGI-2严苛测试中,也拿下了45.1%的成绩,均展现出业内顶尖(State-of-the-art)的性能水平。
DeepThink模式之所以能取得如此突破,核心在于运用了先进的并行推理技术(AdvancedParallelReasoning),让模型能够同时探索多种假设路径以寻找最优解。值得注意的是,该模型的变体此前已在国际数学奥林匹克竞赛(IMO)和国际大学生程序设计竞赛(ICPC)世界总决赛中达到了“金牌标准”。特别是在IMO场景下,模型需在无法访问互联网或工具的情况下,于两个4.5小时的考试时段内完成解题并撰写自然语言证明。谷歌此次公测被视为对竞争对手的有力回击。OpenAI曾在今年7月声称其实验性推理大模型达到了数学奥赛金牌水平,但截至目前该模型仍未向公众开放。随着谷歌率先将达到IMO金牌标准的模型推向大众市场,行业普遍预测,这一举动或将迫使OpenAI加快同类产品的发布节奏,大模型领域的“推理能力之战”将进一步升级。
文章版权及转载声明
作者:访客本文地址:https://shucuo.cn/post/5410.html发布于 2025-12-05 14:13:42
文章转载或复制请以超链接形式并注明出处数错网



还没有评论,来说两句吧...