谷歌全新AI模型Gemini 3发布:宣称”全球最智能模型”
当地时间11月18日,Alphabet旗下的谷歌正式推出Gemini 3系列模型。Gemini 3 Pro已于即日起在Gemini应用、Search AI Mode、AI Studio、Vertex AI以及全新代理式开发平台Google Antigravity中开放预览。性能全面跃升:多项前沿基准测试夺冠

谷歌表示,Gemini 3 Pro在推理与多模态能力上实现了“前所未有的深度与细腻度”,并在几乎所有主流AI基准上全面超越前代2.5 Pro。它以1501 Elo(Elo评分体系,用于衡量模型在盲测对战中的相对实力)的突破性成绩登顶LMArena榜单,在“人类终极考试”(Humanity’s Last Exam)中取得37.5%(无工具)成绩,并在高难度科学推理测试GPQA Diamond中拿下91.9%的顶级表现。
在数学方面,Gemini 3 Pro再次刷新前沿模型记录,以23.4%的成绩夺得MathArena Apex新高,显示出其在结构化逻辑思维与复杂计算上的强势提升。
作为一款完全多模态的基础模型,Gemini 3 Pro在视觉和视频理解同样创下新纪录:多模态大考MMMU-Pro得分81%,视频推理基准Video-MMMU得分87.6%,均创当前SOTA。在强调事实一致性的SimpleQA Verified中,它也以72.1%的成绩领先同类模型。
谷歌称,这些能力意味着Gemini 3 Pro可以在科学、数学、工程等高复杂度任务中提供更可靠的分析与建议,并在日常交互中给出“更直接、更有洞察力”的回应。
除了在多项基准测试中刷新纪录外,Gemini 3 Pro也为每一次交互带来了全新的深度与细腻度。谷歌表示,新模型的回答更加聪明、简洁且直截了当,避免陈词滥调和无谓的恭维,更倾向于提供具有洞见的结论与判断——“告诉你需要知道的,而不是你想听的”。
这一代模型更像一个真正的思考伙伴。它能够帮助用户以全新的方式理解信息和表达观点,例如将晦涩难懂的科学概念转译为高保真的可视化代码,或在创作、规划等场景中进行更具启发性的头脑风暴。谷歌强调,这种“深度交互体验”是Gemini 3 Pro在推理与多模态能力跃升后的自然结果,使其在专业分析与日常创意任务中都表现得更加可靠而富有洞察力。
Gemini 3 Deep Think:推理能力进一步跃升

谷歌同步预览了增强版Gemini 3 Deep Think。该模型进一步突破了智能边界,在Gemini 3的推理和多模态理解能力上实现了阶跃式提升,能够帮助用户解决更为复杂的问题。
Gemini 3 Deep Think在极难测试中再次刷新记录:Humanity’s Last Exam提升至41%(无工具),GPQA Diamond提升至93.8%,并在核心AGI测试ARC-AGI-2(带代码执行、官方验证)中获得前所未有的45.1%。谷歌称该模式代表其在自主推理与新颖任务解决能力上的重大突破。
Gemini 3系列模型的发布规划
谷歌表示,Gemini 3的推出只是新一代模型周期的起点。自发布起,Gemini 3已开始在不同产品与平台中分阶段上线:
·面向普通用户:Gemini应用已全面接入新模型;Google AI Pro与Ultra用户也可在谷歌搜索的AI Mode中直接体验。
·面向开发者:Gemini 3已同步登陆Gemini API、AI Studio,以及全新的智能体开发平台Google Antigravity,并可通过Gemini CLI使用。
·面向企业客户:Vertex AI与Gemini Enterprise现已支持Gemini 3部署,覆盖更多企业级应用场景。
对于高阶版本Gemini 3 Deep Think,谷歌强调正在进行额外的安全审查,并收集来自独立安全团队的反馈,预计将在未来几周向Google AI Ultra用户开放。
谷歌同时透露,未来将陆续推出更多Gemini 3系列模型,以扩展其在不同场景下的能力与覆盖范围。“我们期待看到用户使用 Gemini 在学习、构建与规划中解锁更多可能性。”
演示环节:多模态推理、代码生成与视觉理解的全面展示
在发布现场,谷歌展示了一系列基于Gemini 3的实时演示,覆盖学习、构建与视觉分析等核心场景,重点体现其在多模态理解、跨介质推理以及端到端代码生成方面的跃升能力。

Gemini 3生成的生成带有封面与章节导航的数字化家庭食谱电子书
在学习场景的展示中,Gemini 3通过多模态处理能力展现出强大的信息整合能力。谷歌工程师向模型上传了一张带有折痕与油渍的手写家族食谱照片。Gemini 3能够准确识别并翻译不同语言的笔迹,再将内容自动排版,生成带有封面与章节导航的数字化家庭食谱电子书。

Gemini 3生成的RNA聚合酶结构与运动流程等交互式动画截图
随后,演示切换到科研学习场景:面对超40页的PDF学术论文与一段长时教学视频,Gemini 3一次性提取核心理论,生成变量关系图,并编写可执行的可视化代码,实时绘制出如RNA聚合酶结构与运动流程等交互式动画,同时自动产出可点击的学习闪卡与结构化学习指南。
