百家乐 Gemini 3.1：“0.1”小更新就压过敌手大迭代，Google卷的更猛了

发布日期：2026-02-25 11:40 点击次数：120

作家：王兆洋和他的 Kimi 2.5 Agent 集群

Gemini 3.1 来了

2026 年 2 月 19 日，Google 发布 Gemini 3.1 Pro。这是 Google 初次以 ".1" 行为版块增量发布 Gemini 模子——此前的版块迭代均为 0.5 递进（1.0 → 1.5 → 2.0 → 2.5 → 3.0）。

Google 将这次更新定位为 " 中枢推理才调的高出 "（a step forward in core reasoning），其技能基础是上周 Gemini 3 Deep Think 更新中引入的 " 中枢智能 "（core intelligence）架构。

在两项要道基准测试中，Gemini 3.1 Pro 呈现显耀性能进步。ARC-AGI-2 测试得分 77.1%，较 Gemini 3 Pro 的 31.1% 进步杰出一倍。在 Humanity's Last Exam 测试中，Gemini 3.1 Pro 得分 44.4%，高于 Gemini 3 Pro 的 37.5% 和 GPT-5.2 的 34.5%。

Artificial Analysis 独处评测阐述：全体智能维度 Gemini 3.1 Pro 以 57 分居首，Claude Opus 4.6 以 53 分位列第二；编码才调 Gemini 3.1 Pro 以 56 分排名第一；Agentic 任务方面 Claude Opus 4.6 以 68 分来源，Gemini 3.1 Pro 为 59 分。

探问渠谈已同步怒放。确立者可通过 Gemini API、Google AI Studio、Gemini CLI、Google Antigravity 及 Android Studio（预览版）调用；企业用户可使用 Vertex AI 和 Gemini Enterprise；平凡耗尽者可在 Gemini App 和 NotebookLM 中使用，其中 Pro 和 Ultra 订阅用户享有更高额度。

这次更新最"吓东谈主"的地方是，Google 一个"超等小"版块的迭代，达到了其他家模子大迭代的恶果。

虽然版块号粗率定，但这个信号背后，Google 这么处理版号计策的疗养——从 0.5 增量改为 0.1 增量——径直意味着 Google 将加速模子迭代节律，以更细粒度的表情推送才调更正。

{jz:field.toptypename/}

也等于，此前一段时辰若干还比较淡定的 Google，也要开卷了！

官方给出的惊艳案例：更智能，更好意思，更全面

在官方发布的演示中，四个案例展示了 Gemini 3.1 Pro 的代码生成才调。

第一个案例是将文体作风振荡为网站设想。系统以《呼啸山庄》为灵感，假定书中脚色是一位风景影相师，生成了一套齐全的个东谈主作品集网站。视觉上，网站罗致了与演义氛围相符的色斡旋排版，将文体田地径直映射为界面元素。

第二个案例是 3D 椋鸟群飞模拟。用户不错通过界面交互甩手鸟群的引导地方，鸟群的飞翔动态会及时生成对应的音景，声息随鸟群密度和引导现象变化。这是一个将视觉、交互和音频整合在一都的齐全演示。

第三个案例是海外空间站位置可视化。系统生成了一个 HTML 神情盘，集成了第三方 API 赢得的及时数据，在舆图上阐述空间站确现时位置和运行轨迹。这展示了模子处理外部数据接口的才调。

第四个案例是动画 SVG 生成。模子径直输出了可在网页中使用的动画 SVG 文献，这种矢量体式不错肆意缩放而不亏蚀画质，幸运飞艇手机app稳妥需要响应式设想的技俩。

这些案例的共同性情是：它们都是齐全的、可径直运行的代码产物，而非片断或伪代码。从文体作品到交互模拟，从数据可视化到图形生成，遮蔽了不同的利用场景。模子在这些任务中的发达怎么，读者不错自行判断。

Gemini 3.1 Pro 的技能迭代，体现了一条求实的旅途：在颠覆式重构不太会频频出现后，要追求对现存架构的精采化打磨。

架构层面不时了 MoE（搀杂行家）阶梯，100 万 token 的凹凸文窗口和 64，000 token 的输出上限看护不变。这个限制在现时的模子梯队中仍属头部，足以相沿长文档分析、代码库意会等场景。真碰劲得眷注的，是推理机制的重构。

三层念念考样子（Low/Medium/High）的引入，推行上是对 " 规画 - 质料 - 资本 " 三角算计的显式化措置。Low 样子追求响应速率，稳妥高并发场景；High 样子则调用齐全推理才调，处理复杂问题可能需要数分钟——这种设想让用户能够凭证任务难度主动权衡资本，百家乐官网而非被迫接管归并计价。Medium 层级的加入填补了此前的空缺，为泛泛任务提供了更经济的中间选项。

同期，Deep Think 技能也出现了"下放"，上周 Gemini 3 Deep Think 在 ARC-AGI-2 测试中取得 84.6% 得益所依赖的 " 并行念念考技能 "，已被整合进基础模子。这意味着模子能够同期探索多条解题旅途，再通过里面评估筛选最优解。与此同期，正本用于 Flash 模子的强化学习技能也被挪动至 Pro 版块，这种技能栈的横向买通，比单纯的参数堆叠更有价值。

幻觉甩手方面的高出也很要道。AA-Omniscience Index 从 13 分跃升至 30 分，在主流模子中排名第一。这一主义量度的是模子对自身常识领域的阐述才调——知谈 " 不知谈什么 "，比知谈 " 知谈什么 " 更难，也更进军。

总体而言，Gemini 3.1 Pro 的升级逻辑了了：不追求单技俩的的惊艳，而是在可控资本下，系统性地进步模子的可用性和可靠性。

榜单以外，更进军是 Google 也初始卷了

Gemini 3.1 Pro 发布后，技能社区的声息呈现出彰着的分化。

乐不雅派将眼神投向了数据。ARC-AGI-2 基准 77.1% 的得分被视为实质性冲破——这不仅是上一代 31.1% 的两倍以上，也意味着模子在处理全新逻辑样子时的才调跃升。

幻觉抗性主义（AA-Omniscience Index）从 Gemini 3 Pro 的 13 跃升至 30，远超 Claude Opus 4.6 的 11，这一高出被确立者群体频繁说起。三层念念考样子的设想也受到好评——让用户凭证任务复杂度自主遴荐 " 快速 / 深度 / 深度 +" 样子，被合计是对甩手权的合理让渡。

但质疑声相通值得倾听。Gartner 分析师 William McKeon-White 的评价代表了一种审慎立场：" 这是好的捏续高出，但莫得什么根人性的游戏轨则改造者。" 华盛顿大学培植 Chirag Shah 则建议了更深层的问题：更好的推理才调照实是处理复杂任务的必要要求，但并非充分要求—— " 更而且，' 复杂 ' 自己的界说就不解确。"LMArena 的盲测数据也提供了另一种视角：3.1 Pro 比拟 Gemini 3 Pro 的进步幅度有限，在扩张文本和代码任务上仍落伍于 Claude。

中立不雅察者更眷注宏不雅趋势。AI 模子名次榜被描摹为 " 抢椅子游戏 " —— Claude、Gemini、GPT 轮替登顶，每次来源周期独一数周。发布节律的密集相通引东谈主瞩目：Anthropic Sonnet 4.6 于 2 月 17 日发布，Google Gemini 3.1 Pro 紧随后来于 2 月 19 日登场。一个被反复说起的不雅察是：基准分数与真是用户体验之间存在落差，名次榜上的来源不等于推行使命流中的上风。

其实，比拟于在榜单上几个少许点的进步，更进军的是 Google 我方计策的愈加激进化。

Gemini 3.1 Pro 的发布，来源秀雅着 Google 产物计策的奥秘转向。初次罗致 ".1" 版块号，意味着从昔时追求 " 大版块震憾 " 的发布节律，转向更濒临工程推行的捏续迭代样子。

这种调遣自己评释：AI 竞赛已参加长跑阶段，单次爆发的窗口期正在收窄。在高端推理市集，Google 终于拿出了与 GPT-5.2 和 Claude 正面交锋的产物，而其确凿的护城河好像不在于模子自己，而在于 Cloud 和 Workspace 组成的企业基础行径——这是 OpenAI 和 Anthropic 短期内难以复制的。

从行业视角看，推理才调正在成为模子竞争的新高地。Gemini 3.1 Pro 与 Anthropic 的发布时辰停止仅两天，这种以天为单元的跟进速率，反应出面部厂商的技能差距正在收窄。更具信号意旨的是订价计策：最高性能模子的价钱反而更低，这意味着价钱战已从 " 性价比竞争 " 升级为 " 性能溢价消散 " 的新阶段。

Gemini 3.1 Pro 订价为 $4.50/ 百万 token（搀杂价钱），低于 GPT-5.2 的 $4.80、Claude Sonnet 4.6 的 $6 和 Claude Opus 4.6 的 $10。API 订价分档：≤ 200K tokens 时输入 $2、输出 $12；>200K tokens 时输入 $4、输出 $18。

免用度户可径直在 Gemini Web UI 使用 Gemini 3.1 Pro，无需订阅 Gemini Advanced。

上一篇：ag百家乐app 比亚迪RACCO内饰官图发布将至今夏在日本阛阓发布下一篇：ag百家乐北京铁警春节假期查获各样危境品十万余起

百家乐 Gemini 3.1：“0.1”小更新就压过敌手大迭代，Google卷的更猛了

热点资讯

推荐资讯