Gemini 3.1 Pro 96.96 分微弱领先，Claude Opus 4.7 仅差 0.13

张

张建站

2026/6/13 7:24:46

10分钟阅读

Gemini 3.1 Pro 96.96 分微弱领先，Claude Opus 4.7 仅差 0.13

#Gemini 3.1 Pro #材料约束 #Smoke 轻量评测 #代码执行差距 #模型稳定性Smoke 今日快测结果显示Gemini 3.1 Pro 以 96.96 分的 core_overall 位居第一Claude Opus 4.7 以 96.83 分紧随其后两者仅差 0.13 分。顶尖模型的极致接近两位第一、第二名在代码执行维度均拿到 97.5 分材料约束上 Gemini 3.1 Pro 96.3 分Claude Opus 4.7 则为 96 分。公式 0.55×执行 0.45×约束的权重设计让微小的约束差异直接决定了最终排名。如此微小的差距说明顶级模型在这两个核心维度上已进入“同水平竞争”阶段。GPT-5.5 的明显短板GPT-5.5 执行 97 分排第三却因材料约束仅 86.3 分最终跌至第五。约束维度落后近 10 分反映其在引用原始材料、避免幻觉方面的控制仍弱于 Gemini 和 Claude。对比之下Grok 4 执行 96 分、约束 93.8 分整体 95.01 分保持了相对均衡。中腰部模型的执行瓶颈DeepSeek V4 Pro、Qwen3 Max、Gemini 2.5 Pro 执行分数均不超过 65 分与头部差距超过 30 分。Qwen3 Max 约束 94.8 分甚至高于 GPT-5.5却因执行 55 分被大幅拉开。这再次印证当前中文模型在代码执行任务上仍存在系统性短板。需要说明的是今日为 v6.3 评分口径的首次运行与此前成绩不构成可比基线环比变化将在后续同口径评测中恢复呈现。当执行和约束都接近满分时0.13 分的差距已不再是偶然而是模型对材料边界控制的真实差异。数据来源赢政指数 (YZ Index) | Run #165 | 查看原始数据

告别手写FFI！用flutter_rust_bridge 1.78.0在Windows上5分钟搞定Flutter调用Rust

5分钟实现Flutter与Rust的无缝交互：flutter_rust_bridge实战指南在跨平台应用开发中，Flutter因其出色的UI构建能力广受欢迎，而Rust凭借卓越的性能和内存安全性成为系统级编程的新宠。当需要将两者结合时，传统FFI（外部函…...

2026/6/13 7:21:52 阅读更多 →

GSE高级宏编译器：魔兽世界智能技能序列的终极解决方案

GSE高级宏编译器：魔兽世界智能技能序列的终极解决方案【免费下载链接】GSE-Advanced-Macro-Compiler GSE is an alternative advanced macro editor and engine for World of Warcraft. 项目地址: https://gitcode.com/gh_mirrors/gs/GSE-Advanced-Macro-Compil…...

2026/6/13 7:02:51 阅读更多 →

TwinCAT3工程师视角：如何高效调试EtherCAT从站的PDO与SDO数据

TwinCAT3工程师实战：EtherCAT从站PDO与SDO调试全指南在工业自动化领域，EtherCAT以其卓越的实时性能和灵活的拓扑结构成为主流现场总线协议。作为TwinCAT3工程师，我们经常需要面对各种从站设备的调试挑战——特别是当PDO数据异常或SDO参数配置…...

2026/6/13 7:02:29 阅读更多 →

如何快速搭建本地图片搜索引擎：3步实现千万级图片秒级检索

如何快速搭建本地图片搜索引擎：3步实现千万级图片秒级检索【免费下载链接】ImageSearch 基于.NET10的本地硬盘千万级图库以图搜图案例Demo和图片exif信息移除小工具分享项目地址: https://gitcode.com/gh_mirrors/im/ImageSearch 想要在数万张照片中快速找…...

2026/6/12 22:06:22 阅读更多 →

ai辅助开发：借助快马平台智能生成win11开始菜单自定义设置工具

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请使用ai辅助生成一个关于windows 11开始菜单位置设置的应用代码，应用需要实现以下智能交互功能：首先用户可以通过自然语言输入设置需求，例如请…...

2026/6/13 8:40:26 阅读更多 →

【Android】PhotoArt--一款融入了ai技术的照片画质增强神器

【Android】PhotoArt-AI一键擦除衣服-变性感美女链接：https://pan.xunlei.com/s/VOuPm57W6vVhz5Dzn0seQRVaA1?pwdkjec# 通过该软件您可以在线制作获取各种风格的动漫图片，无论是头像还是壁纸都可以轻松获取。...

2026/6/13 4:12:50 阅读更多 →

Android权限管理深度解析：XXPermissions框架完整实战指南

Android权限管理深度解析：XXPermissions框架完整实战指南【免费下载链接】XXPermissions Android Permissions Framework, Adapt to Android 16 项目地址: https://gitcode.com/GitHub_Trending/xx/XXPermissions 在Android开发中，权限管理一直是…...

2026/6/10 19:31:16 阅读更多 →