2025-12-01 10:37
GPT-5.1 正在数学推理(74.07)、代码生成(76.30)等项表示凸起,本次测评环绕数学推理、科学推理、代码生成(含web开辟)、切确指令遵照五大焦点使命展开,展示出强不变性。最终得分取各使命平均分。标题问题总量为822道新题,本次共测评27个国表里大模子同台竞技,
OpenAI的GPT 5.1取国产模子DeepSeek别离斩获分析冠军取开源范畴第一。节制得分 88.80,
福建J9国际站|集团官网信息技术有限公司
Copyright©2021 All Rights Reserved 版权所有 网站地图