|

酒仙桥
2000活跃值=1元

首页 > 新车评测 > 新车评测 > 通义Qwen3非思考模型上新多项能力达到Gemini2.5、GPT-4o水平

通义Qwen3非思考模型上新多项能力达到Gemini2.5、GPT-4o水平

发布时间：2025-08-01 11:14:00

7月30日，阿里巴巴通义千问团队宣布推出Qwen3系列模型的最新版本 ——Qwen3-30B-A3B-Instruct-2507。这一非思考模式（non-thinking mode）的开源模型仅需激活3B参数，即可在多项核心能力上达到与Gemini 2.5-Flash（non-thinking）、GPT-4o等闭源模型相当的性能水平，同时在多语言覆盖、用户偏好对齐和长文本处理等领域实现突破性提升。目前，该模型已在魔搭社区（ModelScope）和HuggingFace平台全面开源。

通义Qwen3非思考模型上新多项能力达到Gemini2.5、GPT-4o水平

作为Qwen3-30B-A3B模型中的新版本，Qwen3-30B-A3B-Instruct-2507延续了通义千问团队在架构创新上的优势，在大幅降低计算成本的同时，实现了与千亿级闭源模型的性能对标。官方数据显示，该模型在数学推理（AIME25测试得分61.3）、代码生成（LiveCodeBenchv6得分43.2）、研究生级物理和天文学问题（GPQA测试得分70.4）、人类偏好对齐（Arena-Hard v2得分69）、函数调用能力（BFCL-v3得分65.1）等关键基准测试中表现突出，部分指标甚至超越GPT-4o等。

通义Qwen3非思考模型上新多项能力达到Gemini2.5、GPT-4o水平

在通用能力层面，模型全面强化了指令遵循、逻辑推理、数学、科学、编程及工具使用等多方面。在多语言的长尾知识覆盖方面，模型进步显著；在主观和开放任务中，新模型与进一步紧密对齐了用户偏好，可以生成更高质量的文本，为用户提供更有帮助的回答；长文本理解能力提升至256K。

通义千问是阿里巴巴达摩院自主研发的大语言模型系列，自2023年发布以来，已开源超200个模型，全球下载量突破3亿次，衍生模型数超10万个。

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“酒仙桥用户上传并发布"，本平台仅提供信息存储服务。

下一篇:特斯拉Model 3中保研测试成绩出炉：还不如12万的蔚来萤火虫

上一篇:一个月内四名AI大将被Meta挖走，苹果涨薪应对

新车评测更多>>

16万元，刚改款上市的宝马纯电，竟然直接打折售卖？大众ID.4将迎中期改款外观内饰全面更新预计2026年底首发丰田官方确认将推出中置引擎跑车预计需4至5年完成开发丰田等日本车企将共享芯片数据以应对供应链风险 2026款奔驰S级将搭载加热安全带捷尼赛思曾秘密研发电动皮卡概念车项目已暂停大众裁员大刀，砍向董事会，一次撸掉10位荣耀MagicOS全新功能“眼动翻页”官宣，支持电子书应用翻页微信员工澄清“通知显示头像”功能：并非仅限iOS设备 “套壳”谷歌Gemini 但苹果还没死心自研模型 80后哈佛学霸带出的90亿独角兽拿下20亿融资 Manus和它的“8000万名员工” 初创公司GRU Space宣布开发“月球酒店”：最快六年后入住，定金25万至100万美元扎克伯格大砍预算 Meta现实实验室将裁员10% 消息称OpenAI正研发AI耳机：可利用自然语言交互、有望配备2nm制程芯片章泽天播客预告首期嘉宾小红书账号粉丝已超7万超40家VC押注，80后创始人冲刺水下机器人第一股雷军新年直播今晚开启：现场拆一台小米YU7！已准备就绪比亚迪超越特斯拉美媒：马斯克笑不出来了多邻国App使用苹果iPhone灵动岛展示广告，被指违反官方设计规范 iPhone电池健康度能用到0%？苹果回应：理论有可能，现实没见过边开车边充电，美国佛罗里达州将启动无线充电高速公路测试小鹏汽车：2026款小鹏P7+和小鹏G7超级增程开启新年首次发运 smart精灵#1 马年开运版上市：四款专属车顶，售13.99万元购房补贴、定向礼包，多地“金九银十”楼市优惠加码双创指数强势领涨！“十五五”蓝图划重点，科技+内需迎新机遇新能源汽车电池退役后，都去哪儿了？保时捷携两款标志性911登陆第八届进博会，演绎经典与创新的时代对话德赛西威正式发布机器人智能基座AI Cube 长安汽车9家海外工厂，布局到了哪里？

Copyright 2006-2025 酒仙桥版权所有京ICP备20061125号