阿里开源首个“混合推理模型”：集成“快思考”、“慢思考”能力

时间：2025-04-29 14:24:04 栏目：新闻资讯浏览：4

阿里开源了其首个具备"快思考"与"慢思考"能力的混合推理大模型。

4月29日凌晨，阿里巴巴宣布开源新一代通义千问模型Qwen3（简称千问3），该模型集成了“快思考”与“慢思考”。阿里方面表示，Qwen3部署成本上较Deepseek等大模型显著降低。

千问3旗舰版和32B版本在部分基准测试中的得分。来源：通义千问

据介绍，Qwen3系列采用的“混合专家（MoE）架构”，能够模仿人类思考问题的方式，对复杂问题可多步骤“深度思考”，对简单需求可低算力“秒回”答案，极大节省算力消耗。阿里称，这种混合推理模型还能够灵活满足AI应用和不同场景对性能和成本的多样需求。澎湃科技注意到，Anthropic和Alphabet的谷歌以及DeepSeek等其他开发者也在模型中采用了该架构。

自从DeepSeek发布以低成本高性能著称的R1 模型抢占OpenAI风头之后，近两个多月以来，国内科技公司开始迅速向市场推出一系列成本较低的AI模型服务。比如，以百度、科大讯飞等为代表的国内科技企业也纷纷加注国产模型升级浪潮，密集推出低成本AI服务。百度发布新一代文心一言模型4.5和X1，多模态理解、文本和逻辑推理能力显著提升；火山引擎正式发布豆包1.5深度思考模型，实现更低延迟；科大讯飞全新升级深度推理大模型讯飞星火X1。

当前，阿里巴巴正围绕Qwen系列构建其AI战略版图。今年2月，阿里巴巴集团CEO吴泳铭提到，该公司的“首要目标”已转向实现通用人工智能（AGI），即打造具有人类级认知能力的智能系统。未来三年，阿里将投入超过3800亿元人民币，用于建设云和AI硬件基础设施，总额超过去十年总和。吴泳铭还表示，“阿里巴巴将加速云和AI硬件基础设施建设，助推全行业生态发展。”

阿里云方面表示，阿里通义已开源200余个模型，全球下载量超3亿次，Qwen衍生模型数超10万个，已超越美国Llama，成为全球之一开源模型。

国际科技巨头同样也在加速模型优化布局。就在阿里开源通义千问模型Qwen3，29日，OpenAI 也发布了 ChatGPT 的多项功能更新，包括对购物功能的支持和优化。

从今天开始，当用户搜索产品时，ChatGPT会提供一些推荐，展示这些产品的图片和评论，并提供指向用户购买产品的网页的直接链接。目前，OpenAI 正在尝试涵盖时尚、美妆、家居用品和电子产品等类别。ChatGPT 这次更新对更多生活场景进行了优化，继续朝着超级消费级应用的方向小步快跑。

200亿险资“活水”要来！新华保险、中国人寿拟各出资100亿元认购二期鸿鹄基金

年报密集出炉，宠物经济成机构调研“香饽饽”

康为世纪(688426.SH)2024年净利润为-1.57亿元，同比亏损放大

山西运城农村商业银行被罚逾115万元，涉及提供虚假的或者隐瞒重要事实的统计报表等7项违法行为

部分地区车贷免违约金期限延至3年，“长贷短还”模式生变

科技早报 | 中国全景相机在美国被抢购；美国电商平台集体提价

白云山一季度营收净利双降，此前称今年将挖掘盘活自身资源

【深度】彻底退出中国可能是极星汽车最好的出路

3月20日增减持汇总：新钢股份增持浙江医药等11股减持（表）_财经新闻