新闻资讯

小米开源首个推理大模型Xiaomi MiMo

  新浪科技讯 4月30日上午消息,小米开源首个为推理(Reasoning)而生的大模型‘Xiaomi MiMo’,联动预训练到后训练,全面提升推理能力。

  据介绍,在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

  随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

  值得注意的是,MiMo-7B全系列模型均已开源。据了解,MiMo 来自小米全新成立不久的“小米大模型Core团队”的初步尝试。(闫妍)

  • 中央政治局会议释楼市新信号,明确“持续巩固”稳定态势
  • 东方证券:向专业投资者公开发行公司债券获得中国证监会注册批复
  • 首间城市版柏典即将开业,东方快车联手米其林主厨推出美食之旅 | 一周旅行指南
  • 亚市早盘美国股指期货走低 本周将迎来科技巨头密集发布业绩的一周
  • 星巴克美股盘前下跌7% 公司Q2全球销售额降幅超预期 多家投行下调目标价
  • 贝森特发债新策略:短债“稳”、长债“缓”、紧盯稳定币“大金主”
  • 中国海警登临铁线礁开展维权行动并展示五星红旗
  • 日本财务省否认有关美国财长贝森特推动日元走强的报道
  • 一季度公募基金重仓股“换防”,资源股后来居上
  • 地方新设政府投资基金分化明显,多地推出容错机制发力直投基金
  • 编造传播“登顶泰山最高可得3万奖金”,2人被处罚、3人被批评教育
  • 暴跌45%!马斯克最新宣布,特朗普回应!
  • 6月降息?美联储“喉舌”紧急提醒:勿过度脑补官员讲话
  • 【方正金融】中国平安1Q25业绩点评:NBV和COR表现超预期,投资收益率保持稳健
  • 花旗:香港交易所购置永久总部物业对成本影响或有限
  • 关键词: