360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能

2025年2月24日——由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,仅以5%参数,逼近Deepseek-R1-671B的性能。

67bd44202757c

核心突破:小模型,大能量

▪  数学领域:以78.1分(AIME 2024评测)逼近原版R1模型(79.8分),远超Deepseek-R1-Distill-Llama-70B(70.0分);

▪  综合性能:在编程(LiveCodeBench 61.6分)、科学(GPQA-Diamond 65.0分)领域全面领先最佳开源70B模型Deepseek-R1-Distill-Llama-70B;

▪  效率跃迁:仅需5%参数量,性能达原版R1的95%以上,推理成本大幅降低。

技术革新:领域专精+模型融合

研究团队使用「分治-融合」策略:

▪  基于DeepSeek-R1生成海量领域数据,分别训练数学、编程、科学三大垂直模型;

▪  通过Arcee团队Mergekit工具智能融合,突破单一模型性能上限,实现多任务均衡优化。

开源承诺:推动技术普惠

▪  模型仓库:https://huggingface.co/qihoo360/TinyR1-32B-Preview

▪  即将公开完整技术报告、训练代码及部分数据集;  

▪  践行开源精神,助力AI社区共筑高效推理新生态。

研发团队表示:「Tiny-R1-32B-Preview是蒸馏技术的里程碑,未来将持续探索更轻量、更强大的通用模型,推动AI技术普惠化进程。」

360 团队: Lin Sun, Guangxiang Zhao, Xiaoqi Jian, Weihong Lin, Yongfu Zhu, Change Jia, Linglin Zhang, Jinzhu Wu, Sai-er Hu, Xiangzheng Zhang

北大团队: Yuhan Wu, Zihan Jiang, Wenrui Liu, Junting Zhou, Bin Cui, Tong Yang

GE3nTG4Earu366mgzjgTTxg8brllfWIOBP6DkWYc

60f0f9e8-e96d-46fb-8b38-72f87ff62192

本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除,不承担任何侵权责任。转转请注明出处:https://sx.sychwlgzs.com/7223.html

(0)
上一篇 2025年2月20日 下午9:02
下一篇 2025年2月25日 下午3:48

相关推荐

  • 元梦之星被指抄袭后上演教科书级别“反打”,玩家直呼真脏!

    作为鹅厂年底推出的压轴手游,《元梦之星》在近期可谓风波不断,自9月份首测以来这款游戏就受到了不少玩家的质疑,高度相似的地图以及缝合《穿越火线》、《和平精英》等游戏的玩法也让很多参与测试的玩家表示不满。在公测之后《元梦之星》更是不知收敛,大量抄袭的玩家地图出现在《元梦之星》这款游戏当中! 在《元梦之星》上线之后,很多同类游戏的地图创作者都发现自己的地图“换了个…

    2023年12月21日
    0
  • 内蒙古能源集团400万千瓦新能源项目启动并网发电

    四子王旗项目 中国发展改革报社冬花记者梁喜俊报道2023年12月28日,内蒙古能源集团400万千瓦新能源项目启动并网发电,较国家新能源定额工期提前近一年时间,实现造价最优、安全最好、速度最快、单体最大,成为全国首创,助力内蒙古自治区新能源并网装机规模突破9000万千瓦大关,稳居全国第一。 据了解,400万千瓦新能源项目分别为巴彦淖尔100万千瓦光储+生态治理…

    2023年12月29日
    0
  • 北科智慧智能手提箱旗舰版惊艳亮相2023(香港)智能科技展

    2023年12月8日,北科智慧团队在粤港澳大湾区创新发展峰会暨侨交会2023(香港)智能科技展上举办新品发布,推出三款自主研发科技产品:智能手提箱高级版和旗舰版,以及智能呈批夹。新品一经推出,便受到现场买家和媒体的大量关注和报道。 此次展会以“融聚创新,共铸未来”为主题,在香港会议展览中心举办,分智能制造、智能消费品、智慧办公与生活等六大展区,北科智慧的旗舰…

    2023年12月19日
    0
  • 新春走基层|湖南永州:科技创新赋能产业转型升级

    新春走基层|湖南永州:科技创新赋能产业转型升级 央广网永州2月5日消息(记者张志诚 通讯员雷中祥)临近春节,在湖南省永州市冷水滩区高科园永州京辉科技有限公司生产车间,30多台全自动注塑机依然在高速运转,赶制小家电配件。原材料在全自动生产设备中经过烘烤、注塑等工序后,产品就会被机械长臂敏捷抓取输送到传输带上,劳动力成本显著降低。 车间里的自动注塑机(央广网发 …

    2024年2月5日
    0
  • 涂鸦智能×DeepSeek:多模态AI重塑宠物养护新范式

    当前,DeepSeek等AI大模型正在全球掀起新一轮AI技术竞赛,并在能源管理、宠物养护、情感陪伴、智能家居等领域呈现出诸多商业可能性。然而,AI技术的商业化落地仍面临诸多挑战:据Gartner调研,80%以上的AI项目因缺乏端侧部署能力与场景化方案而止步实验室,想要将AI技术从算法突破至商业落地的最后一公里,还需AIoT平台等关键角色的赋能。 在这种背景下…

    2025年2月20日
    0