360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能

2025年2月24日——由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,仅以5%参数,逼近Deepseek-R1-671B的性能。

67bd44202757c

核心突破:小模型,大能量

▪  数学领域:以78.1分(AIME 2024评测)逼近原版R1模型(79.8分),远超Deepseek-R1-Distill-Llama-70B(70.0分);

▪  综合性能:在编程(LiveCodeBench 61.6分)、科学(GPQA-Diamond 65.0分)领域全面领先最佳开源70B模型Deepseek-R1-Distill-Llama-70B;

▪  效率跃迁:仅需5%参数量,性能达原版R1的95%以上,推理成本大幅降低。

技术革新:领域专精+模型融合

研究团队使用「分治-融合」策略:

▪  基于DeepSeek-R1生成海量领域数据,分别训练数学、编程、科学三大垂直模型;

▪  通过Arcee团队Mergekit工具智能融合,突破单一模型性能上限,实现多任务均衡优化。

开源承诺:推动技术普惠

▪  模型仓库:https://huggingface.co/qihoo360/TinyR1-32B-Preview

▪  即将公开完整技术报告、训练代码及部分数据集;  

▪  践行开源精神,助力AI社区共筑高效推理新生态。

研发团队表示:「Tiny-R1-32B-Preview是蒸馏技术的里程碑,未来将持续探索更轻量、更强大的通用模型,推动AI技术普惠化进程。」

360 团队: Lin Sun, Guangxiang Zhao, Xiaoqi Jian, Weihong Lin, Yongfu Zhu, Change Jia, Linglin Zhang, Jinzhu Wu, Sai-er Hu, Xiangzheng Zhang

北大团队: Yuhan Wu, Zihan Jiang, Wenrui Liu, Junting Zhou, Bin Cui, Tong Yang

GE3nTG4Earu366mgzjgTTxg8brllfWIOBP6DkWYc

60f0f9e8-e96d-46fb-8b38-72f87ff62192

本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除,不承担任何侵权责任。转转请注明出处:https://sx.sychwlgzs.com/7223.html

(0)
上一篇 2025年2月20日 下午9:02
下一篇 2025年2月25日 下午3:48

相关推荐

  • 分布式光伏新机遇,正泰安能踏浪而行

    全球碳中和浪潮下,低碳环保、安全高效的能源体系成为发展趋势,我国亦将加快推进能源革命。在此背景下,以光伏为代表的新型能源蓬勃发展,其中,户用光伏因其发电就地消纳、避免长距离输配电损耗等特点,近年来实现跨越式增长。 正泰安能数字能源(浙江)股份有限公司成立于2015年,专注于户用光伏领域,已经形成了优秀的户用光伏电站设计与开发能力。公司以高标准、高质量、高效率…

    2023年12月18日
    0
  • 百度数字人生成专利公布:可像人类一样表达意识和情感

    百度数字人生成专利公布:可像人类一样表达意识和情感 12月19日消息,据媒体报道,今天,百度在线网络技术(北京)有限公司的“数字人生成方法和装置”专利申请公布,生成的数字人能够像人类一样表达自己的意识和情感。据专利摘要显示,该专利提供了一种数字人生成方法和装置,涉及人工智能技术领域,具体为计算机视觉、自然语言处理、深度学习等技术领域,可应用于元宇宙、数字人等…

    2023年12月19日
    0
  • 宇视科技2025合作伙伴大会丨业内首次提出“AIoT智能体”新理念

    4月29日,春满长安,雁塔风起,2025宇视合作伙伴大会在西安国际会展中心隆重举行。宇视和近两千名合作伙伴齐聚古都,共探AIoT与行业大模型深度融合的创新实践,共绘智能体时代产业升级蓝图。 本次大会以“千行重启,万物皆智”为主题,聚焦AIoT技术浪潮下的行业变革,探讨大模型与智能体技术如何驱动千行百业智能化升级。 大会上,学界与产业领袖齐聚一堂,直面智能体技…

    2025年4月30日
    0
  • 传国产内存厂商长鑫存储获准进口美系设备!落后美光8年 没法追赶

    5月10日消息,据英国《金融时报》9日引述未具名消息人士的话报导称,中国DRAM芯片制造商长鑫存储经过数月后终于确认,其向美国厂商订购的芯片制造设备不受美国出口管制影响。 长鑫存储是目前中国大陆唯一一家能运用20nm以下制程生产DRAM芯片的厂商。去年10月7日,美国出台了对华半导体出口限制政策,不仅限制了先进芯片、设备的对华出口,长鑫存储等芯片制造商被迫暂…

    2023年5月11日
    0
  • 北科智慧智能手提箱旗舰版惊艳亮相2023(香港)智能科技展

    2023年12月8日,北科智慧团队在粤港澳大湾区创新发展峰会暨侨交会2023(香港)智能科技展上举办新品发布,推出三款自主研发科技产品:智能手提箱高级版和旗舰版,以及智能呈批夹。新品一经推出,便受到现场买家和媒体的大量关注和报道。 此次展会以“融聚创新,共铸未来”为主题,在香港会议展览中心举办,分智能制造、智能消费品、智慧办公与生活等六大展区,北科智慧的旗舰…

    2023年12月19日
    0