分享好友资讯首页资讯分类切换频道

阿里通义实验室智能计算团队推出新算法FIPO

2026-04-10 10:0510610

猎人
加关注0
~~没有留下签名~~~~

近日，阿里通义实验室智能计算团队宣布推出新算法FIPO（Future-KL Influenced Policy Optimization），引入Future-KL机制，奖励关键Token，解决纯强化学习（Pure RL）训练中“推理长度停滞”难题。据该团队介绍，在32B规模的纯RL设定下，率先实现对o1-mini与同规模DeepSeek-Zero-MATH的性能反超。

安捷伦新一代ICP-MS/MS与气相色谱系统正式登陆中国
0评论2026-06-09

清华工程师携手哈佛Lukin实验室，无问清芯探索量子计算国产化发展之路
0评论2026-06-09

燕赵实验室已突破关键技术63项
0评论2026-06-08

山东黄金集团选冶实验室一项成果获国家发明专利授权
0评论2026-06-05

天津首个汽车制造具身智能实验室上线
0评论2026-06-03

珞珈实验室高精度融合感知系统加速落地
0评论2026-06-01

佛山仙湖实验室两项项目成果通过鉴定
0评论2026-05-29

天目山实验室发布多项低空经济成果
0评论2026-05-12

天目山实验室发布多项低空经济成果
0评论2026-05-12

北京未来设计实验室创新成果发布打通产业落地最后一公里
0评论2026-05-11