力大砖飞,简洁优雅。 我觉得最大的价值是证明了:基于一个很强的模型(deepseekv3-base),用最简单的rule-based reward来做rl,经过大量训练(8k steps * bs 512/1024),也能达到目前reasoning ...
从技术报告看,K1.5的亮点是真的不少。
【新智元导读】开年放大招!阶跃星辰重磅升级 Step 系基座模型全家桶,一口气连更上新 6 款模型。作为业内公认的「多模态卷王」,这家 AI 明星公司目前已拥有业内最全模型矩阵。
机器之心发布作者:达摩院首席科学家赵德丽今日,达摩院首席科学家赵德丽发表文章《2025 AI展望:Scaling Law新叙事加速AI变革》,对当前 AI 的发展逻辑进行梳理,同时也展望了 2025 年的 AI 趋势。本文是对赵德丽老师文章的全文刊载 ...