A On Math Test - 搜索 News

来自MSN5 天

力大砖飞，简洁优雅。我觉得最大的价值是证明了：基于一个很强的模型（deepseekv3-base），用最简单的rule-based reward来做rl，经过大量训练（8k steps * bs 512/1024），也能达到目前reasoning ...

来自MSN4 天

从技术报告看，K1.5的亮点是真的不少。

撰文 | 新皮层小组编辑 | ...

4 天

【新智元导读】开年放大招！阶跃星辰重磅升级 Step 系基座模型全家桶，一口气连更上新 6 款模型。作为业内公认的「多模态卷王」，这家 AI 明星公司目前已拥有业内最全模型矩阵。

机器之心发布作者：达摩院首席科学家赵德丽今日，达摩院首席科学家赵德丽发表文章《2025 AI展望：Scaling Law新叙事加速AI变革》，对当前 AI 的发展逻辑进行梳理，同时也展望了 2025 年的 AI 趋势。本文是对赵德丽老师文章的全文刊载 ...

一些您可能无法访问的结果已被隐去。