Lab模型 - 搜索 News

5 天

近日，上海AI ...

21 小时

研究团队首先观察到长推理模型频繁切换思路的现象，并进一步发现这一现象由思考不足导致。为了定量评估思路切换的问题，研究团队引入了一种新颖的思考不足指标，为推理效率低下提供了量化评估框架。同时，研究团队提出了一种缓解思考不足的简单有效方案 —— ...

1 天

总的来说，上海 AI Lab 的研究成果不仅为数学推理方向的研究提供了一条崭新的路径，更向业界展示了强化学习在实际应用中的无限潜力。通过不断探索与创新，AI技术的未来将更加光明，而被追求的“超越”也将不再只是理想。返回搜狐，查看更多 ...

1 天

从 Qwen2.5-32B-Base 模型出发，仅通过微调和基于结果反馈的强化学习，在不蒸馏超大模型如 DeepSeek-R1 的情况下，就能超越 DeepSeek-R1-Distill-Qwen32B 和 OpenAI-O1 ...

然而，虽然TTS在MATH-500上的性能接近DeepSeek-R1-Distill-Qwen-7B，但在AIME24上却显示出显著的下降。这说明TTS在相对简单任务上优势明显，但在更复杂的任务上则逊色于从超大规模模型蒸馏得到模型，还有提升空间。

来自MSN5 天

梦晨发自凹非寺量子位 | 公众号 QbitAI 倒反天罡了，新方法让DeepSeek蒸馏的Qwen数学能力反超R1满血版，7B反超671B。

2 天

人类智慧的一大特征是能够分步骤创造复杂作品，例如绘画、手工艺和烹饪等，这些过程体现了逻辑与美学的融合。然而，让 AI 学会生成这样的 “步骤教程” ...

据悉，上海AI ...

来自MSN11 小时

已知 DeepSeek 不融资，腾讯在没有投的情况下全系产品接入 DeepSeek-R1，说明两点： 1.腾讯把 DeepSeek 当成自家 AI Lab 了，反正都是开源； 2.DeepSeek ...

2 天

Video-MMMU的独特之处在于首次将视频作为知识传播的核心渠道，从传统的视频场景理解转向视频内容的知识学习。数据集专注于高质量教育视频，平均时长506.2秒，覆盖多个学科领域。其问题平均长度达75.7字，远超其他基准，体现出高度专业性和挑战性。

据美国之音报导，DeepSeek的异军突起不仅让中国的AI产业信心大增，也促使美国乃至全球重新审视中国AI产业的竞争力和潜力。中国AI产业的生态系统目前进展如何，到底有哪些大玩家？在与美国的竞争中，中国的AI企业究竟处于什么样的位置？

DeepSeek的异军突起不仅让中国的AI产业信心大增，也促使美国乃至全球重新审视中国AI产业的竞争力和潜力。本文为您简要梳理中国AI产业的生态系统，到底有哪些大玩家？在与美国的竞争中，中国的AI企业究竟处于什么样的位置？

一些您可能无法访问的结果已被隐去。