LLM Tuning - 搜索 News

3 天

研究团队的发现还指出，通过改善训练数据的逻辑结构能够显著提升模型的准确性，而单一推理步骤的调整对整体性能的影响则相对微小。这一理论指导为在将来的研究中进一步优化LLM的推理能力提供了重要支持。

3 天

在人工智能的不断发展中，提升大语言模型（LLM）的推理能力一直是业内专家面临的艰巨挑战。如果我们把这项技术比作铁路运输，那么传统的L.M.L训练就像是铺设一条漫长而曲折的路，需要大量的数据和时间来实现。然而，最近加州大学伯克利分校的研究团队却为我们带 ...

4 天

多代理微调如何克服 LLM 的数据瓶颈

为了提高性能，新技术使用了多代理辩论（Multiagent Debate）的概念，即：由多个 LLM ...

腾讯网2 天

知识蒸馏方法探究：Google Distilling Step-by-Step 论文深度分析

点击上方“Deephub Imba”,关注公众号,好文章不错过 !大型语言模型 (Large Language Models, LLMs) 的发展日新月异。从最初的简单对话系统，到如今能够执行文本生成、语言翻译和代码编写等复杂任务的先进模型，LLM ...

CTIMES21 小时

扩展定律有助AI在更多领域发挥应用潜力

在AI领域，扩展定律（Scaling Laws）已成为推动技术进步的核心概念。这些定律描述了AI系统的效能如何随着训练资料、模型叁数或运算资源的增加而提升。正如自然界中的物理定律一样，扩展定律为AI的发展提供了可预测的框架，并在近年来成为大型语言模型 ...

19 小时

月之暗面研究员：未能更早将“长思维链”作为高优选项

据月之暗面官方介绍，新推出的k1.5多模态思考模型实现了SOTA（state-of-the-art，指最佳技术或最高水平模型）级别的多模态推理和通用推理能力。在长思维链模式下，kimi K1.5的数学、代码、多模态推理能力，也达到长思考SOTA模型OpenAI o1正式版水平。

腾讯网6 天

统一SAM2和LLaVA！字节豆包提出Dense Video多模态大模型Sa2VA

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

来自MSN20 小时

至顶智库 | 图文并茂万字解读DeepSeek核心技术概念

DeepSeek（深度求索）是一家源自中国的人工智能公司，成立于2023年，总部位于中国杭州。前身是国内量化投资巨头幻方量化的子公司。公司专注于开发低成本、高性能的AI模型，致力于通过技术创新推动人工智能技术的普惠化。DeepSeek由幻方量化提供研发资金。独特的经营模式使DeepSeek能够在没有外部压力的情况下持续开展大模型研发，优先考虑大模型的长期研发价值。DeepSeek在深度学习、强化学 ...

搜狐6 天

汇正财经：deepseek 开启模型平权时代，AI应用前景可期

建议关注：deepSeek 引领新一轮 LLM 性能及成本提质增效，有望带动 AI 应用进入发力阶段，关注各垂直行业 AI 进展。风险警示：市场有风险 ...

1 天

李飞飞团队50美元复刻DeepSeek？其实是基于通义监督微调，我们研究了 ...

近日有媒体报道称，李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果