LLM Tuning - 搜索 News

澎湃科技 on MSN19 小时

据月之暗面官方介绍，新推出的k1.5多模态思考模型实现了SOTA（state-of-the-art，指最佳技术或最高水平模型）级别的多模态推理和通用推理能力。在长思维链模式下，kimi K1.5的数学、代码、多模态推理能力，也达到长思考SOTA模型OpenAI o1正式版水平。

CTIMES19 小时

扩展定律有助AI在更多领域发挥应用潜力

在AI领域，扩展定律（Scaling Laws）已成为推动技术进步的核心概念。这些定律描述了AI系统的效能如何随着训练资料、模型叁数或运算资源的增加而提升。正如自然界中的物理定律一样，扩展定律为AI的发展提供了可预测的框架，并在近年来成为大型语言模型 ...

17 小时

月之暗面研究员：未能更早将“长思维链”作为高优选项

据月之暗面官方介绍，新推出的k1.5多模态思考模型实现了SOTA（state-of-the-art，指最佳技术或最高水平模型）级别的多模态推理和通用推理能力。在长思维链模式下，kimi K1.5的数学、代码、多模态推理能力，也达到长思考SOTA模型OpenAI o1正式版水平。

来自MSN19 小时

至顶智库 | 图文并茂万字解读DeepSeek核心技术概念

DeepSeek（深度求索）是一家源自中国的人工智能公司，成立于2023年，总部位于中国杭州。前身是国内量化投资巨头幻方量化的子公司。公司专注于开发低成本、高性能的AI模型，致力于通过技术创新推动人工智能技术的普惠化。DeepSeek由幻方量化提供研发资金。独特的经营模式使DeepSeek能够在没有外部压力的情况下持续开展大模型研发，优先考虑大模型的长期研发价值。DeepSeek在深度学习、强化学 ...