Math 8 7 - 搜索 News

对于难度颇高的AIME2024，虽然o1-min和QwQ-32B-Preview在贪婪解码下表现突出，但面对高难度题目下的稳定性还是难以保证，如QwQ-32B-Preview甚至跌到了不到原来的1/5，而其在MATH500-L5中却比较稳定，达到了原 ...

来自MSN1 天

在仲裁风波中前行的Kimi及其创始人杨植麟，正将目光牢牢锁定在自家AI应用的创新之路上。继上月推出数学模型k0—math后，Kimi再度发力。

6 小时on MSN

在 OpenAI o1 正式版发布 10 天后，Kimi 的「高阶推理模型」也落地了。 12 月 16 日，Kimi 直接发布了自己的「视觉思考模型」k1。相比于一个月前发布的 k0-math，k1 ...

OpenAI 12天发布会Day9，今日宣布推出一系列针对开发者的强大模型、全新定制工具以及性能、灵活性和成本效益的升级，旨在助力开发者构建更智能、更强大的 AI 应用。本次更新涵盖以下关键内容：1. API 中的 OpenAI o1：OpenAI ...

机器之心原创机器之心编辑部用强化学习，改变大模型技术范式。国产大模型，正在引领 AI 技术新方向。今天上午，月之暗面 Kimi 正式发布了视觉思考模型 k1，并已经上线了最新版的网页版以及安卓和 iOS APP。用户只需要在对话框中输入 @，然后选择 ...

探索虚拟现实游戏新纪元：本文带你揭示高人气的虚拟现实游戏排行榜，揭示沉浸式体验的十大热门之作。无论是硬核玩家还是VR新手，都将在这份清单中找到令人惊叹的游戏世界，一探未来娱乐的无限可能。

3 天

MIT是最先恢复提交标化考试成绩的学校，后来加州理工、布朗大学、达特茅斯、耶鲁、哈佛、斯坦福等顶尖名校也纷纷加入，强制要求学生提交SAT或ACT成绩。随后平权法案被废除， SAT/ACT成绩成了录取名校不可撼动的考虑因素。

来自MSN2 天

品玩12月16日讯，据 360 智脑官方消息，360 自研 AI 大模型 360gpt2-o1 正式上线 360gpt2-o1 使用树搜索构建思维链，并引入了反思机制，使用强化学习训练，模型具备自我反思与纠错的能力。该模型是继今年 10 月推出的 ...

来自MSN1 天

我是邦小白，这里是CEO自习室，我整理了一份学习资料，助你回顾最受关注的电商大事。美团小象超市启动出海行动首站沙特 ...

3 天

【新智元导读】就在刚刚，满血版o1震撼上线了!它首次将多模态和新的推理范式结合起来，更智能、更快速。同时推出的还有200美元/月的专业版ChatGPTPro。OpenAI放出了长长的团队名单，包括推理研究、推理技术安全等部门。

2 天

全网独一份o1 pro架构爆料来了！首创自洽性机制打破推理极限，「草莓训练」系统首次揭秘。更令人震惊的是，OpenAI和Anthropic自留Orion、Claude 3.5超大杯，并不是内部失败了，而是它们成为数据生成的秘密武器。

5 天

另外，微软还用内部的基准PhiBench对模型能力进行了更全面的评估，结果Phi-4取得了56.2%的综合得分，展现出在推理、知识、编程等方面的全面能力，但相比于Qwen 2.5-72B等模型，还是暴露了有待提高之处。

一些您可能无法访问的结果已被隐去。