搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 7 天
时间不限
过去 1 小时
过去 24 小时
过去 30 天
按相关度排序
按时间排序
腾讯网
2 小时
GPT-4o数学能力跑分直掉50%,上海AI Lab开始给大模型重新出题了
对于难度颇高的AIME2024,虽然o1-min和QwQ-32B-Preview在贪婪解码下表现突出,但面对高难度题目下的稳定性还是难以保证,如QwQ-32B-Preview甚至跌到了不到原来的1/5,而其在MATH500-L5中却比较稳定,达到了原 ...
来自MSN
1 天
Kimi埋头打造AI应用
在仲裁风波中前行的Kimi及其创始人杨植麟,正将目光牢牢锁定在自家AI应用的创新之路上。继上月推出数学模型k0—math后,Kimi再度发力。
6 小时
on MSN
跑分超 o1,还会看图思考,数理化正在被 AI「完爆」
在 OpenAI o1 正式版发布 10 天后,Kimi 的「高阶推理模型」也落地了。 12 月 16 日,Kimi 直接发布了自己的「视觉思考模型」k1。相比于一个月前发布的 k0-math,k1 ...
腾讯网
9 小时
OpenAI 发布 o1 及开发者新工具:模型升级、实时 API 优化、偏好微调等 ...
OpenAI 12天发布会Day9, 今日宣布推出一系列针对开发者的强大模型、全新定制工具以及性能、灵活性和成本效益的升级,旨在助力开发者构建更智能、更强大的 AI 应用。本次更新涵盖以下关键内容:1. API 中的 OpenAI o1:OpenAI ...
腾讯网
2 天
Kimi又上新!抢先实测视觉思考模型k1,甚至比o1更聪明
机器之心原创机器之心编辑部用强化学习,改变大模型技术范式。国产大模型,正在引领 AI 技术新方向。今天上午,月之暗面 Kimi 正式发布了视觉思考模型 k1,并已经上线了最新版的网页版以及安卓和 iOS APP。用户只需要在对话框中输入 @,然后选择 ...
中关村在线
2 天
虚拟现实游戏有哪些 高人气虚拟现实游戏排行榜前十
探索虚拟现实游戏新纪元:本文带你揭示高人气的虚拟现实游戏排行榜,揭示沉浸式体验的十大热门之作。无论是硬核玩家还是VR新手,都将在这份清单中找到令人惊叹的游戏世界,一探未来娱乐的无限可能。
3 天
今年美国大学申请人数爆表了!提交这些成绩的学生优先考虑
MIT是最先恢复提交标化考试成绩的学校,后来加州理工、布朗大学、达特茅斯、耶鲁、哈佛、斯坦福等顶尖 名校也纷纷加入,强制要求学生提交SAT或ACT成绩 。随后平权法案被废除, SAT/ACT成绩成了录取名校不可撼动的考虑因素 。
来自MSN
2 天
360发布360gpt2-o1
品玩12月16日讯,据 360 智脑官方消息,360 自研 AI 大模型 360gpt2-o1 正式上线 360gpt2-o1 使用树搜索构建思维链,并引入了反思机制,使用强化学习训练,模型具备自我反思与纠错的能力。该模型是继今年 10 月推出的 ...
来自MSN
1 天
美团小象超市启动出海行动;快手推出“付费短剧会员”模式 ...
我是邦小白,这里是CEO自习室,我整理了一份学习资料,助你回顾最受关注的电商大事。 美团小象超市启动出海行动 首站沙特 ...
3 天
万字爆光,首揭o1 pro架构!惊人反转,Claude 3.5 Opus没失败?
【新智元导读】就在刚刚,满血版o1震撼上线了!它首次将多模态和新的推理范式结合起来,更智能、更快速。同时推出的还有200美元/月的专业版ChatGPTPro。OpenAI放出了长长的团队名单,包括推理研究、推理技术安全等部门。
2 天
万字独家曝光,首揭o1 pro架构,惊人反转,Claude 3.5 Opus没失败?
全网独一份o1 pro架构爆料来了!首创自洽性机制打破推理极限,「草莓训练」系统首次揭秘。更令人震惊的是,OpenAI和Anthropic自留Orion、Claude 3.5超大杯,并不是内部失败了,而是它们成为数据生成的秘密武器。
5 天
微软出招!新模型数学超GPT-4o编程胜Llama3.3,训练新范式引热议 ...
另外,微软还用内部的基准PhiBench对模型能力进行了更全面的评估,结果Phi-4取得了56.2%的综合得分,展现出在推理、知识、编程等方面的全面能力,但相比于Qwen 2.5-72B等模型,还是暴露了有待提高之处。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈