mould 模型 - 搜索 News

【环球时报记者刘扬环球时报特约记者任重】近日，一个名为DeepSeek（深度求索）的中国AI初创公司成为国内外人工智能（AI）大模型领域热议话题。在不到30天的时间里，DeepSeek先后发布了DeepSeek-V3和DeepSeek-R1两款大模型，其成本与动辄数亿甚至上百亿美元的 ...

GitHub11 天

Lordog/dive-into-llms

《动手学大模型》系列编程实践教程，由上海交通大学2024年春季《人工智能安全技术》课程（NIS3353）讲义拓展而来（教师：张倬胜），旨在提供大模型相关的入门编程参考。通过简单实践，帮助同学快速入门大模型，更好地开展课程设计或学术研究。微调与 ...

虎嗅网22 天

成本仅国外三十分之一，中国大模型已经追上美国了？

本文来自微信公众号：知识分子，作者：张天祁、李珊珊，原文标题：《来自中国的大模型成最大黑马，成本仅国外三十分之一，硅谷恐慌》，头图来自：视觉中国 “Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek，它使得 Llama 4 在基准测试中已经落后。

新浪网3 天

DeepSeek等大模型私有化服务器部署快速上升，网络安全公司：近九成 ...

【环球时报-环球网报道记者郭媛丹】在国产大模型 DeepSeek 成为 AI 领域的焦点之后，一些企业和个人纷纷开始搭建DeepSeek大模型的私有化部署 ...

IT之家27 天

腾讯混元 3D 生成大模型 2.0 开源发布，同步上线“业界首个一站式 3D ...

IT之家1 月 21 日消息，腾讯今日官宣开源上线混元 3D 生成大模型 2.0。腾讯混元还同步上线混元 3D AI 创作引擎，号称是“业界首个一站式 3D 内容 AI 创作平台”。该技术宣称一句话、一张图，甚至画个草图都能生成一个 3D 模型，甚至还能加动作、换纹理、捏人物 ...

腾讯网21 天

中国新AI大模型为何火爆全网？人工智能领域专家解读

【环球时报记者刘扬环球时报特约记者任重】近日，一个名为DeepSeek（深度求索）的中国AI初创公司成为国内外人工智能（AI）大模型领域热议话题 ...

爱范儿27 天

国产 AI 最卷一夜！大模型黑马 DeepSeek、Kimi 硬刚 OpenAI o1，实测体验 ...

使用微信扫码将网页分享到微信赶在放假前，支棱起来的国产 AI 大模型厂商井喷式发布了一大堆春节礼物。前脚 DeepSeek-R1 正式发布，号称性能对标 ...

投资界27 天

DeepSeek 开源最强推理模型 R1，再震欧美同行

中国的 OpenAI，出现了。对标 OpenAI o1 正式版的国产大模型来了！ 1 月 20 日晚，DeepSeek（深度求索）公司发布推理模型 DeepSeek-R1 正式版，同步开源 ...

中国网22 天

英国《金融时报》：中国AI模型震惊硅谷

英国《金融时报》1月25日文章，原题：中国小型人工智能初创公司深度求索如何震惊硅谷本周，中国一家人工智能（AI）实验室发布尖端模型的 ...

IT之家20 天

DeepSeek 深夜再放大招：7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源

IT之家1 月 28 日消息，就在北京时间今日凌晨，DeepSeek 宣布开源全新的视觉多模态模型 Janus-Pro-7B，其在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。 Janus-Pro 是一种创新的自回归框架，实现多模态信息的统一理解与生成。与以往的方法不同 ...

华尔街日报中文版21 天

中国公司DeepSeek的AI模型何以让硅谷惊叹不已

一家中国人工智能(AI)公司的程序员使用不那么先进的芯片做成了几乎可以匹敌美国对手的产品，这让硅谷惊叹不已。根据一项热门排名，中国公司DeepSeek的AI模型在性能方面已跃居全球前十，这暗示着美国政府的出口限制或许难以阻止中国AI技术的快速发展。

36氪25 天

一文读懂：DeepSeek新模型大揭秘，为何它能震动全球AI圈

这一研究可能会对模型推理训练后续的范式产生深刻影响。时隔不到一个月，DeepSeek又一次震动全球AI圈。去年 12 月，DeepSeek推出的DeepSeek-V3在全球AI ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果