【环球时报记者 刘扬 环球时报特约记者 任重】近日,一个名为DeepSeek(深度求索)的中国AI初创公司成为国内外人工智能(AI)大模型领域热议话题。在不到30天的时间里,DeepSeek先后发布了DeepSeek-V3和DeepSeek-R1两款大模型,其成本与动辄数亿甚至上百亿美元的 ...
《动手学大模型》系列编程实践教程,由上海交通大学2024年春季《人工智能安全技术》课程(NIS3353)讲义拓展而来(教师:张倬胜),旨在提供大模型相关的入门编程参考。通过简单实践,帮助同学快速入门大模型,更好地开展课程设计或学术研究。 微调与 ...
本文来自微信公众号:知识分子,作者:张天祁、李珊珊,原文标题:《来自中国的大模型成最大黑马,成本仅国外三十分之一,硅谷恐慌》,头图来自:视觉中国 “Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek,它使得 Llama 4 在基准测试中已经落后。
【环球时报-环球网报道 记者 郭媛丹】在国产大模型 DeepSeek 成为 AI 领域的焦点之后,一些企业和个人纷纷开始搭建DeepSeek大模型的私有化部署 ...
IT之家1 月 21 日消息,腾讯今日官宣开源上线混元 3D 生成大模型 2.0。腾讯混元还同步上线混元 3D AI 创作引擎,号称是“业界首个一站式 3D 内容 AI 创作平台”。 该技术宣称一句话、一张图,甚至画个草图都能生成一个 3D 模型,甚至还能加动作、换纹理、捏人物 ...
【环球时报记者 刘扬 环球时报特约记者 任重】近日,一个名为DeepSeek(深度求索)的中国AI初创公司成为国内外人工智能(AI)大模型领域热议话题 ...
使用微信扫码将网页分享到微信 赶在放假前,支棱起来的国产 AI 大模型厂商井喷式发布了一大堆春节礼物。 前脚 DeepSeek-R1 正式发布,号称性能对标 ...
中国的 OpenAI,出现了。 对标 OpenAI o1 正式版的国产大模型来了! 1 月 20 日晚,DeepSeek(深度求索)公司发布推理模型 DeepSeek-R1 正式版,同步开源 ...
英国《金融时报》1月25日文章,原题:中国小型人工智能初创公司深度求索如何震惊硅谷本周,中国一家人工智能(AI)实验室发布尖端模型的 ...
IT之家1 月 28 日消息,就在北京时间今日凌晨,DeepSeek 宣布开源全新的视觉多模态模型 Janus-Pro-7B,其在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。 Janus-Pro 是一种创新的自回归框架,实现多模态信息的统一理解与生成。与以往的方法不同 ...
一家中国人工智能(AI)公司的程序员使用不那么先进的芯片做成了几乎可以匹敌美国对手的产品,这让硅谷惊叹不已。 根据一项热门排名,中国公司DeepSeek的AI模型在性能方面已跃居全球前十,这暗示着美国政府的出口限制或许难以阻止中国AI技术的快速发展。
这一研究可能会对模型推理训练后续的范式产生深刻影响。 时隔不到一个月,DeepSeek又一次震动全球AI圈。 去年 12 月,DeepSeek推出的DeepSeek-V3在全球AI ...