搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
12 小时
Differential Transformer:通过差分注意力机制提升大语言模型性能
DIFF ...
15 天
三种 Transformer 模型中的注意力机制介绍及 Pytorch 实现:从自注意力到 ...
本文深入探讨Transformer模型中三种关键的注意力机制:自注意力、交叉注意力和因果自注意力。这些机制是GPT-4、Llama等大型语言模型(LLMs)的核心组件。通过理解这些注意力机制,我们可以更好地把握这些模型的工作原理和应用潜力。
虎嗅网
15 小时
AI“入侵”生物医药史:从暴力破解到Transformer模型三部曲
再往后就是人工智能时代了。尽管“人工智能” (AI) 这一术语早在计算机领域广泛应用,但直到2020年前后,它才在生物医药领域真正得到重视,这一变革的关键推动力是AlphaFold等突破性模型的问世。
新智元 on MSN
4 天
LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先 ...
新智元报道 编辑:LRS【新智元导读】Transformer模型自2017年问世以来,已成为AI领域的核心技术,尤其在自然语言处理中占据主导地位。然而,关于其核心机制“注意力”的起源,学界存在争议,一些学者如Jürgen ...
13 天
揭秘AI大模型的基石:Transformer如何推动全球智能革命
在人工智能领域,Transformer作为一种革命性的技术架构,成为了大型语言模型(LLM)和各种语言处理应用的核心。自2017年被提出以来,Transformer不仅提升了自然语言处理(NLP)领域的创新性,还推动了智能写作、智能营销、智能对话等多 ...
腾讯网
10 小时
挑战Transformer!液态AI,了解一下
Liquid AI对STAR的最初关注点是自回归语言建模,而传统的Transformer架构长期以来一直占据主导地位。 在研究期间进行的测试中,Liquid AI研究团队展示了STAR生成架构的能力,其性能始终优于高度优化的 ...
2 天
Liquid AI获AMD领投2.5亿美元融资,用灵活高效的“液态”模型挑战Transformer
此次 Liquid AI 获得由 AMD 领投的 2.5 亿美元融资,将进一步推动其技术研发和市场化进程。据 Liquid AI 联合创始人兼首席执行官 Ramin Hasani 透露,这笔资金将被用于扩大技术团队规模,并加速模型的行业落地。AMD ...
15 小时
超级文生视频模型Sora正式来了!多模态训练数据是关键
Sora的设计灵感来源于大型语言模型(LLM),通过训练互联网规模数据来获得通用能力。大语言模型使用文本标记,而Sora则使用之前已被证明是用于视觉数据模型的有效表示的视觉“碎片/补丁”(patches)来达到类似效果。
15 小时
on MSN
AI如何重塑生物医药领域?从AlphaFold到Transformer模型的科技飞跃
AlphaFold2的成功不仅标志着AI在生物学领域的重大突破,更预示着跨学科研究的无限可能。它能够在几天内预测出蛋白质的结构,而传统的实验方法可能需要数年时间和高昂的成本。这一突破迅速在科学界引起轰动,并被《自然》杂志誉为“将改变一切”的技术。
7 天
从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型
本文给出了一个十分有趣的发现:强大的 Mamba 模型与通常被认为性能不佳的线性注意力有着内在的相似性:本文用统一的公式表述了 Mamba 中的核心模块状态空间模型(SSM)和线性注意力,揭示了二者之间的密切联系,并探究了是哪些特殊的属性和设计导致了 ...
腾讯网
16 天
Nature Methods | 核苷酸转换模型(Nucleotide Transformer, NT):解锁基因组 ...
引言在生命科学的领域,DNA曾被誉为生命的“天书”,承载了生物体所有的遗传信息。然而,如何解读这本“天书”,从中提取关键的生物学信息,一直是科学界面临的巨大挑战。从基因表达到增强子活性,再到与疾病相关的遗传变异,这些复杂的分子表型背后隐藏着大量的规律 ...
13 天
RockAI国内首个「非Transformer架构大模型」Yan通过网信办备案
近日,上海岩芯数智人工智能科技有限公司 (以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案, 这是国内首个非 Transformer 架构大模型通过备案。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈