Transformers模型 - 搜索 News

12 小时

DIFF ...

15 天

本文深入探讨Transformer模型中三种关键的注意力机制：自注意力、交叉注意力和因果自注意力。这些机制是GPT-4、Llama等大型语言模型（LLMs）的核心组件。通过理解这些注意力机制，我们可以更好地把握这些模型的工作原理和应用潜力。

再往后就是人工智能时代了。尽管“人工智能” （AI）这一术语早在计算机领域广泛应用，但直到2020年前后，它才在生物医药领域真正得到重视，这一变革的关键推动力是AlphaFold等突破性模型的问世。

新智元 on MSN4 天

新智元报道编辑：LRS【新智元导读】Transformer模型自2017年问世以来，已成为AI领域的核心技术，尤其在自然语言处理中占据主导地位。然而，关于其核心机制“注意力”的起源，学界存在争议，一些学者如Jürgen ...

13 天

在人工智能领域，Transformer作为一种革命性的技术架构，成为了大型语言模型（LLM）和各种语言处理应用的核心。自2017年被提出以来，Transformer不仅提升了自然语言处理（NLP）领域的创新性，还推动了智能写作、智能营销、智能对话等多 ...

Liquid AI对STAR的最初关注点是自回归语言建模，而传统的Transformer架构长期以来一直占据主导地位。在研究期间进行的测试中，Liquid AI研究团队展示了STAR生成架构的能力，其性能始终优于高度优化的 ...

2 天

此次 Liquid AI 获得由 AMD 领投的 2.5 亿美元融资，将进一步推动其技术研发和市场化进程。据 Liquid AI 联合创始人兼首席执行官 Ramin Hasani 透露，这笔资金将被用于扩大技术团队规模，并加速模型的行业落地。AMD ...

15 小时

Sora的设计灵感来源于大型语言模型（LLM），通过训练互联网规模数据来获得通用能力。大语言模型使用文本标记，而Sora则使用之前已被证明是用于视觉数据模型的有效表示的视觉“碎片/补丁”（patches）来达到类似效果。

15 小时on MSN

AlphaFold2的成功不仅标志着AI在生物学领域的重大突破，更预示着跨学科研究的无限可能。它能够在几天内预测出蛋白质的结构，而传统的实验方法可能需要数年时间和高昂的成本。这一突破迅速在科学界引起轰动，并被《自然》杂志誉为“将改变一切”的技术。

7 天

本文给出了一个十分有趣的发现：强大的 Mamba 模型与通常被认为性能不佳的线性注意力有着内在的相似性：本文用统一的公式表述了 Mamba 中的核心模块状态空间模型（SSM）和线性注意力，揭示了二者之间的密切联系，并探究了是哪些特殊的属性和设计导致了 ...

引言在生命科学的领域，DNA曾被誉为生命的“天书”，承载了生物体所有的遗传信息。然而，如何解读这本“天书”，从中提取关键的生物学信息，一直是科学界面临的巨大挑战。从基因表达到增强子活性，再到与疾病相关的遗传变异，这些复杂的分子表型背后隐藏着大量的规律 ...

13 天

近日,上海岩芯数智人工智能科技有限公司 (以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案, 这是国内首个非 Transformer 架构大模型通过备案。

一些您可能无法访问的结果已被隐去。