Attention - 搜索 News

1 个月

英伟达提出全新Star Attention，10倍加速LLM推理！登顶Hugging Face论文榜

【新智元导读】大模型如今已具有越来越长的上下文，而与之相伴的是推理成本的上升。英伟达最新提出的Star Attention，能够在不损失精度的同时，显著减少推理计算量，从而助力边缘计算。为此，已有多种优化方案提出，例如Flash ...

PyTorch FlexAttention技术实践：基于BlockMask实现因果注意力与变长序列处理

本文介绍了如何利用torch 2.5及以上版本中新引入的FlexAttention和BlockMask功能来实现因果注意力机制与填充输入的处理。

14 天

国网经济技术研究院推出CNN-Attention技术，革新配电网数据预测

金融界2024年12月21日消息，随着电力系统的智能化、数字化趋势不断加速，配电网的管理和优化显得愈发重要。近期，国网经济技术研究院有限公司申请了一项名为“一种基于CNN‑Attention的配电网伪量测数据预测方法及系统”的专利，旨在解决配电网数据 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果