搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
腾讯网
4 天
LLM2CLIP:使用大语言模型提升CLIP的文本处理,提高长文本理解和跨 ...
在人工智能迅速发展的今天,多模态系统正成为推动视觉语言任务前沿发展的关键。CLIP(对比语言-图像预训练)作为其中的典范,通过将文本和视觉表示对齐到共享的特征空间,为图像-文本检索、分类和分割等任务带来了革命性突破。然而其文本编码器的局限性使其在处理 ...
51CTO
10 天
LLM微调的关键要点:如何打造高效、可靠的AI模型 原创 精华
无论是文本生成、翻译、摘要,还是问答任务,LLM都表现出了强大的多功能性。然而,尽管这些模型在通用性能上表现出色,但在特定任务或领域(如医疗、法律等)中的表现却往往有所不足。这时,模型的微调(Fine-Tuning)就显得尤为重要。通过在特定领域的 ...
来自MSN
19 小时
斯坦福大学教授李飞飞团队:关于 2024 年人工智能发展报告总结
斯坦福大学教授李飞飞团队关于 2024 年人工智能发展报告总结。1. 核心信息在2024年,人工智能(AI)领域取得了显著的进展,但也面临着挑战。AI 在特定任务上超越了人类,如图像分类和语言理解,但在更复杂的任务上仍有局限。工业界在 AI ...
来自MSN
1 天
DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成
Janus团队 投稿自 凹非寺量子位 | 公众号 QbitAI 在多模态AI领域,基于预训练视觉编码器与MLLM的方法(如LLaVA系列)在视觉理解任务上展现出卓越性能。 而基于Rectified Flow的模型(如Stable Diffusion ...
7 天
NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强?北大、MIT团队 ...
而OpenAI o1在“慢思考”也就是生成Hidden COT的过程中,通过分析OpenAI官网给出的Hidden ...
腾讯网
22 天
基于PyTorch的大语言模型微调指南:Torchtune完整教程与代码示例
为了将预训练的LLM应用于特定领域或任务,通常需要在领域特定的数据集上对模型进行微调(Fine-tuning)。随着LLM规模和复杂性的不断增长,微调过程面临 ...
3 天
华人设计师贺苏与Azure AI Foundry:引领微软AI创新的幕后英雄
华人设计师贺苏与Azure AI Foundry:引领微软AI创新的幕后英雄,贺苏,设计师,微软,azure,foundry,产品设计 ...
GitHub
5 天
liaokongVFX/LangChain-Chinese-Getting-Started-Guide
他相比 fine-tuning 最大的优势就是,不用进行训练 ... 因为我们 OpenAI API 进阶,所以我们后面的范例使用的 LLM 都是以Open AI 为例,后面大家可以根据自己任务的需要换成自己需要的 LLM 模型即可。 当然,在这篇文章的末尾,全部的全部代码都会被保存为一个 ...
商业新知 on MSN
12 天
一个RAG与层次化Agent加持的落地案例
LLM-R框架用于生成维护方案的关键步骤 ... RAG在检索阶段使用BERT编码器进行最大内积搜索(MIPS),以选择相关的文本块用于生成输出。 LORA-KR损失(Supervised Fine-Tuning of LORA-KR loss): ...
红板报 on MSN
3 天
AI模仿人类看漫画,视频大模型时序定位能力新SOTA
NumPro团队 投稿量子位 | 公众号 QbitAI 用看漫画的方式,大幅提升视频大模型时序定位能力! 方法名为NumPro,无需训练,通过数字视觉提示就能增强。 就像漫画中用编号的画格引导读者按顺序理解故事,将视觉内容与清晰的时间线联系起来一样。
51CTO
27 天
免训练大模型知识编辑,吸收新数据更高效|EMNLP'24
本文方法的可行性得到了P-Tuning等先前工作的支持,该工作证明了训练连续提示嵌入可以提高LLM在下游任务上的性能有效性。 在RECIPE中,研究人员将每个知识陈述的编辑视为一项小任务,没有为每个小任务微调特定的提示编码器,而是通过训练生成连续提示的 ...
3 天
DeepSeek团队推出JanusFlow模型:1.3B参数实现视觉理解与生成统一
在人工智能飞速发展的今天,多模态AI技术正逐渐成为研究的热点。近日,来自DeepSeek、北京大学、香港大学及清华大学等多个团队合作推出的JanusFlow模型,无疑为该领域带来了新的突破。JanusFlow,以其1.3亿参数的规模,将视觉理解与生成能力有效整合,展现出卓越的性能,其成果也在学术界和工业界引起了广泛关注。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈