LLM Tuning - 搜索 News

LLM2CLIP：使用大语言模型提升CLIP的文本处理，提高长文本理解和跨 ...

在人工智能迅速发展的今天，多模态系统正成为推动视觉语言任务前沿发展的关键。CLIP（对比语言-图像预训练）作为其中的典范，通过将文本和视觉表示对齐到共享的特征空间，为图像-文本检索、分类和分割等任务带来了革命性突破。然而其文本编码器的局限性使其在处理 ...

51CTO10 天

LLM微调的关键要点：如何打造高效、可靠的AI模型原创精华

无论是文本生成、翻译、摘要，还是问答任务，LLM都表现出了强大的多功能性。然而，尽管这些模型在通用性能上表现出色，但在特定任务或领域（如医疗、法律等）中的表现却往往有所不足。这时，模型的微调（Fine-Tuning）就显得尤为重要。通过在特定领域的 ...

来自MSN19 小时

斯坦福大学教授李飞飞团队：关于 2024 年人工智能发展报告总结

斯坦福大学教授李飞飞团队关于 2024 年人工智能发展报告总结。1. 核心信息在2024年，人工智能（AI）领域取得了显著的进展，但也面临着挑战。AI 在特定任务上超越了人类，如图像分类和语言理解，但在更复杂的任务上仍有局限。工业界在 AI ...

来自MSN1 天

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

Janus团队投稿自凹非寺量子位 | 公众号 QbitAI 在多模态AI领域，基于预训练视觉编码器与MLLM的方法（如LLaVA系列）在视觉理解任务上展现出卓越性能。而基于Rectified Flow的模型（如Stable Diffusion ...

7 天

NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强？北大、MIT团队 ...

而OpenAI o1在“慢思考”也就是生成Hidden COT的过程中，通过分析OpenAI官网给出的Hidden ...

腾讯网22 天

基于PyTorch的大语言模型微调指南：Torchtune完整教程与代码示例

为了将预训练的LLM应用于特定领域或任务,通常需要在领域特定的数据集上对模型进行微调(Fine-tuning)。随着LLM规模和复杂性的不断增长,微调过程面临 ...

3 天

华人设计师贺苏与Azure AI Foundry：引领微软AI创新的幕后英雄

华人设计师贺苏与Azure AI Foundry：引领微软AI创新的幕后英雄,贺苏,设计师,微软,azure,foundry,产品设计 ...

GitHub5 天

liaokongVFX/LangChain-Chinese-Getting-Started-Guide

他相比 fine-tuning 最大的优势就是，不用进行训练 ... 因为我们 OpenAI API 进阶，所以我们后面的范例使用的 LLM 都是以Open AI 为例，后面大家可以根据自己任务的需要换成自己需要的 LLM 模型即可。当然，在这篇文章的末尾，全部的全部代码都会被保存为一个 ...

商业新知 on MSN12 天

一个RAG与层次化Agent加持的落地案例

LLM-R框架用于生成维护方案的关键步骤 ... RAG在检索阶段使用BERT编码器进行最大内积搜索（MIPS），以选择相关的文本块用于生成输出。 LORA-KR损失（Supervised Fine-Tuning of LORA-KR loss）： ...

红板报 on MSN3 天

AI模仿人类看漫画，视频大模型时序定位能力新SOTA

NumPro团队投稿量子位 | 公众号 QbitAI 用看漫画的方式，大幅提升视频大模型时序定位能力！方法名为NumPro，无需训练，通过数字视觉提示就能增强。就像漫画中用编号的画格引导读者按顺序理解故事，将视觉内容与清晰的时间线联系起来一样。

51CTO27 天

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

本文方法的可行性得到了P-Tuning等先前工作的支持，该工作证明了训练连续提示嵌入可以提高LLM在下游任务上的性能有效性。在RECIPE中，研究人员将每个知识陈述的编辑视为一项小任务，没有为每个小任务微调特定的提示编码器，而是通过训练生成连续提示的 ...

3 天

DeepSeek团队推出JanusFlow模型：1.3B参数实现视觉理解与生成统一

在人工智能飞速发展的今天，多模态AI技术正逐渐成为研究的热点。近日，来自DeepSeek、北京大学、香港大学及清华大学等多个团队合作推出的JanusFlow模型，无疑为该领域带来了新的突破。JanusFlow，以其1.3亿参数的规模，将视觉理解与生成能力有效整合，展现出卓越的性能，其成果也在学术界和工业界引起了广泛关注。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果