Encoder - 搜索 News

作者 | 刘少腾 Text-to-Video 模型已展现出世界模拟器的潜力，这种潜力能革新传统视觉任务吗？近日，贾佳亚团队联手 Adobe 团队，用 GenProp（Generative Video Propagation）来给出答案。GenProp ...

4 天

贾佳亚团队联合Adobe提出GenProp，物体追踪移除特效样样在行

论文一作刘少腾，Adobe Research实习生，香港中文大学博士生（DV Lab），师从贾佳亚教授。主要研究方向是多模态大模型和生成模型，包含图像视频的生成、理解与编辑。作者Tianyu Wang、Soo Ye Kim等均为Adobe ...

腾讯网2 天

百川智能上线开源全模态模型Omni-1.5，称多项能力超GPT-4o mini

IT之家 1 月 26 日消息，百川智能今日宣布，Baichuan-Omni-1.5 ...

4 天

周光最新海外演讲：VLA的关键挑战，以及仿真数据的短板

1月22日，在第17届日本国际汽车工业技术展上，元戎启行CEO周光发表了一场演讲，对VLA模型（Vision Language Action Model，视觉语言动作模型）的特点进行了简要介绍，并宣布该公司已与某头部车企达成量产合作，共同推出搭载VLA模型的智能驾驶汽车，该车配备英伟达Thor芯片，将于今年投入消费者市场。 RoboX将本次周光的演讲内容进行了翻译和整理，供大家参考。高精地图就像 ...

6 天

2025人工智能五大变革，AI像空气一样无处不在

不可否认的是，在当今数字化浪潮的推动下，AI正以前所未有的速度改变着我们的生活、工作和社会结构。可以预见在2025年，AI领域将迎来一系列重大突破与改变，这些变革不仅源于技术的内在演进，也受到社会需求、环境和经济转型等外在因素的推动。

腾讯网5 天

直接设计目标属性材料！微软MatterGen模型重磅开源，用生成式AI重新 ...

近日，微软的 MatterGen 模型在 Nature 上正式见刊，印证了生成式 AI ...

小黑盒生活 on MSN7 天

VAE个人理解｜计算机如何生成图片

声明：本文旨在通过口头表达与直觉理解的方式，带大家了解什么是VAE：变分自编码器以及它具体干了啥，lz的理解可能并不准确，如果有误也请大家指出来什么是VAE？ Vae的全名是Variational Autoencoder，中文全名叫作变分 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果