您的位置：首页 >新快讯 >

Nvidia 的 DiffUHaul AI 工具可以移动图像中的物体

发布时间：2024-12-04 14:49:17 编辑：公冶新广来源：

Nvidia 的研究人员发表了一篇关于新 AI 工具 DiffUHaul 的论文，该工具可以理解和移动图像中的物体，而无需改变其大小或背景。论文称，该工具“利用对局部文本到图像模型的空间理解来完成物体拖动任务。”

当前的文本转图像模型难以完成复杂的图像编辑任务，因为它们缺乏“空间推理”。DiffuHaul 通过将“空间推理”融入模型来解决此问题，使其能够跟踪图像中的对象，“无缝地”重新定位它们而不改变任何其他内容。

为了实现这一点，该工具在去噪步骤中屏蔽了对象，帮助它了解其位置并将其与背景分开。然后，它会插入原始图像和生成的图像之间的差异，以将对象放置在新位置而不触及背景。之后，原始图像中的更精细的细节和特征被移动到新图像以保持一致性。

免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

标签：