Meta 上周宣布推出一种人工智能 (AI),能够使用“常识”完成图像。与其他可用工具不同,Meta 的模型不仅限于比较像素,还可以包含基于“关于世界的先验知识”的抽象表示。
具有常识的人工智能
据该公司称,这种功能使该模型能够以比市场上其他工具更高的精度完成图像。
这项创新技术的名称是图像联合嵌入预测架构(I-JEPA),它基于 Meta 首席人工智能科学家 Yann LeCun 的愿景。
正如该公司官方博客所公布的那样,这一举措背后的基本理念是“创造能够学习世界如何运作的内部模型的机器”。像 ChatGPT 这样的系统是使用“监督”学习方法进行训练的,该方法涉及使用大量标记数据。
然而,由Facebook、Instagram和 WhatsApp 的母公司 Meta 开发的 I-JEPA采用了不同的方法。I-JEPA 不使用标记数据,而是直接分析图像或声音,这就是所谓的自我监督学习。
培训先验知识
梅塔解释说,这种方法的原理是,通过反复向幼儿展示牛的图片,他们最终会学会识别他们看到的任何牛。同样,I-JEPA可以通过比较和分析来识别表征,而不需要标记数据。
该公司分享了一个例子,其人工智能能够填补不同动物和风景图像中的空白。使用上下文和语义识别,该模型能够识别丢失的部分,例如狗的头或鸟的腿。
Yann LeCun 在 2022 年 2 月的一篇文章中解释说,人类和动物都能够通过观察获得有关世界如何运作的大量先验知识,只需相对少量的互动且无需监督。
勒昆认为,这种积累的知识可以构成我们通常所说的“常识”的基础。正是这种“常识”指导人工智能模型理解什么是可能的、可能的或不可能的。
比其他人工智能更高的精度
为此,Meta 声称其 I-JEPA 模型避免了其他 AI 生成的图像中的常见错误,例如手部有超过五个手指。由于元模型能够理解上下文并使用先验知识,因此在生成完整图像方面实现了更高的准确性。
基于标记数据集的人工智能 (AI) 系统(例如 ChatGPT)对于所接受训练的特定任务通常非常有效。然而,Meta 在其 2021 年的一份研究报告中强调,“不可能给世界上的一切都贴上标签”。
此外,有些任务根本没有足够的可用标记数据。Meta 认为,如果人工智能系统能够在训练之外获得对现实的更深入的理解,它们将变得更加有用,并最终更接近人类智能。
2021 年,Meta 将人工智能中实现“常识”比作发现暗物质。该公司相信,这种类型的人工智能能够更快地学习、计划如何处理复杂的任务,并轻松适应不熟悉的情况。对于 Meta 来说,达到“常识”代表着一个重要的里程碑,它将把人工智能的潜力推向更接近人类智能的水平。