Meta 最近宣布计划向学术界提供对 I-JEPA 特定组件的访问权限,这是一种突破性的人工智能 (AI) 模型。根据 Meta 的说法,I-JEPA 是 AI 技术的重大进步,因为它具有类似人类的技能,并且在正确解释和完成不完整照片方面优于以前的模型。Meta 的这一行动旨在通过允许科学家直接研究 I-JEPA 的可能性来鼓励未来的人工智能研究和开发。
I-JEPA 通过使用有关世界的背景知识来填充缺失的图像片段。这种方法不同于其他仅依赖于附近像素的生成式 AI 模型。Meta 认为,这种方法使 I-JEPA 更加准确,并且不太可能出错,例如手上有多余的手指。
Meta 计划通过其开源研究计划向研究人员提供 I-JEPA。这将允许研究人员使用 I-JEPA 开发新的计算机视觉应用程序。一些潜在的应用包括图像恢复、图像编辑和图像生成。
Meta 相信 I-JEPA 有可能彻底改变计算机视觉并开辟新的应用途径。该公司期待看到研究人员如何使用 I-JEPA 开发新的创新产品。
I-JEPA背后的概念是什么?
与人类类似,I-JEPA(联合嵌入预测架构)通过静静观察来了解世界的背景信息。此信息被编码为数字表示形式,以后可以访问。然后,该模型通过使用同一输入的其他部分的表示来预测输入部分(例如文本或图像)的表示。这与其他生成式 AI 模型不同,后者通过扭曲或删除部分输入来学习。
I-JEPA 的方法有几个优点。首先,它允许模型更有效地学习,因为它不必在每次收到新输入时都从头开始。其次,它允许模型生成更真实和准确的输出,因为它不限于输入中明确存在的信息。
I-JEPA 具有广泛的应用潜力,包括图像补全、文本生成和机器翻译。
Meta 的 AI 模型比其他模型好在哪里?
根据 Meta 的说法,竞争的生成式 AI 模型试图填补图像中缺失的每一点信息,即使这些信息是无关紧要的。这可能会导致错误,例如在手上添加额外的手指。
另一方面,I-JEPA 不受此问题的影响。它通过使用消除不必要的“像素级细节”的“抽象预测目标”来猜测丢失的数据。这使 I-JEPA 能够预测有关图像中看不见的部分的“更高级别”信息,而不仅仅是像素级细节。
例如,如果图像被部分遮挡,I-JEPA 可以预测隐藏的对象是什么,即使对象的细节不可见。这是因为 I-JEPA 不限于图像中明确包含的信息。它还可以利用其全球知识来填补空白。
I-JEPA 预测更高级别信息的能力使其比其他生成式 AI 模型具有相当大的优势。它提高了 I-JEPA 的准确性和真实性,并允许它用于更广泛的应用程序。
I-JEPA 通过多项测试
Meta 的 I-JEPA 计算机视觉模型在各种基准测试中优于其他模型,并且计算效率更高。I-JEPA 还需要比其他模型更少的微调,使其成为用于计算机视觉任务的更通用、更高效的工具。
Meta 的开源研究
Meta 通过积极发布其内部研究实验室的开源项目,始终如一地表明其致力于推进人工智能 (AI) 研究。Meta 的首席执行官马克扎克伯格认为,共享研究模型对于推动创新、改进安全措施和降低成本至关重要。通过促进 AI 行业内的协作,Meta 旨在引领 AI 开发并利用其他组织取得的进步。
Meta 基于人工智能的消费产品
Meta 不仅在扩展 AI 模型,还在其消费产品中实施生成 AI 功能。他们推出了用于创建图像背景的广告工具,以及一款能够根据文本建议更改用户照片的 Instagram 产品。这些独特的应用程序突出了 Meta 致力于改善用户体验并最大限度地发挥 AI 在日常交互中的作用。
结论
Meta Platforms 的“类人”AI 图片生成模型 I-JEPA 的发布迎来了计算机视觉功能的新时代。I-JEPA 的创新方法可以填补缺失的图像元素并提供出色的性能,有望在广泛的领域开辟无限的可能性。Meta 希望通过分享他们的发现和鼓励合作来推动行业向前发展,同时解决安全问题并优先考虑用户体验。随着 Meta 不断突破极限,AI 驱动的图像制作的未来比以往任何时候都更加光明。
原创文章,作者:网贝WebBay,如若转载,请注明出处:https://www.webbay.cn/meta-launches-i-jepa-a-human-like-ai-image-creation-model