StyleDrop：谷歌可以改变图像风格的全新人工智能工具

网贝WebBay • 2023年06月8号 12:57 am • 人工智能 • 阅读 600

谷歌的新人工智能工具 StyleDrop 允许用户立即改变图像的外观。它使用深度学习分析重要属性，并在不更改内容的情况下进行文体修改。您现在可以轻松调整照片，而无需手动编辑它们。这是 AI 图像编辑的重大进步。

什么是 Styledrop

谷歌最近推出了 StyleDrop，这是一种新的人工智能工具，可以让用户立即改变图像的外观。StyleDrop 使用深度学习模型分析图像并识别其重要品质。然后它利用这些数据来改变图像的外观而不改变底层内容。这表明您不需要手动编辑图像来更改它们的外观。

StyleDrop 已经显示出一些惊人的影响，尽管仍处于测试阶段。例如，StyleDrop 可用于将人物快照变成卡通或将风景图像变成绘画。得益于一种名为 StyleDrop 的新颖工具，我们编辑照片的方式可能会完全改变。

StyleDrop的训练过程

StyleDrop 培训程序的有效性是其秘诀。要学习新风格，首先要微调一些可训练的网络特征。然后通过使用人工或自动反馈的迭代训练不断提高模型的质量。由于反复的训练过程，该模型能够生成一系列准确再现所需风格的照片。

选择高质量图像

在训练过程中，StyleDrop根据输入图像创建多个图像。为确定最佳图片，Google 采用 CLIP 分数或用户评论。高质量图像是指在不复制其内容的情况下改善原始图像外观的图像。这种仔细的选择确保只有最好的图像用于进一步的训练。

数分钟内快速出结果

StyleDrop 的速度是其最令人印象深刻的功能之一。即使有人工反馈，整个过程也持续不到三分钟。StyleDrop 非常有效，因为它只需要少量照片进行迭代训练，这与其他风格迁移技术不同。根据谷歌团队的说法，StyleDrop 的表现优于竞争策略，包括Dreambooth、LoRA、Imagen 中的文本反转和稳定扩散。

程式化的文本到图像生成

通过使用单个模型图片从文本提示创建优质图像。在训练和生成过程中，该系统将自然语言风格描述符添加到内容描述符中。该模型开发了创建与文本内容和预期艺术风格相匹配的图像的能力，提供了一种灵活的方法来生成风格文本到图像的转换。

程式化字符渲染

使用单个参考图像生成一致的字母图像。在训练和生成过程中，该系统将自然语言风格描述符添加到内容描述符中。合成具有所需样式的字母由 StyleDrop 完成。它提供了一种有效的方法来创建具有有趣和多样设计的字母图像。

与您的造型助理协作

使用您自己的品牌材料轻松培训，并以您的个人方式快速创建概念。通过向内容描述符添加自然语言风格描述符，这种用户友好的方法使训练和生成变得简单。通过利用您品牌的资源，StyleDrop 可以快速创建符合您愿景的图像，促进有效的构思和原型制作过程。

与扩散模型微调的比较

将 Muse 上的 StyleDrop 与其他基于扩散的技术（如 Imagen 和 Stable Diffusion 模型）进行比较，它在风格调整方面表现出更高的性能。Muse 上的 StyleDrop 是一种基于令牌的离散视觉转换器。Muse 的架构和 Style Drop 的文本到图像创建功能协同工作，可以生成令人信服的出色风格化图片。这一发展展示了 Style Drop 如何有效地扩展计算机视觉环境中风格迁移方法的能力。