2023年AI图像生成的天花板在哪里?
AI工具评测

AI 图像生成工具已经轰动了一年多。无论您是否浏览社交媒体、观看黄金时段的新闻节目或阅读杂志,AI 生成的图像都随处可见。这些图像无处不在的原因很简单:制造它们所需的工具现在已经非常先进,而且可以开放使用。如果您想体验其中的乐趣,或者向您的业务工作流程添加一些人工智能支持的功能,这篇文章中的应用程序将是您最好的选择。

自2015年Google Deep Dream以来,我一直在关注着 AI图像生成工具的发展。这也是大家真正开始思考这些工具的时间,看到它们取得了多么大的进展,我也感到非常兴奋。避开讨论训练数据的艺术价值和版权侵权等棘手问题,我们都不能忽略这样一个事实:这些AI 图像生成工具现在可以根据文本提示产生令人惊艳的作品。花几个小时来体验一下这些文本到图像的人工智能应用程序是值得的——即使只是为了从技术角度欣赏它们。

推荐产品

公司产品名称特点
OpenAIDALL·E 2操作简单
MidjourneyMidjourney图片质量高
Stability AIDreamStudio(Stable Diffusion)可控性好
AdobeFirefly (Photoshop)图像整合方便

它们是如何工作的?

这些AI 图像生成工具都能够接受文本提示,并尽可能将其转换为匹配的图像。这为我们带来了无限的可能性,因为您的提示可以是任何事情——从“一幅中国男子骑着马穿过枫树林的印象派油画”,到“一只毛茸茸的爱尔兰猎狼犬在享受着传统酒吧里的一杯啤酒”,甚至可以是“月球上放羊的照片”。

2023年AI图像生成的天花板在哪里?

说真的,唯一真正的限制是你的想象力、AI 图像生成工具理解你的提示的能力,以及为阻止坏人用人工智能生成的暴力或其他不合法内容充斥互联网而设置的内容过滤器。

大多数AI 图像生成工具的工作方式非常相似。数十亿的“图像-文本对”被用来训练神经网络(这是一种模仿人类大脑的计算机算法)了解事物的本质。通过让它处理无数的图像,它可以了解什么是狗、红色、画风以及其他一切事物。完成此操作后,您就拥有了一个几乎可以解释任何提示的人工智能,尽管需要进行设置才能准确地完成此操作。

下一步是渲染人工智能生成的图像。最新一代的AI 图像生成工具使用 diffusion 来实现这一点。本质上,他们从不规则的图像开始,然后通过一系列步骤对其进行编辑,以匹配他们对提示的解释。这有点像仰望多云的天空,发现一朵看起来有点像狗的云,然后打个响指让它变得越来越像狗。

2023年AI图像生成的天花板在哪里?

文本到图像生成工具的功能确实让人惊艳,但它们现在还不太可能让您完全脱离拍摄照片。如果你只是想使用一张图片作为论坛文章的标题图像,使用AI 图像生成工具也许比在图片库里寻找一个更省时。

为什么推荐它们?

在过去 18 个月里,AI 图像生成工具非常火爆是有原因的。因为之前它们的性能很糟糕,让人大失所望。虽然它们背后的技术非常先进,至少对于研究科学家来说是这样,但是它们输出的图像却并不尽如人意。即使 DALL·E 在 2021 年刚推出的时候,大家也只是觉得新奇而已,不是一个能够震惊世界的创新产品。

在这篇文章中,我们选择了四个最知名的应用程序——DALL·E 2、Midjourney、Stable Diffusion 和 Adob e Firefly。虽然它们出现在这个列表中的原因各不相同,但它们也是唯一真正符合我们的入选标准的应用程序。原因有两点:

  • 它们是真正意义上的AIGC。
  • 它们生成的图片质量都是有目共睹的。

自从 DALL·E 2、Midjourney 和 Stable Diffusion 推出以来,我一直在使用它们,并且十多年来一直在使用 Photoshop,因此我对它们的工作原理以及各种优缺点都非常熟悉。

需要注意的是:这些工具在技术上都处于测试阶段,我认为它们会在很长的一段时间里继续保持这种状态。虽然 AI 图像生成工具每天都在更新迭代,但要可靠地融入工作流程,还有很长的路要走。

另外,尽管这些工具目前处于测试阶段,但它们是收费的。考虑到创建人工智能图像所需的计算负载非常大,这是可以理解的,但这也意味着它们是有使用门槛的。

一起来认识下它们吧!

DALL·E 2 

2023年AI图像生成的天花板在哪里?

DALL·E 2可以说是AI图像生成领域最知名的工具之一,它是第一个由人工智能驱动的图像生成器,而且能够创建非常有趣的图像。尽管第一并不一定意味着最好,但 DALL·E 2 有自己优点。

最重要的是,DALL·E 2 使用起来非常简单。只需要输入您想要查看的内容,单击“生成”,几秒钟之内,有四种人工智能生成的图像供您选择。虽然 DALL·E 2 不再免费试用,但它价格不算太高,15美元有115个积分——每个提示大约0.13美元,或者每个图像0.0325美元——仍然值得考虑。

除了简单的使用方法之外,DALL·E 2 还具有强大的功能。它的图像编辑器(也处于测试版)使您可以添加其他生成的框架,因此您可以扩展图像,无论您是使用 DALL·E 2 生成图像还是上传图像。这种技术称为外绘画,意味着您可以创作更多的人工智能艺术作品。此外,还有一个橡皮擦功能,您可以删除图像的某些部分并用人工智能生成的元素替换它们(这种技术称为图像修复)。

除了 DALL·E 2 Web 应用程序之外,OpenAI 还提供 API,允许开发人员构建与 DALL·E 2 集成的应用程序。因此,您可以将 DALL·E 2 连接到您使用的任何其他应用程序,您可以使用它来激发您的艺术灵感。

Midjourney

2023年AI图像生成的天花板在哪里?

在所有AI图像生成工具中,Midjourney 产生的图片是我最喜欢的。它创建的图像看起来更加连贯,具有更好的纹理和颜色,结果更加有趣且视觉上更有吸引力。人物和物体看起来比其他AI图像生成工具更加逼真和自然,甚至它还是第一个赢得艺术比赛的AI图像生成工具。

不过 Midjourney 也有缺点:它的测试版只能通过 Discord 访问。您可以加入 Midjourney 的 Discord 服务器或把 Midjourney 机器人加入您的服务器,这样您才能通过输入提示生成图像,也可以下载、升级、重新编辑等其他操作。

默认情况下,您生成的每张图像都会公开发布在 Midjourney 的 Discord 中。它提供了社区服务,但这也意味着任何人都可以看到您正在创建的内容。虽然对于艺术家来说不一定是坏事,但如果您想将 Midjourney 用于商业目的,这可能会破坏交易。

不过也不用太过担心,Midjourney 的帮助文档非常好,可以引导您完成入门及其所有高级功能。例如不同的模型版本、放大图像、混合多个图像以及使用不同的参数来控制事物。一旦您了解了不同的选项,您可以获得的结果确实令人惊艳。

由于试用的人数过多,Midjourney 的免费试用目前已暂停,只会偶尔恢复。如果您错过了免费试用期,基础定价为10美元/月,每月提供3.3小时的GPU时间,或大约200张图像。您还可以选择购买额外的GPU时间,并且可以将图像用于商业用途。

Stable Diffusion

2023年AI图像生成的天花板在哪里?

与 DALL·E 2 和 Midjourney 不同,Stable Diffusion 是开源的。这意味着任何有相关技术的人都可以下载它并在自己的计算机上运行它。这还意味着您可以针对特定目的训练和微调模型。几乎所有使用人工智能生成艺术肖像、历史肖像、建筑渲染和其他一切的服务都使用这种方式的 Stable Diffusion。如果您有能力并想用 AI 构建一些很棒的东西,那么Stable Diffusion是现在最好的方法。甚至还有一个 API和一个 ClipDrop 的服务,可以将其分解为一系列工具。

但 Stable Diffusion 也可以在DreamStudio应用程序中使用,该应用程序由其开发人员Stability AI构建。(与此文章中的其他产品一样,它仍处于测试阶段。)

DreamStudio 使您能够对使用 AI 生成图像的各个方面进行大量操作。当您输入提示时,还可以调整最终图像的大小,它与您给出的提示的匹配程度、扩散模型需要多少步以及生成多少图像都可以设置。您还可以选择它使用的算法版本(最新的是 SDXL 0.9),甚至输入特定的种子,以便获得可重复的结果(它们默认是随机生成的)。DreamStudio 还具有内绘画和外绘画功能,不过您需要使用 Chrome 来访问它们,而且更多编辑功能即将推出。

DreamStudio 采用信用系统。注册后,您将获得 25 个免费积分,这大约可以在默认设置下的使用 30 个提示或 120 个图像。使用更强大的模型,生成更大或更多的图像,或者通过更多步骤迭代它们都会更快地用完你的积分。积分使用完后,您需要自己购买,起价为 10 美元 1,000 个积分。

总而言之,DreamStudio 和 Stable Diffusion 为您提供了对整个 AI 图像生成过程的最大程度的定制和调整。它们使您能够按照自己的意愿深入了解 AI,甚至构建您自己的 AI 服务。

如果您用完了免费积分,也可以通过 ClipDrop免费尝试相同的Stable Diffusion模型,但是它们会带有水印,并且您的功能权限会有限制。

Adobe Photoshop(Firefly)

2023年AI图像生成的天花板在哪里?

尽管 Adobe 公司在应用程序中构建 AI 工具已有超过 15 年的历史,但直到今年才发布了文本到图像生成器(至少处于测试版)。您可以在网络上免费或通过 Adobe Express 试用它,但它在最新的 Photoshop Beta 版中效果最佳,您需要成为 Creative Cloud 订阅者才能使用。

Adobe 的 AI 模型名为 Firefly,它除了能够根据详细的文本描述生成新图像外,还可以根据文本提示创建文本效果(想象一下,用看起来像面包制成的字母写的“TOAST”一词)、重新着色矢量图稿或将人工智能生成的元素添加到图像中。您可以通过网络应用程序测试这些功能,但 Firefly 的最后一项功能最为突出。

纯粹作为一个文本到图像生成器,Firefly 的结果可能相对不稳定。对于某些提示,它可以媲美 DALL·E 2 或Stable Diffusion,但对于有些提示,效果就不是很理想。另一方面,它与行业标准图像编辑器 Photoshop 的集成才是大杀器。

在Photoshop中称为生成填充。当您使用 Photoshop 的常规工具来选择图像的某个区域,然后只需单击按钮并输入提示,就可以将其替换为其他内容。最重要的是,生成填充可以理解图像的上下文。在上面的屏幕截图中,您可以看到 Photoshop 已匹配我使用生成填充添加的城堡的景深模糊和颜色。它看起来很契合。

尽管 DALL·E 2 和 Stable Diffusion 已经开启了有关图像生成 AI 的市场,但 Adobe 的 Firefly 真正预示了即将发生的事情。这是一种很快就会提供给每天使用 Adobe 应用程序的数百万专业人士的工具。

需要注意的是,虽然 Firefly 已经处于测试阶段,但它生成的图像不能用于商业目的。

它们会如何发展?

人工智能图像生成是一个快速发展的领域,看到不同的引擎在一年的时间里取得了如此大的进步,真是令人难以置信。现在无数的人在使用它们,开发人员正在获取大量数据来进一步训练和完善模型,因此我们可以预期产品将会不断地迭代。我们也可能很快就会看到一些新的同类型产品发布。

分享到:
0
0

发表回复

猜你喜欢
近期文章
利用生成式AI推动创新 美国本田这样做
东方Project-个人AI绘画合集-8(更新至2024-2-14)
AI绘画(动物科普)—兔狲
12.28乾坤AI日报 — 2023年度十大科技名词发布
12.26乾坤AI日报 — OpenAI公布2024年计划
近期评论
ai-world发表在
AI赛博机车—借助SD技术赚取第一桶金
mulei77发表在
AI赛博机车—借助SD技术赚取第一桶金
An Vũ( CEO AGBIG GROUP)发表在
12.25乾坤AI日报 — 苹果正购买新闻采集权用于训练生成式 AI