Google 推出了最新版的 AI 文本生成图像工具 Imagen 3,目前已向美国用户开放。用户可以通过 Google 的 AI Test Kitchen 访问该工具。与之前的版本相比,Imagen 3 在细节、光照和减少干扰方面有了显著提升。
Google 最早在 5 月的 I / O 大会上宣布了这个升级版工具,但直到最近几天,该工具才通过 Google 的 Vertex AI 平台全面开放。上周,一些 Reddit 用户开始试用 Imagen 3,而 Google 也在周二发布了有关该工具的研究论文。
与其他 AI 图像生成器类似,Imagen 3 可以根据用户的提示生成详细的图像。用户还可以通过突出显示某个部分并描述需要更改的内容来编辑图像。
不过,该工具设有一些限制,例如不会生成公共人物(如泰勒·斯威夫特)或武器的图像。此外,尽管该工具不会直接生成受版权保护的角色形象,但用户可以通过描述来绕过这个限制,生成类似的角色图像。
我曾使用该工具生成了与音速小子(Sonic the Hedgehog)和马里奥(Mario)非常相似的图像,而我的同事则成功创建了类似米老鼠(Mickey Mouse)的角色。我还发现,它可以生成一些公司的标志,比如苹果(Apple)、梅西百货(Macy’s)、好时(Hershey’s)甚至 Google 的标志。
尽管这些限制较为灵活,Imagen 3 仍与 Elon Musk 旗下 X 平台上的 AI 图像生成器 Grok 形成鲜明对比。Grok 已被用来生成各种具有争议性的内容,包括与毒品、暴力相关的图像以及涉及公共人物的可疑行为。
然而,Google 的 AI 工具也遇到了一些问题。今年早些时候,Google 停止了让人们使用其 Gemini AI 聊天机器人生成图像的功能,因为用户发现它生成的图像在历史上并不准确。