大家好!作为科技时代的博主,今天我要为大家介绍谷歌最新推出的AI图像生成器——Imagen AI。与其他软件不同的是,Imagen AI为我们带来了全新的体验。仅凭文本描述,您可以释放无限的想象力,创造出令人惊叹的图像。
什么是谷歌Imagen AI?
Imagen AI是谷歌开发的文本到图像扩散模型。它成为了增长中的AI文本到图像生成器家族中的一员,包括DALL-E 2、Wombo的Dream和Stable Diffusion等,这些模型都能根据文本描述创造出令人惊叹的图像。
通过名为AI Test Kitchen的应用程序,谷歌发布了Imagen AI。如果你之前还没有听说过它,那么现在是时候来体验一番了。AI Test Kitchen是谷歌在向公众发布之前测试不同人工智能项目的地方。接下来我将告诉大家如何访问Imagen AI。
Imagen AI的训练数据集是LAION-400M。并非所有的人工智能公司都会公开这些信息,DALL-E 2可能是其中最为著名的一个例子。
使用数据集也是一个备受争议的话题,其中一部分原因是数据集中的图像是从互联网上抓取的数百万张图片。艺术家们对人工智能公司在使用图像或艺术品来训练其模型之前没有征得所有者同意一事进行了批评。
如果你对自己的图像使用情况感到担忧,可以查询你的图像是否被用于训练AI模型,并选择退出。
鉴于这些因素,谷歌小心翼翼地发布了Imagen AI,首先通过测试版访问。您可以通过AI Test Kitchen应用程序亲自体验。从Imagen AI创建的图像库中可以看出,它的优势在于创造逼真的输出。你可以亲自去Imagen研究页面查看这些图像。
与DALL-E或Midjourney等其他软件相比,Imagen AI有何不同?
Imagen AI的独特之处在于它专注于生成两个具体的输出,分别是City Dreamer和Wobble。
City Dreamer有点像模拟城市游戏,你可以建造建筑物来构建城市。使用Imagen AI,你可以描述像是用奶酪制成的房子等物体,它会将你的描述渲染成图像。
另一方面,Wobble会根据你的描述生成独特的生物,它们看起来有点像皮克斯动画中的角色(比如《怪兽公司》)。你可以玩一些有趣的东西,例如选择生物穿什么样的衣服,或者生物是由什么材料制成的。
从技术角度来看,谷歌在研究AI文本转图像系统时发现,使用更大的语言模型是创建高质量图像的关键。这样能够更接近文本描述的图像。
然而,由于Imagen AI仅限于创建建筑物或生物,所以很难与DALL-E或Stable Diffusion等软件进行直接比较。至少目前是如此。如果你还没有尝试过类似的比赛,请查看如何使用DALL-E从文本创建图像。
如何在测试版中体验Imagen AI?
目前,Imagen AI仅在测试版中通过AI Test Kitchen应用程序提供给一小部分用户。这为谷歌提供了一个宝贵的机会,可以在该模型成为主流之前获得用户的反馈并解决其中的任何问题。