广受欢迎的生成图像服务公司Leonardo AI周一宣布发布其新模型Leonardo Phoenix。此次发布之前,Stability AI推出了其SD3模型,该模型提供了令人印象深刻的即时遵守和文本生成功能,但因其许可条款引发的争议和对人体解剖学的令人困惑的误解而受损。
毫不奇怪,《莱昂纳多》的创作者们对他们的最新作品赞不绝口。
他们在一封电子邮件公告中写道:“我们不想夸大这一点,但我们真的相信,在忠实遵循用户提示的能力方面,Phoenix是领先的模型之一。”人工智能模型的更新伴随着莱昂纳多网站的大修。
Leonardo Phoenix模型被吹捧为提供增强的即时粘性、图像中清晰准确的文本、卓越的图像质量和更大的创造性控制。更新还引入了“提示增强”和“人工智能编辑”等新功能,帮助用户自动将基本提示转换为更详细的提示,并指示人工智能分别以特定方式更改提示。
然而,由于新的体系结构,一些以前可用的功能,如图像引导、元素和照片现实,尚未得到支持。同样值得注意的是,新型号的代币成本暂时较低,但下周一将恢复到标准定价。
Ideogram荣誉
虽然稳定扩散模型要求用户拥有将其安装在本地计算机上的技术诀窍,但Leonardo AI可以通过自己的网站轻松访问。这种易用性要求与Ideogram、MidJourney或Dall-E 3进行自然比较,后者也是基于网络的人工智能图像生成器。
在Leonardo Phoenix发布之前,Decrypt比较了这些本地和基于网络的模型,并得出结论:“Ideogram可能是目前市场上最好的图像生成器。”当SD3发布时,我们的快速测试得出结论,它“在很多用例中都比SDXL好,但不足以取代它。”
因此,Ideogram在我们的主观测试中表现得很强。莱昂纳多是否足够优秀,足以击败它?
Leonardo与Ideogram
为了比较这两个模型,我们为两者提供了相同的基本提示。我们还在这两项服务上都启用了一项功能,以增强我们的提示文本,从而生成更好的图像。
风格解读
基本提示:一男一女在一家未来主义餐厅用餐,插图为文森特·梵高风格。这家餐厅有一块牌子,上面写着“欢迎来到埃梅里奇,解密。”
我们想测试这些模型在多大程度上识别出相关的艺术家和艺术运动——在本例中,是文森特·梵高的艺术风格,他有一种独特且易于识别的技术。莱昂纳多在风格上胜过了伊迪格拉姆。此外,在这个例子中,它的文本生成功能被证明更强大。
莱昂纳多对风格的关注使餐厅与野餐时的草地融为一体。
Ideogram采取了一种更安全的方法,专注于场景而不是风格。修复莱昂纳多这一代人更容易。Ideogram需要更复杂的技术(如使用IPAdapter或Img2Img)才能获得可接受的结果,因为图像与样式根本不相似。
获奖者:莱昂纳多
及时遵守和空间意识
基本提示:一只狗站在一只猫的身上。左边是一个机器人,屏幕上写着“Emerge”,右边是一个戴着防毒面具、拿着注射器的恐怖主题医生。背景融合了新兴技术的元素,如DNA和遗传学、二进制代码、太空探索和外星人、电子和未来技术。
在这里,我们想测试模型对特定元素在提示中的位置的理解程度。在他们这一代人中,他们都是准确的,理解每一个要求的元素的位置、背景和文本。
Ideogram生成的图像将所有元素融合在一起,更美观。莱昂纳多创造了一个更准确的表现,这在小细节中是显而易见的。例如,Ideogram未能为医生生成好的手,表上的元素只不过是混乱的抽象生成,看起来不错,但没有任何意义。
获胜者:平手。李奥纳多在准确性方面获胜,伊迪格拉姆在美学方面获胜。
奖励回合:我们决定从这一代开始,让莱昂纳多的“人工智能编辑”功能发挥一番作用。我们要求莱昂纳多“在不改变元素的情况下,给这张照片一种70年代的复古风格”,它在第一张照片中几乎完美地生成了它——只是漏掉了猫。
值得注意的是,这一功能极大地改变了生成,不仅与稳定扩散中IPAdapter的使用相当。
写实主义
基本提示:专业照片,高加索男子特写肖像照片,穿着黑色毛衣,严肃的脸,戏剧性的灯光,自然,阴郁,多云的天气,bokeh。
伊迪格拉姆的照片比莱昂纳多更逼真。它关注的是主题和他的所有特征,而莱昂纳多再次关注的是围绕主题的风格和其他元素,如阴郁的美学和戏剧性的闪电。
获奖者:Ideogram
特性比较
Ideogram和Leonardo都是允许公众访问各自生成的人工智能模型的网站。他们还提供付费等级,以增强他们的能力。虽然图像比较令人信服,但细节也值得研究。毕竟,决定因素可以扩展到模型本身之外,包括每个模型提供的整体服务。
即时增强和图像处理
提示增强:Leonardo和Ideogram都提供了提示增强功能,以完善和改进用户提示。在Leonardo中,这被称为“改进提示”,而Ideogram将其称为“魔术提示”。这些工具旨在通过自动将基本提示扩展到更详细、更有效的版本来确保最佳效果。图像大小:与Ideogram相比,Leonardo AI可容纳更大的图像分辨率。对于16:9的纵横比,Leonardo可以生成高达1376x768像素的图像,而Ideogram仅限于1280x720像素。对于需要更高分辨率输出的用户来说,最大图像大小的这种差异可能是显著的。图像比例:这两项服务都提供了广泛的图像纵横比可供选择。然而,Leonardo AI通过提供各种社交媒体平台上常用的纵横比参考,提供了额外的便利。生成速度和数量:虽然Ideogram的图像生成过程往往更耗时,但其免费层允许生成更多的图像。相反,由于其模型的计算要求更高,Leonardo AI的自由层对图像数量施加了更严格的限制。这种速度和数量之间的权衡可能会影响您的选择。
高级编辑和自定义
使用AI编辑:Leonardo AI提供了“使用AI编辑”功能,而Ideogram目前缺乏该功能。该工具允许用户提供自然语言指令,以特定方式修改提示,例如“将外套改为红色”、“添加一顶蓝色帽子”、“使其复古”或“添加引人注目的灯光”。然后,人工智能相应地调整提示,从而对生成的图像进行更精确的控制。它类似于Stable Diffusion用户自去年以来一直在使用的instructionPix2Pix插件。背景删除:Leonardo AI提供了背景删除功能,而Ideogram没有。这一功能对于使用其他图像编辑软件的用户或那些试图在其生成的图像中隔离和突出显示特定主题的用户来说尤其有用。图像放大:Leonardo AI提供了一个放大功能,允许用户提高生成图像的分辨率。该功能目前在Ideogram平台上不可用,需要使用其他工具。即时图像生成:Leonardo AI提供了一个即时图像生成器,类似于Meta的“想象”功能或Krea的即时生成。该工具在用户键入提示时实时生成图像,与传统的基于批处理的生成相比,提供了更动态、更交互式的体验。动画和实时画布:Leonardo AI允许用户从生成的图像中创建基本动画,并为繁重的修复和外绘任务提供实时画布。这些功能目前在Ideogram平台上不可用。模型训练:Leonardo AI允许用户根据精心挑选的图像训练自己的模型。此功能需要大量计算资源,Ideogram不提供此功能。对于有特殊需求的用户来说,这可能是一个显著的优势。灵活性:Leonardo AI拥有多种型号,Phoenix是其最强大的产品与Ideogram的专有模型相当。然而,该公司还提供其他专有模型,如Leonardo Kino、Leonardo Vision和Lightning Model,以及社区微调的开源模型,如Dreamshaper和Absolute Reality
定价和型号多样性
每代人的价格:在定价方面,Ideogram的付费层提供无限的慢代,每月20美元起,而Leonardo的Artisan unlimited层提供类似的产品,每月30美元起。对于需要更快的生成速度或额外功能的用户来说,Leonardo AI可能是更具成本效益的选择,尽管其定价结构通常更高。
结论
Leonardo提供了一个全面的UI,具有广泛的功能,专为寻求从生成的图像中提取最大价值的用户量身定制。用于提示编辑和生成操作的自然语言处理的集成也是一个显著的优势。对于超级用户,尤其是那些愿意投资优质服务的用户来说,莱昂纳多显然是更具吸引力的选择,尤其是考虑到其广泛的功能集。
然而,对于主要专注于用最少的精力生成视觉上令人惊叹的图像的普通用户来说,Ideogram的精简方法——加上其人工智能增强的提示生成功能——可能更适合。
虽然莱昂纳多似乎在图像中生成更长的文本串方面表现出了轻微的优势,但差异并不大。
最终,在这两种服务之间做出决定可能取决于个人的优先级,Leonardo最适合那些寻求全面创意控制和高级工具的人,而Ideogram则呼吁用户优先考虑优化但直接的图像生成体验。
就我们的钱而言,莱昂纳多确实从伊迪格拉姆手中接过了桂冠。虽然Ideogram有时可以生成出色的图像,但莱昂纳多提供的大量特征令人信服。无论你是对生成图像的新手还是专业人士,莱昂纳多都能做到。
总冠军:莱昂纳多
由Ryan Ozawa编辑。