Midjourney还能反向给提示词了
丰色 发自 凹非寺
非常AI | 公众号 QbitAI
这两天,不少人开始拿到Adobe Firefly的测试资格。
虽然3月下旬才刚刚杀入,但作为设计界权威公司的新AI工具,它的生成效果也自是被寄予厚望。
这不,英伟达AI研究科学家Jim Fan率先给出实测:
Adobe能否与自筹资金的11 人团队MidJourney相抗衡?
结果是——
嗯,Adobe Firefly被吊打了……
不信你看:
Adobe Firefly大战MidJourney
Jim Fan一共测试了8轮。
第一轮:
死侍在英国一所公寓大楼外的汽车顶部摆出广角姿势。
来看两者的生成结果,左边是Firefly,右边MidJourney(下同):
啊这,Firefly你确定左边这个是蜘蛛侠,而不是真·猪猪侠?
第二轮:
一张照片捕捉到超级马里奥在昏暗的街道上摆pose,在地上的水坑里有一个大倒影,空气中有轻微的薄雾,你知道某些事情即将发生,人们对此充满期待。这就像好莱坞电影中的场景,高产值,拟人化的镜头。
结果:
超级马里奥的形象就不说了,感觉Firefly在背景和氛围感的刻画上也逊色一番。
第三轮:
和第二轮的提示词一模一样,不过把超级马里奥换成皮卡丘。
除去皮卡丘形象不说,还是MidJourney更能抓住氛围,Firefly这次连昏暗的街道都表现得不到位。
第四轮:
不整IP形象了,这轮看看谁更擅长人物摄影。
富士胶片拍摄的这张现代街头风格的照片捕捉到了东京一个忧郁的早晨,一大群通勤者在街上行走。
人群中注意力集中的面孔穿着日本街头服饰和商务装的混搭,但吸引你注意力的是穿红色衣服的女人。
日出的温暖光芒在薄雾中绽放,而锐利的阳光和精心的构图强调了人群的情绪和红衣女子的优雅。
完全两种不同的呈现方式,但Firefly实在实在是有点失真了。
第五轮:
这轮再整点科幻的。
抽象分形艺术作品,由数百万个三维异形块组成的圆形马赛克城市建筑,城市位于太空中,背景可以看到木星,就像从宇宙飞船上看到的那样。
感觉Firefly对“圆形”的理解过于表面,显然也不懂什么是“像从宇宙飞船上看到的那样”。
第六轮:
现在来生成一些手机应用程序的图标设计,Firefly知道这是什么吗?
应用程序图标设计:iOS,科幻星球景观,skeomorphic风格;视觉技巧:使用浅景深、高曝光度、柔焦来强调美;设备:采用高分辨率相机拍摄;编辑:通过颜色校正和锐化增强;平台:Dribble、Behance
显然它还不知道。
第七轮:
报刊/电视台/新闻风格的照片,中全景,afga vista剧照,一位留着白色辫子的牙买加年轻女子站在沙漠中,身穿复古亮片Gucci白色礼服。
这轮主要是看一下AI最不擅长的手部生成。
乍看一眼,两个都还行,但稍微瞧瞧就会发现Firefly给了个男扮女装的形象,手部废了,背景相比MidJourney还是输了一截。不过两者这个“白色辫子”的呈现就大哥不说二哥了。
最后一轮:
Seealpsee湖旁蒲公英中的红色法拉利F40,用Fujifilm Velvia 50拍摄,高细节,高对比度4k
乍一看也都还行,但细看Firefly的背景还是假,不过Firefly说画蒲公英就只画蒲公英,MidJourney反而画蛇添足给了一些其它花种,略微偏离题意。
测试就是这些,总体看下来,Firefly确实完败,有种小学生VS大学生的赶脚,也有网友认为Firefly的水平也就算MidJourney的V1版本。
不过如Jim Fan所说,这种情况情有可原,毕竟:
(1)这些提示语已经在MidJourney中进行了大量优化,直接和刚“出道”的Firefly来比不是很公平。
不过Jim Fan也试了一些“变体”,但仍然无法获得更好的结果,也可能是和他写的提示词不是很好有关,上面这些测试的提示语基本来自网友。
(2)最重要的一点,Firefly宣称它仅在Adobe Stock和完全许可的图像上接受过训练。
这点是很大的劣势,但对于必须确保输出图像版权的使用者来说却是一个重要的优势。因为这些人很可能更愿意为了合法性而牺牲质量。
针对这个话题,Jim Fan进一步发表观点:
恕我直言,从长远来看,MidJourney的策略(几乎不关注艺术家和版权)和Adobe的策略(为了保护知识产权削弱训练)都不是最优的。
也有一些还不错的作品
事实上,随便在网上搜一搜,还是能看到Firefly在没有如此对比之下生成的一些还不错的作品。
算是挽回一些局面。
比如这个:
走在鹅卵石路上的阿尔巴尼亚老妇人。
这个:
这个:
以及用它添加的动画效果:
能感觉到,Firefly不擅长写实,这种卡通/手绘等效果还是可以。
Midjourney更新:能以图生文了
强大的Midjourney仍在继续迭代。
官方最新发布一个命令:/describe,可以用4种文字结果来描述一张图片。
网友纷纷表示:我们可以用它给的描述来研究怎么更好的写提示词了。
不过,直接用它给出的描述再生成图,会跟原图有些差别,比如设计美学博主@Simon_阿文尝试的这个“地铁老人看手机”梗图:
但很快就有网友给出解决方案:
除了手动再修改提示词,在二次生成时将原图也喂给Midjourney就会基本差别不大了。
参考链接:
[1]https://twitter.com/DrJimFan/status/1642967379939573761
[2]https://twitter.com/midjourney/status/1643053450501169157
[3]https://weibo.com/1757693565/MAuOMcoUO?pagetype=homefeed