目录
你想知道的关于 MidJourney 的一切
什么是 MidJourney,它与 DALL·E 相比如何?文末会提供使用地址哦!
简介:MidJourney 是一个类似于 DALL·E 的文本到图像的 AI,专长于“漂亮”图像。您可以通过在聊天应用程序 Discord 中向机器人发送消息来使用它——它不是 Web 应用程序,但也不需要任何编程。它可以免费试用,或者之后的基本计划每月收费 10 美元。真的很棒!
什么是MidJourney?
就像DALL·E 2或 Craiyon(以前的 DALL·E Mini)一样,MidJourney 是一个文本到图像的 AI,它可以根据您的文本提示生成华丽的视觉效果。
虽然 DALL·E 旨在生成任何你能想象到的东西——包括平凡的或丑陋的——Midjourney 默认偏向于创建具有绘画性、美观性的图像。如果有选择,MidJourney 更喜欢用互补的颜色、光影的艺术运用、清晰的细节以及具有令人满意的对称性或透视性的构图来创建图像。
用其创始人的话来说,“我们只希望它易于使用——我们希望图片看起来不错。”
那么,让我们看看它在实践中是如何工作的!
您如何使用 MidJourney?
与 DALL·E 2 或 DALL·E Mini 不同,Midjourney 没有web应用程序。也不需要任何编码。
相反,您可以通过与机器人“交谈”,在一个名为 Discord 的流行聊天应用程序中使用它。(对于那些不熟悉的人来说,Discord 与 微信钉钉之类非常相似,它既可以在您的浏览器中使用,也可以在桌面和移动设备上的独立应用程序中使用。)
作为免费/试用用户,这尤其混乱,因为您在繁忙的公共聊天室中与机器人互动,其他人也在做同样的事情!
用户在公共频道中
然而,这也是一种非常有趣的开始方式:您可以看到其他人正在尝试的确切提示 - 以及他们的结果 - 实时且未经过滤!
一旦您成为付费用户(每月只需 10 美元),您就可以在私人对话中向机器人发送 DM,从而获得更加平静的体验。(如果您觉得多管闲事,您仍然可以关注公共频道以了解正在发生的事情,或参与挑战。)
如您所料,生成图像包括输入一个句子并查看会发生什么。
第一步:输入提示
显示您的初始缩略图大约需要 十几 秒。
您可以观看 AI 逐渐生成您的图像,从最初的模糊颜色到高清缩略图。它相当催眠,只会增加对美味的期待感。
与 DALL·E 不同的是,还有第二步:最初的缩略图只有 256 像素(尽管您可以将所有四个作为网格下载!)此时您可以将您最喜欢的图片升级到全画质,这需要额外消耗使用次数。
这个升级过程需要额外的几十秒左右才能完成
就像 DALL·E 一样,您还可以创建任何 MJ 图像的“变体”,您希望看到一些类似的输出。(注意,这只能使用生成的图像——你不能上传_自己的图像_来改变。)
请求变体会产生四个选项。
有趣的是,与从文本生成图像相比,变体的计算量要小——例如,在 10 美元的基本计划中,您可以生成 666 个变体(总共 2664 个缩略图),但只有 200 个文本提示。
MidJourney 创建什么样的图像?
这是最重要的事情——如果你听说过 Midjourney,但对它不太熟悉,它可能比你意识到的要强大得多。
尽管它们确实非常引人注目,但它们都具有某种外星风格,使它们具有标志性的“人工智能生成的外观”。但是 Midjourney 的模型现在是“版本 V3”——它比以往任何时候都更强大和适应性更强。
不是照片:但照片般逼真
Midjourney 避免了直接的“日常”摄影,但它可以创建难以想象的效果
Midjourney 生成的所有图像,来自社区图库:phishnchips、richardhendricks、RankSquid、urens、Danger
特别是,Midjourney 生成超清晰图像的倾向增加了整体的真实感。
在提示方面,Midjourney 可以使用所有技术摄影术语,无论是特定镜头、胶卷或照明设置,都能愉快地重现您所追求的氛围。
使用 MidJourney 创建 2D 艺术、绘画和插图
就像 DALL·E 一样,MidJourney 能够从各种不同的艺术媒介、风格和历史艺术家那里汲取灵感。从华丽的“绘画”到块状抽象插图,从模拟草图到数字
用 MidJourney 模拟 3D 视觉艺术
MidJourney 可用制作3D 艺术品,非常的逼真细节丰富。
Midjourney vs DALL·E:视觉优势和劣势
与 DALL·E 正面交锋,MidJourney 通常在美学上更令人愉悦。MidJourney 本质上是为“默认漂亮”而构建的,因此即使对于定义模糊的提示,它也能提供更可靠的“审美”图像。以“girl discovers meaning of life”为例:
缺点是,即使给出更具体的提示,Midjourney 也倾向于忽略所要求的风格,而倾向于“更好看”的东西。
我们可以看到 DALL-E 的结果更接近我们真实的日常摄影,而 Midjourney 更喜欢提供更美丽的东西。
同样,被要求生成“pixel art pineapple’”时,Midjourney 忍不住添加曲线、细节或拟人化特征,而 DALL·E 则一字不差地按照说明进行操作:
DALL·E的像素艺术
Midjourney 尝试像素艺术
对于新用户来说,这种差异实际上可能是一个优势。Midjourney 是快速生成一组连贯图像的绝佳选择,例如伴随一系列文章的库存插图,只要您乐于使用它来调用美学镜头。
假设我们正在开展一个处理“工作场所的心理健康”的项目。 从一个提示来看,MidJourney 的几张图都非常一致,所以在我们的主页上,他们会很好地融合在一起!
“A business man thinking business thoughts, Futurism”——由 Midjourney 生成
即使跨越不同的提示,也存在持久的审美相似性,在风格上不会相距甚远。
顺便说一句,这些都是在第一次尝试时生成的。
现在比较一下 DALL·E 对相同提示的反应:它们的范围要广泛得多,好像我们要求不同的设计师创作每张图片,或者它们来自不同的杂志。
“一个思考商业思想的商人”——由 DALL·E 生成
有更多款式可供选择,这意味着我们更有可能找到我们正在寻找的东西——但它们搭配起来并不是特别好。如果我们再次运行类似的提示,我们可能会再次看到非常不同的东西!
唉,MidJourney 的模型不仅使您的结果保持一致,而且使每个人的结果保持一致。下面,我们可以看到我最近生成的图像。对“一个垂死之人的最后想法”这一提示的创造性反应让我印象深刻——直到社区中的另外两个人分享了他们最近制作的图像……
显然,该模型拥有一些令人愉悦的技术,可以满足各种要求。
随着 MidJourney 图像被更广泛地使用,这些美学可能会开始感觉“过时”。但另一方面,Midjourney 可能会在此之前开发出新的技巧。
简而言之,MidJourney 的挑战不在于创造美丽的形象——这非常容易——而是推动创造具有新颖风格的独特形象。
内容规则和限制
Midjourney 仍然排除了血腥暴力和色情内容的成人图像,但其内容限制远少于 DALL·E。没有规定禁止创作广泛或夸张地描绘“暴力”、疾病、政治内容或公众人物描绘的图像。
以下是一些会被 DALL·E 屏蔽的图像示例,例如:
“枪”(暴力)、“冠状病毒”(疾病+健康)、“特朗普”(政治)和“泰勒斯威夫特”(公众人物)都违反了 DALL·E 的内容政策。
因此,如果您想设计科幻超级战士、创作插图作品以配合健康内容、设计有力的政治形象,或者只是制作一些好的老式粉丝艺术,那么您每次都会想要选择 MidJourney .
上面的例子也说明了 DALL·E 目前的限制是多么严苛。(在 OpenAI 的辩护中,由于 MidJourney 不会生成逼真的图像,因此通过伪造和错误信息滥用的风险降低了。)
一切都被保存了——一切都是公开的
DALL·E 默认有50个积分,除非您手动保存单个图像,这些图像存储在一个无法搜索的大存储桶中。
但是MidJourney 默认将每个缩略图和高清放大保存在您自己的个人存档中,您也可以通过提示进行搜索。这样就不可能丢失任何工作,并且很容易再次找到它。好多了!
查看个人档案。
对于注重隐私的人来说,一个潜在的缺点是:默认情况下,每个提示和生成都是公开的,在一个强大的画廊中共享。(目前,只有付费会员才能浏览此内容。)当然,如果您是免费/试用用户,您将直接在公共聊天室中发布提示。
你可以花费每个月30美元无限使用,访问画廊,也可以额外花费20美元每月开通隐私模式。
然而,查阅庞大档案的好处是巨大的:这是调查存在哪些风格并不断发现新想法的绝妙方法。例如,您可以搜索技术(如“粉彩”)、艺术家(如“达芬奇”)或主题(如“运动鞋”)。您还可以为其他人的作品添加书签以供日后参考,当然,花时间探索先前创作的档案意味着您会更慢地消耗您的使用次数。
其他 MidJourney 专用技术
MidJourney 提供了一些 DALL·E 没有的巧妙功能。
创建横向和纵向图像
这非常简单,您只需在提示符中添加如下内容:–ar 2:1,创建一个宽度是高度的两倍的图像。例如:
Dark oil painting of a horse king --ar 2:1
一些常见的纵横比是:
16:9(宽屏桌面,手机横屏)
9:16(竖屏手机,Instagram )
4:3(典型的“缩略图”或横向照片)
4:5(Instagram 提要中“纵向”的图像)
添加“图像提示”
只需以图像的 URL 开始提示,Midjourney 将尝试使用该图像的“样式”来影响输出。(请注意,这与更改它或直接“编辑它”不同——它不会获取图像的主题并将您的提示应用于它。)
例如,如果我们从左边的图像开始,附上“狗”这个词,我们会得到以下信息:
根据我的经验,这很难控制!用文字提示似乎更容易。也就是说,只要坚持不懈,您可能会得到一些有趣的效果,并且记录结果会很有趣——没有太多关于此功能的已发表研究。
轻度升级
这比解释更容易可视化。基本上,默认的“常规放大”为高清版本添加了细节,因此一幅花田的画将包含更多的草叶、花瓣等。
相反,“轻度放大”将保持相同数量的笔触,只是使现有的细节更大。
左:轻度放大。右:升级。
为什么 Midjourney 比 DALL-E 更好
外观:Midjourney 的图像通常比 DALL·E 在美学上更令人愉悦,并且该模型仍然具有适应性和对风格提示的响应能力。如果您想快速生成大量令人愉悦的图像这将是一个很好的工具,而无需过于密切地微调提示。
易于使用:通过选择宽高比,您可以更快地将创意转化为社交媒体所需图像。公共画廊拥有数十万张可供启发的图片,可以在您输入提示之前轻松检查您的提示是否被理解,并找到成千上万的新想法。
管理您的工作: 通过自动存档,您不可能丢失您付费制作的图像。它还将所有缩略图保存在 2×2 网格中,因此您无需担心单独保存每张图像。
移动使用:Discord 应用程序在移动设备上的运行效果比 DALL·E 网站要好得多
可见的生成过程:动画生成过程不仅看起来很有趣,它还使 Midjourney 更适合研讨会或演示
无限使用:每月 30 美元,MidJourney 提供无限模式,尽管最终你的生成速度会减慢。
无水印: 与 DALL·E 不同的是,每张图片的底部 20px 没有“签名”。
更便宜:那么 Midjourney 为您提供 200次使用次数, 10 美元,30美元无限量(DALL·E 为您提供 115 次使用次数,价格为 15 美元)
为什么DALL·E优于Midjourney
灵活性: 在更大范围的图像上训练,DALL·E 能够提供更广泛的视觉风格。
独特性:您更有可能创造出令人惊讶或有趣的结果,或者创造出前所未有的形象。图像看起来“类似人工智能”的可能性较小。您还可以更加确信其他用户没有生成非常相似的图像。
响应能力:因为 DALL-E 的模型不那么固执己见,所以它对风格提示的反应更灵敏,特别是如果那种风格不那么漂亮——它不会试图推翻你的意见。因此,您更有可能对特定请求做出准确的反应,例如像素艺术。
原始速度:从初始提示到全高清下载仅需 20 秒,而 Midjourney 则为 120 秒。
摄影: DALL·E 也更擅长创作在杂志或公司网站上不会显得格格不入的逼真的“普通”照片。
图像编辑:DALL·E 还提供了 Midjourney 所没有的强大工具:绘画、取消裁剪和不同的图像上传,对于我们目前看到的更具创造性的 AI 艺术用途至关重要。
真正的网络应用程序: 凭借其自己的最小网络界面,您可以直接使用 DALL·E
隐私:默认情况下,您的所有都是私有的,对于那些从事个人或敏感商业项目的人来说更好。
分享网址: DALL·E 让您将创作变成可分享的网址,因此很容易发送链接。
为什么不一起使用?
一种强大的工作流是在 Midjourney 中创建原始图像,然后将它们导入 DALL·E 进行变化和修复
说了这么多,到底如何才能使用到?
MidJourney和DALL·E目前都是属于公开测中,
可以登录http://midjoureny.com官网直接使用,Dalle还需要申请,你可以填写此表https://labs.openai.com/waitlist等待审核。
当然使用过程中避免不了会遇到很多问题,也欢迎加入我们的交流群一些学习,在公众号【羊皮大叔】入群,我在等你哦!