场景7:实物

让 ChatGPT 生成提示词是不是更好?

用 ChatGPT 辅助生成提示词,但没有用 Role 模式,而是让它:

  1. 翻译:知道想要的东西,但不知道其英文描述。
  2. 解答:需要一些风格词,但不知道输入啥时,就会问 ChatGPT ,比如「文艺复兴时期的著名艺术家有哪些?」

为何没有用 Role 模式?

的确,让 ChatGPT 以 Role 模式生成内容,比较省时省力,但个人觉得:

  1. 使用比较麻烦,需要输入很多提示,即使通过 App 保存,在多次输入后,就会超过 token 限制,又要重新输入。
  2. 从 ChatGPT 的原理上看,它只会生成一个「普通」的内容,很难获得超过预期的内容。只是说大多数人甚至连「普通」都达不到,所以才会震惊于它的效果。所以如果你想要生成原创惊艳的图,靠概率是不行的,要靠你的想象力。

不过,这也是主观感受,如果你觉得这样效率更高,那就用吧~适合自己的工具才是好工具。

玩具

实物生成的第一个是场景是玩具,是个非常有意思的场景。这个场景如果能跟 3D 打印机结合一下,应该会非常赞。欢迎大家踊跃尝试实现,本站提供免费3D打印。

再解释下提示词有哪些更新,从实物这节教程开始,「背景」调整为「环境」,即主体环境,包括背景、灯光等等:

提示词解释
类型是什么?product photography产品照片
主体是什么?Stormtrooper, plastic, toy继续用风暴兵和达斯维达为例。因为手办一般都是塑料玩具,所以加了两个词
环境是什么?white background, studio lighting背景:为了突出手办,强调一下白色背景 灯光:增加一些灯光,突出产品
构图是怎样的?不用写不太重要,就让 AI 自由发挥
用什么镜头?不用写不太重要,就让 AI 自由发挥
是什么风格?hand painted查了下,好像手办的风格应该只有手绘?

另外一个是游戏王里的蓝眼白龙,可惜 Midjourney 并不知道啥是 Yu-Gi-Oh,只能按字面意思生成了一个:

提示词解释
主体是什么?Blue-Eyes White Dragon, plastic, toy继续用风暴兵和达斯维达为例。因为手办一般都是塑料玩具,所以加了两个词

以下是生成的图片:

Midjourney中文网

另外,测试发现 Midjourney 对美式动漫或电影作品支持会好很多,比如冰与火之歌里的龙妈(只是龙有点诡异),还有圣女贞德:

Midjourney中文网

技巧十:增加风格——国家

说到手办,大家应该第一反应会想起日本,再介绍一个技巧,在提示词里加入 Japanese style 即可,拿圣女贞德作手办,以及之前做的 logo 作为例子:

Midjourney中文网

圣女贞德是不是有种 FF 的感觉?Logo 也比较简洁,猫的外观也有点像动漫里猫的外观,当然除了 Japanese 还有 Chinese(左边4张),甚至 African Style:

Midjourney中文网

技巧十一:增加权重

各位有没有发现,上面那个 Chinese 手办生成的结果好像只有第三张是中国人面孔?原因是 Chinese style 的权重太低,所以仅输出了一个结果。你在实践的过程中,也肯定会遇到,AI 忽略了某些提示词的情况,比如你提到画面中要有一只鸟,但它就是没画出来。

那为何会产生这样的结果?原因 Midjourney 的提示词权重是按照顺序逐个降低(详情请见 Midjourney 官方 FAQ),在我们上面的提示词,我们将 Chinese Style 放到了最后,所以生成的结果也是最少的。忽略了某些词,这个原因暂时为止,但应该很可能是权重导致的问题。

增加权重的方法有很多,最简单的方法就是调整顺序,比如将上面的 Chinese Style 放到最前面(然后生成的结果就是 chinese style 了,测试生成了两次,第二次好一些):

提示词

调整下顺序,效果就大不一样,所以各位不要迷信所谓的提示词模板,多试试,下面看效果:

Midjourney中文网第二种方法是 Slider 方法。

你需要在提示词最后加 :: ,然后加上你需要调整权重的词语,接着再加 :: ,最后加上权重值。比如还是上面的例子,我想突出 Chinese style 但不想调整顺序,就可以改为:

提示词

然后你会发现,好像权重太高了,生成了跟 prompt 无关的图(下方左图),那我们可以在原来的基础上,再加以下 Joan of Arc 的权重(下方右图):

提示词

你可以看到,调整参数后,生成的 4 张图有 2 张具备较强的 Chinese 风格:

Midjourney中文网

不过坦率说来,这个方法,并不特别适合这个案例,调整主体内容,或者顺序, ROI 会更高一些,这个方法更适合 miss 掉某个词时使用,比如官方的案例是这样的:

提示词

生成的图片里(左四张图),猫咪们都看着你(你可能才是 crying woman 😂),如果用 slider 的功能(右边四张),crying woman 就出现在画面里了:

提示词

另外需要注意,slider 可用的参数有 0.25、0.5、0.6、0.7,也可以用这个方法降低权重,区间是 -0.7、-0.6、-0.5、-0.25:

Midjourney中文网

如果你用了 slider 还是没有出现应该有的画面,那还有一个大招 cowbell,坦率说来,这个并不符合 Midjourney 的官方最佳实践,但的确是个可行的方法,以下面这个提示词为例,生成的图片里,woman 看起来并不 shy(左边四张图):

提示词

此时你可以重复重复再重复(这也许就是为何这个方法叫 cowbell 的原因):

提示词
Midjourney中文网

食物

食物讲究的是「色香味俱全」,所以在描述食物类的提示词时,可以往这三个方向想想:

  • 色:食物是什么颜色的(可以通过食物的熟度来控制)。
  • 香:照片没有香味,但我们可以把香气画出来。
  • 味:照片也同样没有味道,那我们加一点细节装饰?比如撒上胡椒、盐、辣椒?
提示词解释
类型是什么?food photography食物照片
主体是什么?steak, medium rare, steaming, light garnishes, sitting on plate牛排,五分熟,带蒸汽,仅有一点配菜,放在一个碟子上
环境是怎样的?epic lighting为了突出食物,加了个聚光灯
构图是怎样的?不用写不太重要,就让 AI 自由发挥
用什么镜头?depth of field为了突出食物,加了背景虚化,这是背景虚化的另一种表达(有景深)
是什么风格?不用写不太重要,就让 AI 自由发挥
参数空参数没有加任何参数

然后再来一碗红烧牛肉面:

Midjourney中文网

技巧十二:善用灯光

坦诚地跟讲,在下不是设计师,也不是摄影师(完全没有摄影经验),所以仅能跟大家分享一下基础内容,因为这个对我来说,太多过程性知识了,不实际操作过,根本不知道有什么。

个人总结出摄影中,常用摄影灯光有以下几种:

  1. 主灯 (Key Light):主灯是最基本的摄影灯光之一,通常放置在被拍摄物体的正前方或正侧方,用于照明主体,决定拍摄物体的主要明暗度。主灯通常是亮度最高的灯光。
  2. 填光灯 (Fill Light):填光灯用于弥补主灯照射的阴影部分,调整阴影的深浅程度,使照片明亮一些。通常填充光应该比主光暗一些,以避免出现过度曝光。
  3. 逆光灯 (Back Light):逆光灯用于照射被拍摄物体的背面,能够区别出主体和背景,并使物体轮廓变得清晰,常用于拍摄骨感、重物感和逆光效果的照片等。
  4. 环境光 (Ambient Light):环境光就是摄影环境自然产生的光线,包括室内照明、自然光、街灯等,它可以补充被拍摄物体的表面,提升照片的自然度和真实感。
  5. 故事性灯光 (Special Light):通常是为了制造出某种情境或者表达某种意义而使用的,例如烛光、亮光等。它们能够产生温暖、浪漫、神秘等场景和气氛,以探索和表达艺术的想象力和创造力。

基于这些灯进行排列组合,你会得到不同使用场景的灯光。灯光的细节种类,可以在提示词生成器中查看研究。