用 ChatGPT 辅助生成提示词,但没有用 Role 模式,而是让它:
为何没有用 Role 模式?
的确,让 ChatGPT 以 Role 模式生成内容,比较省时省力,但个人觉得:
不过,这也是主观感受,如果你觉得这样效率更高,那就用吧~适合自己的工具才是好工具。
实物生成的第一个是场景是玩具,是个非常有意思的场景。这个场景如果能跟 3D 打印机结合一下,应该会非常赞。欢迎大家踊跃尝试实现,本站提供免费3D打印。
再解释下提示词有哪些更新,从实物这节教程开始,「背景」调整为「环境」,即主体环境,包括背景、灯光等等:
提示词 | 解释 | |
---|---|---|
类型是什么? | product photography | 产品照片 |
主体是什么? | Stormtrooper, plastic, toy | 继续用风暴兵和达斯维达为例。因为手办一般都是塑料玩具,所以加了两个词 |
环境是什么? | white background, studio lighting | 背景:为了突出手办,强调一下白色背景 灯光:增加一些灯光,突出产品 |
构图是怎样的? | 不用写 | 不太重要,就让 AI 自由发挥 |
用什么镜头? | 不用写 | 不太重要,就让 AI 自由发挥 |
是什么风格? | hand painted | 查了下,好像手办的风格应该只有手绘? |
另外一个是游戏王里的蓝眼白龙,可惜 Midjourney 并不知道啥是 Yu-Gi-Oh,只能按字面意思生成了一个:
提示词 | 解释 | |
---|---|---|
主体是什么? | Blue-Eyes White Dragon, plastic, toy | 继续用风暴兵和达斯维达为例。因为手办一般都是塑料玩具,所以加了两个词 |
以下是生成的图片:
另外,测试发现 Midjourney 对美式动漫或电影作品支持会好很多,比如冰与火之歌里的龙妈(只是龙有点诡异),还有圣女贞德:
说到手办,大家应该第一反应会想起日本,再介绍一个技巧,在提示词里加入 Japanese style 即可,拿圣女贞德作手办,以及之前做的 logo 作为例子:
圣女贞德是不是有种 FF 的感觉?Logo 也比较简洁,猫的外观也有点像动漫里猫的外观,当然除了 Japanese 还有 Chinese(左边4张),甚至 African Style:
各位有没有发现,上面那个 Chinese 手办生成的结果好像只有第三张是中国人面孔?原因是 Chinese style 的权重太低,所以仅输出了一个结果。你在实践的过程中,也肯定会遇到,AI 忽略了某些提示词的情况,比如你提到画面中要有一只鸟,但它就是没画出来。
那为何会产生这样的结果?原因 Midjourney 的提示词权重是按照顺序逐个降低(详情请见 Midjourney 官方 FAQ),在我们上面的提示词,我们将 Chinese Style 放到了最后,所以生成的结果也是最少的。忽略了某些词,这个原因暂时为止,但应该很可能是权重导致的问题。
增加权重的方法有很多,最简单的方法就是调整顺序,比如将上面的 Chinese Style 放到最前面(然后生成的结果就是 chinese style 了,测试生成了两次,第二次好一些):
调整下顺序,效果就大不一样,所以各位不要迷信所谓的提示词模板,多试试,下面看效果:
第二种方法是 Slider 方法。你需要在提示词最后加 :: ,然后加上你需要调整权重的词语,接着再加 :: ,最后加上权重值。比如还是上面的例子,我想突出 Chinese style 但不想调整顺序,就可以改为:
然后你会发现,好像权重太高了,生成了跟 prompt 无关的图(下方左图),那我们可以在原来的基础上,再加以下 Joan of Arc 的权重(下方右图):
你可以看到,调整参数后,生成的 4 张图有 2 张具备较强的 Chinese 风格:
不过坦率说来,这个方法,并不特别适合这个案例,调整主体内容,或者顺序, ROI 会更高一些,这个方法更适合 miss 掉某个词时使用,比如官方的案例是这样的:
生成的图片里(左四张图),猫咪们都看着你(你可能才是 crying woman 😂),如果用 slider 的功能(右边四张),crying woman 就出现在画面里了:
另外需要注意,slider 可用的参数有 0.25、0.5、0.6、0.7,也可以用这个方法降低权重,区间是 -0.7、-0.6、-0.5、-0.25:
如果你用了 slider 还是没有出现应该有的画面,那还有一个大招 cowbell,坦率说来,这个并不符合 Midjourney 的官方最佳实践,但的确是个可行的方法,以下面这个提示词为例,生成的图片里,woman 看起来并不 shy(左边四张图):
此时你可以重复重复再重复(这也许就是为何这个方法叫 cowbell 的原因):
食物讲究的是「色香味俱全」,所以在描述食物类的提示词时,可以往这三个方向想想:
提示词 | 解释 | |
---|---|---|
类型是什么? | food photography | 食物照片 |
主体是什么? | steak, medium rare, steaming, light garnishes, sitting on plate | 牛排,五分熟,带蒸汽,仅有一点配菜,放在一个碟子上 |
环境是怎样的? | epic lighting | 为了突出食物,加了个聚光灯 |
构图是怎样的? | 不用写 | 不太重要,就让 AI 自由发挥 |
用什么镜头? | depth of field | 为了突出食物,加了背景虚化,这是背景虚化的另一种表达(有景深) |
是什么风格? | 不用写 | 不太重要,就让 AI 自由发挥 |
参数 | 空参数 | 没有加任何参数 |
然后再来一碗红烧牛肉面:
坦诚地跟讲,在下不是设计师,也不是摄影师(完全没有摄影经验),所以仅能跟大家分享一下基础内容,因为这个对我来说,太多过程性知识了,不实际操作过,根本不知道有什么。
个人总结出摄影中,常用摄影灯光有以下几种:
基于这些灯进行排列组合,你会得到不同使用场景的灯光。灯光的细节种类,可以在提示词生成器中查看研究。