场景5:头像

在 Stock Photo 一章中,介绍了以图生图的方法,这个方法除了解决 Stock Photo 的那几个问题外,还很适合多个场景。本章会着重介绍用这个方法生成的头像的提示词。并且从本章开始会逐步丰富我们的提示词结构,使其更加完整。

3D 卡通头像

第一个要分享的是卡通头像。首先跟大家强调下:

  1. 本教程基于搜索总结了国内国外的生成头像教程,并几乎都试过一遍,还跟 Midjourney 社群的大神也交流过。个人理解,以目前 V5 的能力,不管你如何调整 prompt ,想用以图生图方法生成一张非常像原图的图片,基本靠运气,即使用了前面介绍的技巧七方法,也只是提高概率。如果你有令头像非常像的方法,不妨向公众号投稿,我们会署下你的名字,并分享给大家。
  2. 各位同学在学习的过程中,如果发现生成的图片不像原图,也不需要气馁。这是正常的。
  3. 你可以通过本教程的方法,生成一张有原图神韵的卡通头像。注意肯定不会非常像原图。

在提示词生成器里上传原图(建议使用证件照,或者背景比较单一的照片,这样成功率会高一些),然后用前面教程提到的框架设计一个提示词:

提示词解释
类型是什么?Portraits / Avatar如果你的原图是证件照,可以在 prompt 里加入「肖像」一词,或者「Avatar 头像」。
主体是什么?smiling cute boy, undercut hairstyle这里可以是选填,你可以先不加这个描述,只填其余提示词,然后如果生成的图片不像你。那你就在这里加点描述下你的头像的词,一般就是性别、样貌、发型、配饰(比如眼镜、耳环等)、表情等。注意,尽量挑特征比较强的部分输入,特征对了,生成的图片基本会有几份像。
背景是什么?white background保留了证件照的白底,你可以加一些实际场景的背景,比如餐厅之类的。
构图是怎样的?不用写因为我们预先传了图片,图片是张证件照,所以不填
用什么镜头?soft focus柔焦是指摄影中,使用柔焦镜头,使得拍摄的影像既清晰又柔和的效果。一般多在拍摄人像的时候使用,在本提示词里加上这个,可以使照片更柔和。当然你也可以不加。
是什么风格?3d render,Pixar style因为目标是生成 3d 照片,所以这里加了 3d render(3d 渲染),以及超赞的皮克斯风格
参数--iw 2iw 是一个文字和 img 权重参数。数值越大,就越像原图,关于这个值的介绍,可以查看以图生图篇章的介绍。

最后,还有三个技巧:

  1. 如果你生成的照片并不像预设的照片,可以在四张图里,挑一张比较像的,然后点 V(Variation)基于此图继续创作,让模型继续生成,再继续挑一张像一点的照片,然后继续生成新照片,直到出现一张比较像的。
  2. 第二个,如果前两个方法你都试过了,你生成的图片还是跟原图不像,那就在提示词里加上「wear glasses(戴眼镜)」,就像非常多,非常奇妙,需要自行测试,如果你原图戴眼镜了,可以试试在参数里加个 —no glasses,你会得到一张更不像你的图。
  3. 最后,就是多用一个参数,这个方法会在技巧八中展开说下。

技巧七:多参数同时使用

在使用以图生图的方法生成头像时,有个问题是「文字权重比图片权重高」,导致其生成的图片不像原图,但是iw 参数在 V5 里最多提升图片权重到 2,所以就试了下s参数,结果确实会好了很多。

如果生成的图片还是不像,你可以在 —iw 2 基础上,再加一个参数 —s 200。仅个人主观感受,需同学们自行尝试。

s 是控制生成图片的风格化程度。简单理解,这个值越低会更符合文本提示词的描述,数值越高艺术性就会越强,但跟文本提示词关联性就会比较弱。所以如果你生成的图还是不像,就加大这个值,比如调到 500。

这个案例告诉大家,多个参数一起使用,有可能会形成合力,进一步放大模型的能力。未来有新的参数能力,不妨也想想有没有可能一起用?

动漫风头像

与 3D 卡通头像一样,主要的修改是在图片风格上:

提示词解释
类型是什么?Portraits / Avatar如果你的原图是证件照,可以在 prompt 里加入「肖像」一词,或者「Avatar 头像」。
主体是什么?smiling cute boy, undercut hairstyle这里可以是选填,你可以先不加这个描述,只填其余提示词,然后如果生成的图片不像你。那你就在这里加点描述下你的头像的词,一般就是性别、样貌、发型、配饰(比如眼镜、耳环等)、表情等。注意,尽量挑特征比较强的部分输入,特征对了,生成的图片基本会有几份像。
背景是什么?white background保留了证件照的白底,你可以加一些实际场景的背景,比如餐厅之类的。
构图是怎样的?不用写因为我们预先传了图片,图片是张证件照,所以不填
用什么镜头?不用写因为是漫画风,就不加柔光镜头了
是什么风格?anime, Studio Ghibli目标是制作动漫风的头像,所以这里加了 anime(动漫),然后加了吉卜力风格
参数--iw 2 --s 500同时用两个参数,您只需在提示词生成器中手动选择即可,无需手写

赛博朋克头像

只需要改一下风格和背景即可:

提示词解释
主体是什么?cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing加了脸的修饰,还有戴上 VR 眼镜,穿上赛博朋克风衣服
背景是什么?neon-lit cityscape background为了让图片更像是赛博朋克,就加了个霓虹灯城市背景,让其看起来更有赛博那味
是什么风格?Cyberpunk, by Josan Gonzalez加了赛博朋克风格,以及赛博朋克画家 Josan Gonzalez

上面这几个头像 prompt 最后生成的头像是这样的,坦率地说,确实个人特征太少了,人也不帅,生成的图片,都有种东南亚人那味,感觉 Midjourney 对亚洲人的理解还不是很行。

Midjourney中文网

技巧八:使用 Seed 参数对图进行二次修改

你可能遇到类似这样的场景:

  1. 你输入一段提示词,机器生成了 4 张图片
  2. 你看了下4张照片,发现其中有一张还行,但其余不是很满意,然后改了下提示词,机器又生成了一些
  3. 但这次生成的照片你都不满意,你就很烦恼为何会这样
  4. 然后你就像为啥不能在第一次生成图上做修改呢?

基于某一次生成的结果进行二次提示词修改,以赛博朋克头像为例,先用上述 prompt 生成了四张图片,然后在提示词生成器的seed参数部分就可以看到这张图片,直接点击选择,提示词生成器会自动为您加上改图的seed参数。

然后修改上面的赛博朋克头像的提示词,将其背景改为 China Town,此时需要注意:

  1. 新的提示词并不是只改 background,你需要将之前的提示词都带上。
  2. 提示词仅修改 background 的部分。

以下是示例:

原提示词

新提示词(seed 码只是示例,你要填写自己的 seed,所有的参数请在提示词生成器中手动选择,不要自己写):

新提示词

以下是生成的效果(左图为原图,右图是用了 seed 后生成的图),可以看到,背景的确换了,至于效果,需要同学们多尝试多探索:

Midjourney中文网