场景5：头像

在 Stock Photo 一章中，介绍了以图生图的方法，这个方法除了解决 Stock Photo 的那几个问题外，还很适合多个场景。本章会着重介绍用这个方法生成的头像的提示词。并且从本章开始会逐步丰富我们的提示词结构，使其更加完整。

3D 卡通头像

第一个要分享的是卡通头像。首先跟大家强调下：

本教程基于搜索总结了国内国外的生成头像教程，并几乎都试过一遍，还跟 Midjourney 社群的大神也交流过。个人理解，以目前 V5 的能力，不管你如何调整 prompt ，想用以图生图方法生成一张非常像原图的图片，基本靠运气，即使用了前面介绍的技巧七方法，也只是提高概率。如果你有令头像非常像的方法，不妨向公众号投稿，我们会署下你的名字，并分享给大家。
各位同学在学习的过程中，如果发现生成的图片不像原图，也不需要气馁。这是正常的。
你可以通过本教程的方法，生成一张有原图神韵的卡通头像。注意肯定不会非常像原图。

在提示词生成器里上传原图（建议使用证件照，或者背景比较单一的照片，这样成功率会高一些），然后用前面教程提到的框架设计一个提示词：

	提示词	解释
类型是什么？	Portraits / Avatar	如果你的原图是证件照，可以在 prompt 里加入「肖像」一词，或者「Avatar 头像」。
主体是什么？	smiling cute boy, undercut hairstyle	这里可以是选填，你可以先不加这个描述，只填其余提示词，然后如果生成的图片不像你。那你就在这里加点描述下你的头像的词，一般就是性别、样貌、发型、配饰（比如眼镜、耳环等）、表情等。注意，尽量挑特征比较强的部分输入，特征对了，生成的图片基本会有几份像。
背景是什么？	white background	保留了证件照的白底，你可以加一些实际场景的背景，比如餐厅之类的。
构图是怎样的？	不用写	因为我们预先传了图片，图片是张证件照，所以不填
用什么镜头？	soft focus	柔焦是指摄影中，使用柔焦镜头，使得拍摄的影像既清晰又柔和的效果。一般多在拍摄人像的时候使用，在本提示词里加上这个，可以使照片更柔和。当然你也可以不加。
是什么风格？	3d render,Pixar style	因为目标是生成 3d 照片，所以这里加了 3d render（3d 渲染），以及超赞的皮克斯风格
参数	--iw 2	iw 是一个文字和 img 权重参数。数值越大，就越像原图，关于这个值的介绍，可以查看以图生图篇章的介绍。

最后，还有三个技巧：

如果你生成的照片并不像预设的照片，可以在四张图里，挑一张比较像的，然后点 V（Variation）基于此图继续创作，让模型继续生成，再继续挑一张像一点的照片，然后继续生成新照片，直到出现一张比较像的。
第二个，如果前两个方法你都试过了，你生成的图片还是跟原图不像，那就在提示词里加上「wear glasses（戴眼镜）」，就像非常多，非常奇妙，需要自行测试，如果你原图戴眼镜了，可以试试在参数里加个 —no glasses，你会得到一张更不像你的图。
最后，就是多用一个参数，这个方法会在技巧八中展开说下。

在使用以图生图的方法生成头像时，有个问题是「文字权重比图片权重高」，导致其生成的图片不像原图，但是iw 参数在 V5 里最多提升图片权重到 2，所以就试了下s参数，结果确实会好了很多。

如果生成的图片还是不像，你可以在 —iw 2 基础上，再加一个参数 —s 200。仅个人主观感受，需同学们自行尝试。

s 是控制生成图片的风格化程度。简单理解，这个值越低会更符合文本提示词的描述，数值越高艺术性就会越强，但跟文本提示词关联性就会比较弱。所以如果你生成的图还是不像，就加大这个值，比如调到 500。

这个案例告诉大家，多个参数一起使用，有可能会形成合力，进一步放大模型的能力。未来有新的参数能力，不妨也想想有没有可能一起用？

与 3D 卡通头像一样，主要的修改是在图片风格上：

	提示词	解释
类型是什么？	Portraits / Avatar	如果你的原图是证件照，可以在 prompt 里加入「肖像」一词，或者「Avatar 头像」。
主体是什么？	smiling cute boy, undercut hairstyle	这里可以是选填，你可以先不加这个描述，只填其余提示词，然后如果生成的图片不像你。那你就在这里加点描述下你的头像的词，一般就是性别、样貌、发型、配饰（比如眼镜、耳环等）、表情等。注意，尽量挑特征比较强的部分输入，特征对了，生成的图片基本会有几份像。
背景是什么？	white background	保留了证件照的白底，你可以加一些实际场景的背景，比如餐厅之类的。
构图是怎样的？	不用写	因为我们预先传了图片，图片是张证件照，所以不填
用什么镜头？	不用写	因为是漫画风，就不加柔光镜头了
是什么风格？	anime, Studio Ghibli	目标是制作动漫风的头像，所以这里加了 anime（动漫），然后加了吉卜力风格
参数	--iw 2 --s 500	同时用两个参数，您只需在提示词生成器中手动选择即可，无需手写

只需要改一下风格和背景即可：

	提示词	解释
主体是什么？	cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing	加了脸的修饰，还有戴上 VR 眼镜，穿上赛博朋克风衣服
背景是什么？	neon-lit cityscape background	为了让图片更像是赛博朋克，就加了个霓虹灯城市背景，让其看起来更有赛博那味
是什么风格？	Cyberpunk, by Josan Gonzalez	加了赛博朋克风格，以及赛博朋克画家 Josan Gonzalez

上面这几个头像 prompt 最后生成的头像是这样的，坦率地说，确实个人特征太少了，人也不帅，生成的图片，都有种东南亚人那味，感觉 Midjourney 对亚洲人的理解还不是很行。

你可能遇到类似这样的场景：

基于某一次生成的结果进行二次提示词修改，以赛博朋克头像为例，先用上述 prompt 生成了四张图片，然后在提示词生成器的seed参数部分就可以看到这张图片，直接点击选择，提示词生成器会自动为您加上改图的seed参数。

然后修改上面的赛博朋克头像的提示词，将其背景改为 China Town，此时需要注意：

以下是示例：

原提示词

新提示词（seed 码只是示例，你要填写自己的 seed，所有的参数请在提示词生成器中手动选择，不要自己写）：

新提示词

以下是生成的效果（左图为原图，右图是用了 seed 后生成的图），可以看到，背景的确换了，至于效果，需要同学们多尝试多探索：