在 Stock Photo 一章中,介绍了以图生图的方法,这个方法除了解决 Stock Photo 的那几个问题外,还很适合多个场景。本章会着重介绍用这个方法生成的头像的提示词。并且从本章开始会逐步丰富我们的提示词结构,使其更加完整。
第一个要分享的是卡通头像。首先跟大家强调下:
在提示词生成器里上传原图(建议使用证件照,或者背景比较单一的照片,这样成功率会高一些),然后用前面教程提到的框架设计一个提示词:
提示词 | 解释 | |
---|---|---|
类型是什么? | Portraits / Avatar | 如果你的原图是证件照,可以在 prompt 里加入「肖像」一词,或者「Avatar 头像」。 |
主体是什么? | smiling cute boy, undercut hairstyle | 这里可以是选填,你可以先不加这个描述,只填其余提示词,然后如果生成的图片不像你。那你就在这里加点描述下你的头像的词,一般就是性别、样貌、发型、配饰(比如眼镜、耳环等)、表情等。注意,尽量挑特征比较强的部分输入,特征对了,生成的图片基本会有几份像。 |
背景是什么? | white background | 保留了证件照的白底,你可以加一些实际场景的背景,比如餐厅之类的。 |
构图是怎样的? | 不用写 | 因为我们预先传了图片,图片是张证件照,所以不填 |
用什么镜头? | soft focus | 柔焦是指摄影中,使用柔焦镜头,使得拍摄的影像既清晰又柔和的效果。一般多在拍摄人像的时候使用,在本提示词里加上这个,可以使照片更柔和。当然你也可以不加。 |
是什么风格? | 3d render,Pixar style | 因为目标是生成 3d 照片,所以这里加了 3d render(3d 渲染),以及超赞的皮克斯风格 |
参数 | --iw 2 | iw 是一个文字和 img 权重参数。数值越大,就越像原图,关于这个值的介绍,可以查看以图生图篇章的介绍。 |
最后,还有三个技巧:
在使用以图生图的方法生成头像时,有个问题是「文字权重比图片权重高」,导致其生成的图片不像原图,但是iw 参数在 V5 里最多提升图片权重到 2,所以就试了下s参数,结果确实会好了很多。
如果生成的图片还是不像,你可以在 —iw 2 基础上,再加一个参数 —s 200。仅个人主观感受,需同学们自行尝试。
s 是控制生成图片的风格化程度。简单理解,这个值越低会更符合文本提示词的描述,数值越高艺术性就会越强,但跟文本提示词关联性就会比较弱。所以如果你生成的图还是不像,就加大这个值,比如调到 500。
这个案例告诉大家,多个参数一起使用,有可能会形成合力,进一步放大模型的能力。未来有新的参数能力,不妨也想想有没有可能一起用?
与 3D 卡通头像一样,主要的修改是在图片风格上:
提示词 | 解释 | |
---|---|---|
类型是什么? | Portraits / Avatar | 如果你的原图是证件照,可以在 prompt 里加入「肖像」一词,或者「Avatar 头像」。 |
主体是什么? | smiling cute boy, undercut hairstyle | 这里可以是选填,你可以先不加这个描述,只填其余提示词,然后如果生成的图片不像你。那你就在这里加点描述下你的头像的词,一般就是性别、样貌、发型、配饰(比如眼镜、耳环等)、表情等。注意,尽量挑特征比较强的部分输入,特征对了,生成的图片基本会有几份像。 |
背景是什么? | white background | 保留了证件照的白底,你可以加一些实际场景的背景,比如餐厅之类的。 |
构图是怎样的? | 不用写 | 因为我们预先传了图片,图片是张证件照,所以不填 |
用什么镜头? | 不用写 | 因为是漫画风,就不加柔光镜头了 |
是什么风格? | anime, Studio Ghibli | 目标是制作动漫风的头像,所以这里加了 anime(动漫),然后加了吉卜力风格 |
参数 | --iw 2 --s 500 | 同时用两个参数,您只需在提示词生成器中手动选择即可,无需手写 |
只需要改一下风格和背景即可:
提示词 | 解释 | |
---|---|---|
主体是什么? | cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing | 加了脸的修饰,还有戴上 VR 眼镜,穿上赛博朋克风衣服 |
背景是什么? | neon-lit cityscape background | 为了让图片更像是赛博朋克,就加了个霓虹灯城市背景,让其看起来更有赛博那味 |
是什么风格? | Cyberpunk, by Josan Gonzalez | 加了赛博朋克风格,以及赛博朋克画家 Josan Gonzalez |
上面这几个头像 prompt 最后生成的头像是这样的,坦率地说,确实个人特征太少了,人也不帅,生成的图片,都有种东南亚人那味,感觉 Midjourney 对亚洲人的理解还不是很行。
你可能遇到类似这样的场景:
基于某一次生成的结果进行二次提示词修改,以赛博朋克头像为例,先用上述 prompt 生成了四张图片,然后在提示词生成器的seed参数部分就可以看到这张图片,直接点击选择,提示词生成器会自动为您加上改图的seed参数。
然后修改上面的赛博朋克头像的提示词,将其背景改为 China Town,此时需要注意:
以下是示例:
新提示词(seed 码只是示例,你要填写自己的 seed,所有的参数请在提示词生成器中手动选择,不要自己写):
以下是生成的效果(左图为原图,右图是用了 seed 后生成的图),可以看到,背景的确换了,至于效果,需要同学们多尝试多探索: