训练个人头像lora模型.md
Making Self Portraits With Stable Diffusion and LoRA
- 近几个月,像Lensa和AvatarAI这样的产品涌现出来,可以生成艺术化的肖像和自拍照片,包括逼真难以区分真实的照片和高度风格化的绘画。
- 作为艺术家,作者对这些产品很感兴趣,因为它们使图像混合成不同的风格变得容易和民主化。然而,使用这些产品更像是应用Instagram滤镜而不是真正的创作。
- 文章介绍了一个名为Stable Diffusion的开源图像生成AI模型,并通过一种名为LoRA(即Low-Rank Adaptation)的技术对其进行微调,以生成自定义头像和自拍照。
- Stable Diffusion是一个简单的工具,只需要描述想要看到的内容,然后点击生成按钮。作者建议初学者在Replicate上尝试改变提示以了解其功能。
- 通过改变提示,可以生成不同风格的图像,作者展示了使用提示“astronaut riding a horse on mars, painting, impressionistic style, oil, highly detailed”生成的不同风格的图像。
- 由于Stable Diffusion是在互联网上的20亿张图像的子集上训练的,对于许多人物、地点或事物的表示并不了解。作者以自己的名字为例,展示了生成一个“Jake Dahn riding a horse on mars, drawing, sketch, pencil”的图像,但模型无法理解作者的身份。
- LoRA是一种微调技术,可以在大型基础模型(如Stable Diffusion)的基础上进行微调,使其适应个人数据。LoRA相比于其他技术(如DreamBooth)的优势在于训练时间短,产生的权重文件较小,同时可以混合匹配多个LoRA概念、对象和风格。
- 作者通过以下步骤展示如何使用LoRA微调Stable Diffusion:选择训练图像、准备实例数据.zip文件、上传并训练、下载权重文件。
- 文中提到了几个使用LoRA权重的Stable Diffusion模型,包括Realistic Vision 1.3、Inkpunk Diffusion、GTA5 Diffusion、Vintedois Diffusion等。作者分享了一些生成图像的提示和链接。
- 最后,作者尝试了使用多个LoRA概念同时进行风格转移,以及与Toy Faces Library的混合,生成了一些有趣的图像。总结文章时,作者表示自己在过去几个月里花费了数百小时来探索Stable Diffusion,并对其功能和工作原理有了一些了解。
- 原文作者:iamdev
- 原文链接:https://blog.iamdev.cn/post/2023/%E8%AE%AD%E7%BB%83%E4%B8%AA%E4%BA%BAlora%E6%A8%A1%E5%9E%8B/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止转载 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。