AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

        AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
引言
最近经常听说一种奇异的技术,它能够用文字来创造图像,让人们的想象力得以可视化,这是一种什么技术?
AI: 这种技术是人工智能的一种应用,它利用了深度学习的方法,让机器能够根据人们输入的文字,自动生成与之相符的图像。这种技术不仅能够满足人们的好奇心和创造力,也能够在各个领域发挥作用,比如教育、娱乐、设计、医疗等。
我想知道,这种技术是怎样实现的,又有哪些不同的方式呢?
AI:我将为你介绍两种主要的技术:生成对抗网络(GAN)和扩散模型(Diffusion),它们各自有什么特点和优劣,又有什么历史和前景。同时,本文还将教读者如何使用目前流行的技术工具,轻松掌握AI绘画。我们将把这个过程比作学习炼丹术,而这些工具就是不同等级的炼丹炉。你是否感兴趣呢?如果感兴趣,就请跟我一起走进这个神秘而奇妙的世界吧!
  
 – 以下文字皆为AI,小编配图 –


01
模型介绍
两种“炼丹炉”的发展历程及优缺点
1)生成对抗网络(GAN)是一种让机器自己创造新的图片的技术,它在2014年由Ian Goodfellow等人发明,引起了很多人的关注。
GAN的基本想法是让一个机器(生成器)根据给定的一些随机或文字信息,创造出看起来像真的图片,而另一个机器(判别器)则负责检查这些图片是不是真的,从而给出反馈信号来指导生成器不断改进。
这类似GAN有两个部分:一个是画家,它学会根据一些随机杂点画出似是而非的图片;另一个是鉴赏家,它负责评价这些图片的真实性,并给出反馈信号来指导画家不断提高。
这是一个类似于“画家与鉴赏家”的游戏,通过不断地互相挑战,最终达到一个平衡点,即画家可以画出骗过鉴赏家的图片,而鉴赏家无法分辨真假。
         AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
 GAN在创造图片方面有着很多有趣和有用的应用,比如改变图片的风格、提高图片的清晰度、给黑白图片上色、修改图片的内容、根据文字生成图片等。
人脸生成:根据人脸数据集来生成逼真的人脸图像,甚至可以控制人脸的属性,如年龄,性别,发型等。此图中都是不存在的人脸。
         AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

风格迁移(styleGAN):将一种风格的图像转换为另一种风格的图像,例如将照片变成油画或素描。
        AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
图像增强:对低分辨率或模糊的图像进行超分辨率或去噪处理,使图像更清晰和细致。
         AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
图像编辑:对图像进行局部修改或添加,例如改变背景,添加物体或文字等。
文字到图像:由文字描述生成相应的图像。
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

图像修复:对缺失或损坏的图像进行修复或填充,例如修复老照片或涂鸦等。
         AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
动画生成:根据动画数据集来生成动画角色或场景,甚至可以生成动画视频。
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

GAN发展时间线
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
然而,GAN也遇到了很多困难和问题,比如生成器学习不到足够的信息、生成器只能创造出一些简单的图片、生成器和判别器难以协调、难以判断什么时候停止学习等。

为了解决这些问题,很多人提出了很多改进的GAN设计和方法,比如DCGAN、StyleGAN、BigGAN、StackGAN、Pix2pix、Age-cGAN、CycleGAN等,它们在不断迭代,也在各自的路线上发展出不同的细化功能。这些设计在不同的任务和数据上展示了GAN的强大能力和潜力。

2)扩散模型(Diffusion Model)是一种让机器自己画出新的图片的技术,它在2015年提出,受热力学原理启发,但直到2020年逐渐才引起大量关注。
扩散模型的主要想法是让一个机器(画家)根据给定的一些随机杂点,逐步去掉杂点,画出看起来像真的图片,它不需要额外训练一个鉴赏家,而是通过一个简单的前向过程和一个逆向过程来实现图像合成。
         AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

扩散模型的训练过程,可以用这个例子理解下,将一张猫图逐步加噪声,直到变成一幅完全噪声的图片,过程中记录变化的噪声参数,生成过程就是反向去噪的过程。  
  AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
Diffusion模型的发展时间线大致如下:
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
散模型在画图方面有着很多有趣和有用的应用,比如根据文字画出图片、改变图片的风格、提高图片的清晰度、修改图片的内容等。
然而,diffusion也遇到了很多困难和问题,比如画家需要很多步骤才能画出图片、画家和鉴赏家难以协调、难以判断什么时候停止去掉杂点等。
为了解决这些问题,很多人提出了很多改进的diffusion设计和方法,比如稳定版diffusion、去噪版diffusion、基于分数版diffusion等。这些设计在不同的任务和数据上展示了diffusion的强大能力和潜力。
         
3)两种模型的比较
         AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
生成对抗网络和扩散模型各有优缺点——GAN在图像合成方面有着很多有趣和有用的应用,比如根据文字画出图片、改变图片的风格、修改图片的内容等。
然而,GAN也面临着许多挑战和问题,比如画家和鉴赏家难以协调、训练过程不稳定、生成结果缺乏多样性等。为了解决这些问题,很多人提出了很多改进的GAN设计和方法,比如WGAN、CGAN、StyleGAN等。
Diffusion在图像生成领域有着广泛的应用和创新,比如根据文字生成图片、改变图片的风格、提高图片的清晰度、修改图片的内容等。
Diffusion相比GAN往往有更加稳定的训练过程、更加简单的目标函数、更加丰富的数据理论。然而,Diffusion也有一些局限性,比如生成速度较慢、需要很多步骤才能恢复出图片、难以处理高分辨率的图片等。
为了解决这些问题,很多人提出了很多改进扩散模型的设计和方法,比如stable diffusion、denoising diffusion probabilistic models、score-based generative models等。近来大火的Midjourney据说是融合了GAN和Diffusion的优点,使得生成的图像质量和可控性达到较好的平衡。
         
02
模型应用
那么,“炼丹炉”准备好了,可以开始“炼丹”了。
先看几个其他人的“炼丹”结果,图片下方就是提示语,我们可以由学习他人的案例开始。
         AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)        AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)        AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

下篇会详细说说炼丹过程,先放几个写提示语的窍门在这里,这是用midjourney生成图像的提示语的一些窍门:
         

///

 -  小程序 - 

 ·「禾略问答」·

AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)


 ·「HotTina」·
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)


*


▷往期文章彩蛋:不要戳开!!!
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)
AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

2023 | 平靓正

 「 www.urasr.com」 
#BE TRUE  #BE WELL  #BE WILD


*
关注分享
FOLLOW US & SHARE ON MOMENTS

官网

微博

视频号

知乎

b站


AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)



感谢你的每一个分享 | 点赞 | 在看
SPECIAL THANKS
▼▼▼


返回:AI图像生成炼丹术一窥:如何轻松掌握AI绘画工具(上篇)

本文由“公众号文章抓取器”生成,请忽略上文所有联系方式或指引式信息。有问题可以联系:五人工作室,官网:www.Wuren.Work,QQ微信同号1976.424.585