prompt (提示词,又译为关键词),通常由英文构成,主要内容为以逗号隔开的单词/词组/短句。prompt 也可以包括其它语言的文字,但效果往往不佳。prompt 还可以识别一些特殊符号。
当我们使用AI绘画时,我们需要先准备一个prompt,下面将详细介绍prompt的概念。
描述词分为正向和反向,初学者可以先关注正向描述词,这就是你想要的画面;如果包含 Negative prompt(负面关键词),AI 就会尽可能避免 含有负面相关要素的去噪点方式。换句话说,prompt 就像是哈利波特里面的魔法咒语,它直接决定了最终我们会从模型得到什么。
首先,prompt中的单词和短语应该与所需图像的主题和特征相关。例如,如果我们想要生成一张小狗在夏日海滩的图像,我们可以使用诸如“dog” ,“sandy beach”、“blue sea”、“palm trees”之类的关键词。这些关键词将指导AI生成图片。
Best quality, masterpiece, ultra high res, (photorealistic:1.4), raw photo, a dog in sandy beach,blue sea,palm trees,
描述即所得,是不是很简单?如果理解了这以方面,那么恭喜你,你已经学会了基本简单的提示词写法了。你可以尝试一下自己喜欢的内容,多生成几张AI图尝试尝试这个过程。
如果对生成图片的质量不满意,那么怎么办呢?接下来只需要根据图片生成的结果,逐步细化提示词,并且添加质量词和负面提示词就可以了。
如果你的英文不好,也可以使用翻译软件来编写prompt,以便更好地表达我们的意图。经过一年多的发展,这样的工具已经非常成熟了:
比如,基于prompt all in one插件,在输入框输入中文,它会自动转换为英文。甚至你可以直接调用GPT来帮你写词。
很多人在写提示词的时候会受到英语水平的限制,于是在AI绘画发展的早期,玩家们就提出了三段式语法,其目的是在较多提示词的时候能够一目了然的分辨内容,方便删减提示词和调整提示词的权重。
所谓三段式,就是:质量词和效果词放最前面,人物与人物特征放在中间,背景和光效放以及功能性tag放在最后面。这就是三段式的基础用法。
举例而言:
质量词用于提升生成质量:
例如:masterpiece、best quality等
画风词用于凸显图片的画风:
例如:
画风前缀:
[(flat color,vector graphics,outline):1.35),pop art]
立绘法的前缀:
1girl, ,[(school background:1.5),open-mouth,school dress
效果词为整体画面效果的提示词:
例如:炫光lensflare、景深Depth of field、 角色焦点character focus、从上面看look from above等等
组合起来:
masterpiece、best quality,[(flat color,vector graphics,outline):1.35),pop art],1girl, ,[(school background:1.5),open-mouth,school dress,lensflare,Depth of field,character focus,look from above
以上的语法,被称为三段式,而仅需要输入单个单词的语法,称之为分词法,也叫danbooru格式。
而你可能也注意到了,这里面有些词是带有数字的,比如(school background:1.5),这种语法表述的是权重,也就是希望更多的在画面里面突出的要素。如果一个词没有在画面里表现出来,最简单的办法就是给它加一点权重。
加权重有两种办法:一对小括号()意味着把括起来的 prompt 权重 * 1.1,你可以用这样表达(((pop art))), 另一种办法是加上权重值:即可以用这样(pop art:1.4);它们基本是等量的。
中括号[]则是减权重,相当于除以/ 1.1,大括号{}在 WEB-UI 中无调整权重作用。
怎么样?你掌握了吗?
** **
在stable diffusion等AI绘画模型里面,基础模型的训练其实是基于自然语言的。
自然语言很好理解:它就是一段话,比如:a girl with long flowing hair with the hair between the eyes
但在AI绘画的早期普及阶段,首先普及的是二次元,由于二次元主打模型的novelai模型的训练方法和一部分LoRA模型在训练的时候基本采用danbooru标注。这种标注的好处是,它能够最大限度利用早期的75字符长度的限制,在描述钟尽可能放入更多的概念。因此,现在我们看到的描述词经常会见到不同的语法规范交叉出现,会让一些初学者无所适从。
不过,这个限制目前早已经取消,随着模型的不断进步和迭代,特别是SDXL模型的升级,令AI更加理解抽象的概念。
比如:抽象绘画,现代抽象插图(构图大空白:2),一个禅意中的女人,在混乱中沉默,展现了一种枯萎的生命和成长的活力的哲学,
Abstract painting, modern abstract illustration (composition blank: 2), a Zen woman who remains silent in chaos, showcasing a philosophy of withered life and growing vitality,
可见,自然语言模式目前已经重新回到主流路线上。
我们也更推荐大家用自然语言去描述,这是因为用自然语言对接,你能够更多的使用GPT等语言模型去生成描述,而不用自己绞尽脑汁。
我们不建议入门者养成一直使用长描述的习惯。
比如,下面这种是早期流行的长描述词:
[[([(Delicate eyes,glowing eyes,red eyes, black pupil,(beautiful eyes:1.2),(serious),(gradient eyes)):[((messy_hair),(Long hair:1.2),(lightning),Lots of lightning,([white hair|Lavender hair]:1.3))😦(Flowing hair:1.2),Long flowing hair,beautiful hair):0.6]:0.7],(Delicate face:1.2),(shoulder cutout),(Gorgeous clothes:1.3),(beautiful arms:1.2),(Characters stay away:1.4),(Small breasts:1.2),[[😦(Scepter weapon,The thunder wand,Crystal texture of the hair):1.4):0.5]::0.9],[((lightning),many glowing ribbon,Shine tire,glowing magic circle in sky,(glowing halo around girl:1.3))😦(exquisite Magic Circle:1.7),(Many purple flashes:1.4)):0.5],(Gorgeous accessories:1.2),(Gorgeous special effects:1.3),(highres:1.3),(magic:1.3),(glowing light:1.3),(exquisite magic array:1.2),(Strong vision),(Magic in hand:1.3),(starry sky:1.3),(huge Brilliant magic),(glowing light:1.2),(Dimensional space is broken),(lightning:1.3),god rays,night, black pupils,(clock method array:1.2),standing,Hair and lightning blend together,(Lightning ribbon:1.2)):(lightning:1.2):0.8]:(Delicate arms and hands):0.9]]
这种描述词在当时流行,是因为当时缺乏更多除了关键词之外控制画面的办法,因此,大家只能通过给每一个词加上权重,不断微调,让画面更接近想象。
但是,由于给每一个词都加了权重,都有权重等于都没有权重,实际上同样不会起到很好的效果。
正面描述如此,负面描述也同样。
比如,下面是一个我们早期常见的堆砌负面描述的典型:
(worst quality:2), (low quality:2), (normal quality:2), lowres, bad anatomy, bad hands, ((monochrome)), ((grayscale)) watermark, canvas frame, cartoon, 3d, ((disfigured)), ((bad art)), ((deformed)),((extra limbs)),((close up)),((b&w)), wierd colors, blurry, (((duplicate))), ((morbid)), ((mutilated)), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))), out of frame, ugly, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck))), Photoshop, video game, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, mutation, mutated, extra limbs, extra legs, extra arms, disfigured, deformed, cross- eye, body out of frame, blurry, bad art, bad anatomy, 3d render
但实际上,大量的实践证明,大量的负面提示词会对生成的图片产生灾难性的影响。因为无论我们自己如何的自我感觉良好,实际上负面提示词都会对画面产生一定的影响,并且很多影响是不可预见。而我们想要的,比如“完美的手脚”,实际上还得靠运气。
因此,大量的负面描述词堆砌,并没多大作用,反过来,还导致很多想要达到的效果无论如何也无法实现。在1.5时代,这种情况并不明显,但在SDXL时代,你确实需要更短和更精准的负面描述词。
但由于AIGC刚刚爆火,网上相关内容的文章博客五花八门、良莠不齐。要么杂乱、零散、碎片化,看着看着就衔接不上了,要么内容质量太浅,学不到干货。
这里分享给大家一份Adobe大神整理的《AIGC全家桶学习笔记》,相信大家会对AIGC有着更深入、更系统的理解。
有需要的朋友,可以长按下方二维码,免费领取!
AIGC所有方向的学习路线思维导图
AIGC工具库
有需要的朋友,可以点击下方卡片免费领取!
精品AIGC学习书籍手册
书籍阅读永不过时,阅读AIGC经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验,结合自身案例融会贯通。
AI绘画视频合集
我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,科学有趣才能更方便的学习下去。
以上就是本篇文章【AI绘画入门教程重制版:如何抓住AI的心?流水的模型,铁打的描述词基础】的全部内容了,欢迎阅览 ! 文章地址:http://xiaoguoguo.dbeile.cn/news/8566.html 资讯 企业新闻 行情 企业黄页 同类资讯 首页 网站地图 返回首页 多贝乐移动站 http://xiaoguoguo.dbeile.cn/mobile/ , 查看更多