如何不爬梯无偿经常使用AI文生图

2024-11-15

如今各种AI大模型大行其道，前有ChatGPT推翻了咱们对对话型AI的原有印象，后有Sora文生视频，让咱们看到了应用AI启动创意创作的有限或者性。如今各大公司和团队都争相提出自己的大模型，各种网页端和软件运行也极大地降落了咱们经常使用AI作为消费劲的门槛。惋惜很多要么须要翻墙爬梯子，要么须要付费买会员，要么生成的图片不现实。

那么有没有不爬梯又比拟好用的文生图工具呢？

"文生图"是一个极具翻新性的在线AI工具，它能够依据用户输入的文字形容，极速生成相应的图像。这个环节不只快捷，而且能够节俭少量的期间和资源。关于那些须要少量图像但又不宿愿破费太多精神的用户来说，这无疑是一个现实的处置打算。不论是须要插画、漫画、图标，还是其余类型的图像，只有繁难输入文字形容，AI就能发生出令人满意的图像作品。

如今的AI绘图关键用到的模型是SD（Stable Diffusion），它是一种稳固分散模型，用于生成高品质的图像。这种模型是在传统的分散模型DDPMs（Denoising Diffusion Probabilistic models）的基础上开展进去的。

通过多个版本的迭代和改良，这类模型曾经能很好的口头“文生图”、“图生图”、“前期处置”等AI性能，甚至可以在必定水平上替代PhotoShop等图像处置软件的任务。

如今许多开发者都颁布了基于SD模型的改良型模型，基本上一切的网页端和软件也都是基于此模型搭建的，要经常使用它启动AI绘画，关键有三种方法：

1.自己搭建基于SD的webui，在gitHub上有名目标源代码：。这种方式的优势是自在度高，可以依据自己的需求启动客制化变革，降级也最及时，然而要自己启动环境搭建，关于普通用户来说学习门槛较高，国际经常使用的话须要魔法，同时通过我的体验稳固性不高，经常会失败。

2.经常使用网页端运行，这类网站是基于stable-diffusion-webui 搭建的第三方平台，由他们担任保养和降级，并提供稳固的衔接，用户只有要选用须要的模型和参数，输入揭示词，就可以在线生成图片。

国际有：Liblib Ai：

国外的：Playground AI：，每天有不要钱的体验次数，速度和品质也不错。

这类网站普通都有自己的模型市场，以供创作者们上行和下载自定义的模型，并且分享自己的绘图作品以及关系生图的参数，十分繁难。然而普通都会不要钱，还没体验就让人付费，是IT程序员最厌恶的事儿。

3.PC端软件，这类软件普通也是基于SD模型启动封装，可以下载模型，设置参数并在本地生成图片，经常使用体验相似于PS等图片处置软件，然而因为整个生成环节在本地口头，比拟依赖于本机算力，电脑性能不好的话生成会很慢，然而好处就是自定义水平相对较高，而且普通不要钱。

生图软件

最近发现Draw Things，Mac端App Store不要钱下载。

他的界面是这样的：

参数设置区用于选用模型，采集器，步数和随机种子等参数，初次生成图片首先选用“文本到图像”形式。模型是AI绘画的基础，普通的模型都是基于SD改良的，SD模型也有V1.0、V1.5、V2.0、V2.1等不同的迭代版本，不同的模型可以生成不同格调的图片，可以依据自己的须要启动选用，模型可以在DrawThings里启动下载和选用，当然也可以在Liblib Ai等网站高低载而后导入。

模型分为几个关键的种类：

chekpoint（审核点）

它是完整模型的经常出现格局，模型体积较大，普通真人版的单个模型的大小在7GB左右，动漫版的在2-5个G之间。选择了图片的全体格调。chekpoint的后缀名是safetensors

有写实，科幻，漫画，广告等等格调

是一种体积较小的绘画模型，是对大模型的微调。可以参与Lora为图片发明更丰盛的体现方式。与每次作画只能选用一个大模型不同，lora模型可以在已选用大模型的基础上参与一个甚至少个。普通体积在几十到几百兆左右。

Lora的后缀名也是safetensors，所以在装置的时刻要留意，Lora要在规则的中央导入：

Hypernetwork（超网络）

相似 LoRA ，但模型成果不如 LoRA，不能独自经常使用，须要搭配大模型经常使用。

采样器

采样器也会在必定水平上影响图画格调，不同于模型，它普通是基于算法。选用对的采样器关于生成图片的品质至关关键，上方引见一些干流的采样器类型：

DDIM和PLMS是早期SD专为分散模型而设计的采样器。DPM和DPM++系列是专为分散模型而设计的新型采样器。DPM++是DPM的改良版。

Euler a 比拟实用于图标设计、二次元图像、小型场景等繁难的图像数据生成场景。

DPM和DPM++系列十分实用于三维现象和复杂场景的描画，例如写实人像。

Karras系列是专为分散模型而设计的改良版采样器，有效优化了图片品质。

Euler a，DPM2 a, DPM++2S a和DPM++2S a Karras适宜给图片参与发明性,随着迭代步数的优化，图片也会随之变动。不同的采样方法或者对不同的模型发生不同的影响，会影响生成图片的艺术格调，倡导联合模型和迭代步数多做尝试。

步数

生图时，去噪重复的步数被称为采样迭代步数。测试新的模型或Prompts成果时，迭代步数介绍经常使用10~15，可以极速取得结果，繁难启动调整。当迭代步数太低时，生成的图像简直不可出现内容。20 ~30之间的迭代步数通常会有不错的成果。40步以上的迭代步数会须要更长的生图期间，但收益或者有限，除非在绘制生物毛发或皮肤纹理等。过低或过高的初始分辨率都或者会让SD生图时不可反常施展，倡导参考基础模型的分辨率，性能适宜的初始宽高。

随机种子

随机种子会影响生图时的初始噪声图像。当Seed=-1时，示意每次出图都会随机一个种子，使得每次生成的图都会不同。其余创作者上行图片的时刻，普通会附带此图片对应的随机种子，可以参考它来生成相似的图片。点击可以生成一个随机的种子，长按则可以输入特定的随机种子。

揭示词

揭示词是生成图片时关键中的关键，它间接选择了图片内容，画面格调，场景，表情举措等一些列内容，在生成图片时，选用适宜的揭示词至关关键。

揭示词分为“正向揭示词”和“反向揭示词”，“正向揭示词”代表你想要在图片中出现的内容，反之“反向揭示词”则是不想要在图片里具有的因素。比如，我想要画一张“西瓜大促”关系的宣传图，我就可以这样形容：

“许多人在湖里流动的水边吃西瓜，高品质的微型摄影”，翻译成英文：“Many people eat watermelons by the flowing water in the lake, with high-quality miniature photography”

将这段文字输入DrawThings的文本框，它会智能把整句话拆分红一个个揭示词。

当然，咱们也可以间接填入想要绘制的揭示词：

还有一些其余的参数，比如图片分辨率和比例，文本指点强度（越高越虔诚出现文本内容），以及一次性生成的图片数量等等

设置好一切，就可以开局生成图片了，可以多尝试几张，从中筛选最适宜的启动二次处置。

二次处置

假设对生成的图片有些细节不满意，可以应用“图像到图像”形式，而后选用强度。高分辨率修复的重绘强度为0时不会扭转原图，30% 以下会基于原图稍微批改，超越 70% 会对原图做出较大扭转，1 会获取一个齐全不同的图像。

二次处置关键包含以下几个目标：

重绘图像元素

假设对图像中某局部的元素不满意，可以用“橡皮擦”擦除该局部，而后重重生成，让模型智能将擦数的局部重绘，甚至可以消弭某局部图像元素，实测成果甚至好于PS。

扩图

关于一张图片，假构想要裁减边界局部，让模型绘制出额外的内容，可以首先从新设置图片的宽高。我这里原是图片是1088*2048，想要裁减左侧湖里的现象，就可以先将图片宽度参与到1536，而后移动图片到右侧贴紧图层边缘。而后最关键的一步，用“橡皮擦”工具，沿着想要裁减的那一边，细细的擦一道，这么做的目标是通知模型，从这一部离开局重绘，格调要依照擦除的这局部来启动，而后重重生成图片。

优化画质

最开局生成图片时，为了提高速度和效率，可以适当降落分辨率，的到适宜的图片，可以重设分辨率和明晰度，重绘图片，到达优化画质的目标。当然，关于曾经曾经画好的第三方图片，也可以加载出去启动处置。

好了，本篇应用AI绘图启动通常的文章就引见到这里，宿愿能够协助到大家。

原文链接：

<<一文看尽Query的转换之路 RAG初级优化

LLaMA>>