Disco Diffusion

    下载量:0    评分:8.0    更新时间:2023-08-08    大小:1 KB


软件介绍

Disco Diffusion 为用户给予了技术专业强劲的作用,可以协助用户根据AI生成的形式开展做画,手机软件中包括了很多不一样种类的模式实际效果,用户可以依照文字说明生成相对应的图片,打造更为健全栩栩如生的模型情景,让用户制作图象更为简洁便捷,该版本号具备适用线下实际操作,十分好用。

软件特性

Disco Diffusion官方版中扩散是从图像中去除噪声的数学过程,而CLIP是用于标记图像的工具。结合使用时,CLIP使用其图像识别技术迭代地引导扩散去噪过程,使图像的内容逐渐与文本提示的概念紧密匹配。

上面的图片便是在DD中仅使用“提示”创建的,其内容为:“A beautiful painting of a singular lighthouse,shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade,Trending on artstation.”

扩散是一个迭代的过程。在每次迭代/步骤中,CLIP都会根据“提示”评估现有图像,并为扩散过程提供“方向”。扩散将对现有图像进行“去噪”,而DD将显示其对最终图像外观的“当前估计”。最初,图像只是一团模糊混乱的噪点,但随着DD迭代的推进,图像的细节从逐渐由粗略变为精细。

随着CLIP根据“提示”不断引导扩散降噪过程,图像在该过程中逐渐变得清晰。

图像的内容通常由“提示”——句子、短语和一系列描述性词语(译者注:甚至是网络关键词和艺术家!例如trending on artstation——artstation上的热搜、Miyazaki Hayao——宫崎骏)控制,这些词语告诉CLIP您想看到什么。

为AI艺术创建一个好的“提示”是一项细致入微、具有挑战性的任务,需要大量的反复试验和实践。它需要您琢磨学习,但本指南不会详细介绍。我们侧重于介绍如何调整Disco Diffusion该jupyter文件的基本参数。

DD的大部分控制参数需要填写具体数字,以控制CLIP模型和扩散曲线的各个方面。使用DD的一般流程是:

填写“提示”

调整控制参数

运行jupyter文件,创建图像

根据使用的设置和可用的处理器不同,DD渲染单个图像的时间从5分钟到一个小时不等,甚至更长时间

微调“提示”和控制参数既复杂又耗时,因此不断去尝试并形成自己的一套技巧会更好。我们建议您先尝试一下jupyter文件中的默认设置,以确认文件运行正常并且您的设置没有错误。在那之后,尽情地实践你的点子吧!

此外,尽管DD支持生成整个作画过程的动画,您仍应该从学习如何创建静止图像开始,因为学会创建图像后生成动画将十分简单。

用AI(Artificial Intelligence/人工智能)创造艺术是神奇而复杂的,数据科学家和程序员在该领域的研究从未停止。因此,如果一点点努力与专注都不屑于付出的话,你同样可能毫无收获。DD有几十个控件,交互复杂,限制少,很容易得到不好的结果。但不要气馁!

请记住,您并不孤单。成千上万的人正在学习和学习AI艺术,并且有许多资源可以与其他DD用户和AI艺术家联系并向他们学习。

使用方法

1、缓解压力pic_disco.zip,生成pic_disco目录;

2、百度云盘里的models文件夹挪动到pic_disco目录中;

3、vgg16-397923af.pth存进:C:UsersAdministrator.cache orchhubcheckpoints 注:很有可能目录作为前缀(有些是C:UsersAdministrator,有的是C:UsersUser)不一样,但全是用户目录下,建立.cache orchhub目录就可以;

4、打开软件 进到手机软件目录pic_disco,双击鼠标开启DD5.exe程序流程就可以

做图配备

主目录pic_disco文件夹名称的ini.json便是做图环境变量,可以打开挑选文本文件开启。

如下图简易表明好多个重要配备点:

1、导出图片目录:pic_discoimages_out;

2、全过程图片目录:pic_discoprogress.png,每好多个step(工作频率可配备)升级一次图片;

3、原始图途径:默认设置 "init_image": null 意味着不用原始图,想应用原始图,将null改成图片途径,例如下边那样(还记得用替代): "init_image": "F:PYQT5disco-diffusion-maintest.png"。

电脑显卡规定

默认设置实体模型下,很有可能必须最少6GB显卡显存,下列为网民检测状况:

(1) RTX2060 6G独显,图片规格256*512行得通;

(2) RTX1070 8G独显,250steps用时预计2钟头,图片规格1280*720;

(3) RTX2070S 8G独显,450steps用时预计16min,图片规格960*448;

(4) RTX3090 24G独显,450steps用时预计10min,图片规格1280*720。

安装步骤

在下载完成后,您需要运行软件的安装程序。安装程序会为您提供一些必要的步骤,来确保软件被正确安装。安装程序会要求您接受软件的许可证协议、选择安装位置以及确认安装选项。在确认了所有的选项后,您只需要等待软件的安装程序自动为您安装软件即可。

软件官网

https://disco-diffusion.com/


软件综述

Disco Diffusion 是一款基于文本到图像模型的交互式图像生成软件。它允许用户使用自然语言提示创建独特且引人入胜的图像。

优点:

  • 强大的图像生成能力: Disco Diffusion 利用 AI 技术生成高分辨率、详细且逼真的图像。
  • 易于使用: 用户界面友好,即使是初学者也能轻松使用。
  • 广泛的文本提示选项: 用户可以提供详细的描述、情感基调和艺术风格,以指导图像生成。
  • 实时生成: 响应提示,Disco Diffusion 会实时生成图像,允许用户探索不同的可能性。
  • 社区支持: Discord 服务器和在线论坛提供了一个活跃的社区,用户可以分享技巧、提示和灵感。
  • 开源: Disco Diffusion 是开源的,这意味着用户可以自定义并改进该软件。

缺点:

  • 计算密集: 图像生成过程需要大量的计算能力,这可能会导致处理速度较慢,特别是对于具有复杂提示的生成。
  • 有限的艺术风格: 尽管 Disco Diffusion 可以生成各种风格的图像,但它主要专注于超现实主义、梦幻般的艺术。
  • 版权问题: 使用 Disco Diffusion 生成图像时,了解版权和许可问题非常重要。
  • 偶尔出错: 像所有软件一样,Disco Diffusion 偶尔会出现错误,可能导致图像生成失败或质量不佳。

总体而言:

Disco Diffusion 是一款功能强大且易于使用的图像生成软件,适用于创作者、艺术家和任何想要探索 AI 艺术世界的人。尽管存在一些缺点,但它的创新功能和不断发展的社区使其成为文本到图像生成领域的一个有价值的工具。

THE END
喜欢就支持一下吧
点赞21 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容