已开源!一秒实时生成100张二次元老婆照!

你好,我是坚持分享干货的 EarlGrey,翻译出版过《Python编程无师自通》、《Python并行计算手册》等技术书籍。

如果我的分享对你有帮助,请关注我,一起向上进击。

创作不易,希望大家给一点鼓励,把公众号设置为“星标”,给文章点个“赞”“在看”,谢谢大家啦~

本文分享自量子位。

866e5fe8437b69b1a75bbef75d43aa95.jpeg

单RTX4090,每秒生成100张图!

fb2d2bb6c99206bd4d8b4a7883201776.gif

一种专为实时交互式图像生成而设计的一站式解决方案,登顶GitHub热榜

40d58bda73546e18bc5d65be2bc0630c.gif

方案名为StreamDiffusion,支持多种模型和输出帧率。

e4e328314c92e06c43298d1db72a350a.gif

无论是图像到图像,还是文本到图像,都能实时生成:

bafbeff8bb8a78070c501308a8598c7d.gif

重点是,该项目现已开源,在GitHub热榜已狂揽3400+星。

438bc1c78ea1b9038f4a91604382ea6a.png

经测试,使用SD-turbo模型在去噪步骤为1步的情况下,文本-图像每秒帧率可达106,图像-图像每秒帧率达到93。

CM-LoRA+KohakuV2模型在4步的情况下,文本-图像每秒帧率为38,图像-图像每秒帧率为37。

b785e78c5d86c8871a21fe87bc192bb0.png

除了高吞吐量、低延迟,StreamDiffusion还做到了低功耗。单块RTX3060上,可降低58.2%的功耗;单块RTX4090,降低49.8%。

网友们也是玩嗨了,纷纷上手尝试:

56b9058b7b381ff6b362552a317736f1.gif

浅浅留下一个字:

27dd58045cd641fd967af26e98b98503.png

StreamDiffusion长啥样?

StreamDiffusion由来自UC伯克利、日本筑波大学等的研究人员联合提出。

4ebcafb1af22c6aa538047b7189c44ae.png

StreamDiffusion Pipeline包含六大组件:Stream Batch、残差无分类器指导(RCFG)、输入-输出队列、随机相似性过滤器、KV-Caches预计算、带有小型自动编码器的模型加速工具。

首先Stream Batch,是将原来顺序的去噪步骤改为批量化处理。允许在一个批处理中,每幅图像处于去噪流程的不同阶段。

如此一来,可以大大减少UNet推理次数,显著提高吞吐量。

9e328dc7a5f6fb15d9f110b47e44ce0c.png

此外,原先的CFG算法中,需要额外大量计算负样本,导致计算效率低下。

RCFG方法则构建一个“虚拟残差噪声”,这样就只需要一次或者零次负样本计算,减少了计算负样本的开销。

e6ad5891dc648a695496a3ef92039864.png

相比之前的CFG方法加速了2倍。

b0f6575ab9962d7aa4f6762e966eccb3.png

输入-输出队列主要是利用队列存储缓冲输入和输出,将图像数据预处理等操作与UNet主体网络分隔开,实现pipeline各个处理环节的并行化,防止处理速度不匹配的情况发生。

随机相似性过滤器,可以基于图像相似性跳过一些UNet处理,减少不必要的计算量,降低功耗:

21280fcd3d32209b9ec04eadf0c5b3cc.gif

预计算则是提前缓存一些静态量,如提示嵌入、噪声样本等,减少每次生成的重复计算。

a98260c163399a1466a91ceb53ded9cd.png

最后,使用TensorRT、Tiny AutoEncoder等加速模块,对模型进行优化,进一步提升推理速度。

3078316e89ac98fa0aea76e734bcaf5e.png

在测试阶段,研究人员使用SD-turbo、512x512分辨率、批处理大小为1,进行文本到图像的生成。

结果,使用StreamDiffusion可以在10毫秒内生成一张图像,也就是一秒100多张图。

参考链接:https://github.com/cumulo-autumn/StreamDiffusion

- EOF -

文章已经看到这了,别忘了在右下角点个“赞”和“在看”鼓励哦~

推荐阅读  点击标题可跳转

1、VS Code 变身小霸王游戏机!

2、认知升级:模型与范式转换

3、超赞的 Python 编译器,单核提速100倍

4、高效的终极秘诀

5、Python 3.12 版本有什么变化?

回复下方「关键词」,获取优质资源

回复关键词「 pybook03」,领取进击的Grey与小伙伴一起翻译的《Think Python 2e》电子版

回复关键词「书单02」,领取进击的Grey整理的 10 本 Python 入门书的电子版

👇关注我的公众号👇

告诉你更多细节干货

e8db5e7caeb5f37971e301fb6b3984cd.jpeg

欢迎围观我的朋友圈

👆每天更新所想所悟

代码下载地址: https://pan.quark.cn/s/bcac7912890d 在本文中,我们将详细研究如何将Windows 10操作系统调整为类似苹果的主题风格,并分析这一过程可能涉及的关键技术要素。Windows 10用户有时期望通过改变系统界面来获得与苹果Mac OS相近的体验,这通常涉及到图标、窗口布局、任务栏等方面的调整。"windows10美化变仿苹果主题"是一个此类解决方案,它致力于提供一种简便高效的方法,让用户能够在不降低系统性能的情况下,使Windows 10的外观更接近苹果的操作系统。 我们需要熟悉这个美化工具的关键部分——"安装程序Dock.exe"。Dock是苹果Mac OS中的一个显著功能,它是一个可定制的快捷方式条,用于迅速访问常用的应用程序和文件。在Windows 10中,实现仿苹果主题通常包括一个类似的功能,模拟Mac的Dock效果,使用户能够便捷地启动和切换应用程序。这个Dock程序很可能包含了模仿Mac样式的任务栏和启动器的界面组件。 在描述中提及的"一键启动,完美仿苹果",表明这个美化工具应该是用户友好的,只需执行一个简单的步骤,就能完成整个系统的转换。这样的设计对于那些不熟悉复杂系统设置调整的用户来说非常便利。同时,"支持:windows7/windows10"显示这个工具不仅适用于Windows 10,还适用于较早版本的Windows 7,拓宽了它的适用范围。 值得关注的是,该工具被强调为"不会占用很多资源",在个人电脑测试中,仅消耗3%的内存资源。这在一定程度上确保了系统性能不会因为美化而受到明显影响。在进行系统美化时,保证软件的轻量化和资源使用效率是至关重要的,因为过多的后台进程可能会减慢系统运行速度。 在达...
源码链接: https://pan.quark.cn/s/a4b39357ea24 ### MG996R舵机控制详细说明 #### 一、MG996R舵机概述 MG996R舵机是一种在机器人、无人机、模型飞机等多个领域得到普遍应用的伺服电机。该舵机能够依据输入的脉冲宽度调制(PWM)信号进行精准的角度定位。由于具备操作简便、运行高效、成本较低等优势,这种舵机在各种机电控制系统中被频繁采用。 #### 二、MG996R舵机的工作机制 MG996R舵机内部配备了一个精密的反馈系统,确保其输出的角度具有高度的精确性。其主要运作过程如下: 1. **控制信号调节**:控制信号由接收机的通道传输至信号调制芯片,该信号通常表现为周期性变化的PWM信号。信号调制芯片会提取出这一信号中的直流偏置电压。 2. **基准信号的产生**:舵机内部设有基准电路,用于生成一个周期为20ms、宽度为1.5ms的基准信号。 3. **电压对比**:所获取的直流偏置电压与电位器的电压进行对比,从而得出电压差。 4. **电机驱动**:电压差的正负决定了电机的旋转方向。电机通过一系列的齿轮减速装置驱动电位器旋转,使电压差趋近于零,此时电机停止转动。 #### 三、舵机控制信号详述 舵机的控制信号通常采用PWM信号,通过调节信号的占空比来控制舵机的位置。一般情况下,对舵机的控制要求如下: - **周期**:通常设置为20ms。 - **脉冲宽度**:依据所需控制的角度而变动,通常范围为1ms至2ms之间。 - **最小脉冲宽度**:1ms对应舵机的最左侧位置。 - **最大脉冲宽度**:2ms对应舵机的最右侧位置。 - **中间位置**:1.5ms对应的脉冲宽度代表舵机的中心位置。 #### 四...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值