硬件加速和音频处理改进此版本专注于扩展硬件支持并增强工作流创建者的音频处理能力:
音频处理增强
- PyAV 音频后端:用 PyAV 替换 torchaudio.load,在视频工作流中提供更可靠的音频处理,改善兼容性和性能
- 更好的音频集成:增强多媒体生成工作流的音频处理,特别有利于视频内容创作者
扩展的硬件支持
- Iluvatar CoreX 支持:添加对 Iluvatar CoreX 加速器的原生支持,为 AI 推理扩展硬件选项
- Intel XPU 优化:全面的 XPU 支持改进,包括异步卸载功能和设备特定优化
- AMD ROCm 增强:在 Torch 2.8 上为 gfx1201 默认启用 PyTorch attention,提升 AMD 硬件性能
- CUDA 内存管理:修复 CUDA malloc 仅在启用 CUDA 的 PyTorch 安装上激活,防止在其他平台上发生冲突
采样算法改进
- Euler CFG++ 增强:在 Euler CFG++ 采样器中分离去噪和噪声估计过程,改善数值精度和质量
- WAN 模型支持:添加对 WAN(基于小波的注意力网络)模型的全面支持,包括 ATI 支持和 WAN 2.2 兼容性
高级训练功能
- 增强的训练节点:向训练工作流添加算法支持、梯度累积和可选梯度检查点
- 改进的训练灵活性:为自定义模型训练提供更好的内存管理和性能优化
节点和工作流增强
- Moonvalley V2V 节点:添加 Moonvalley Marey V2V 节点,为视频到视频工作流提供增强的输入验证
- 负面提示词更新:改进 Moonvalley 节点的负面提示词处理,提供对生成输出的更好控制
- 历史 API 增强:向 get_history API 添加 map_function 参数,实现更灵活的工作流历史管理
API 和系统改进
- 前端版本跟踪:在 /system_stats API 响应中添加 required_frontend_version 参数,改善版本兼容性
- 设备信息:增强 XPU 设备名称打印,改善硬件识别和调试
- 模板更新:多个模板更新(0.1.40、0.1.41),确保与最新节点开发标准的兼容性
开发者体验
- 文档更新:使用 HiDream E1.1 示例增强 README,并更新模型集成指南
- 行结束符修复:通过标准化工作流中的行结束符改善跨平台兼容性
- 代码清理:移除已弃用的代码并优化各种组件以提高可维护性
高级采样与训练基础设施改进本版本为AI研究人员和工作流程创建者引入了采样算法、训练功能和节点功能的重大增强:
新的采样和生成功能
- SA-Solver采样器:新的重构SA-Solver采样算法,为复杂生成工作流提供增强的数值稳定性和质量
- 实验性CFGNorm节点:高级无分类器引导标准化,用于改进生成质量和风格一致性的控制
- 嵌套双CFG支持:为DualCFGGuider节点添加嵌套风格配置,提供更复杂的引导控制模式
- SamplingPercentToSigma节点:用于从采样百分比精确计算sigma的新实用节点,提高工作流程灵活性
增强的训练功能
- 多图像-描述数据集支持:LoRA训练节点现在可以同时处理多个图像-描述数据集,简化训练工作流程
- 更好的训练循环实现:优化的训练算法,在模型微调过程中改善收敛性和稳定性
- 增强的错误检测:为LoRA操作添加模型检测错误提示,在出现问题时提供更清晰的反馈
平台和性能改进
- 异步节点支持:完全支持异步节点函数,优化早期执行,改善I/O密集型操作的工作流程性能
- Chroma灵活性:在Chroma中取消硬编码的patch_size参数,允许更好地适应不同的模型配置
- LTXV VAE解码器:切换到改进的默认填充模式,提高LTXV模型的图像质量
- Safetensors内存管理:为mmap问题添加解决方案,提高加载大型模型文件时的可靠性
API和集成增强
- 自定义提示ID:API现在允许指定提示ID,以便更好地跟踪和管理工作流程
- Kling API优化:增加轮询超时时间,防止视频生成工作流程中的用户超时
- 历史令牌清理:从历史项目中删除敏感令牌以提高安全性
- Python 3.9兼容性:修复兼容性问题,确保更广泛的平台支持
错误修复和稳定性
- MaskComposite修复:解决目标蒙版具有2个维度时的错误,提高蒙版工作流程可靠性
- Fresca输入/输出:修正Fresca模型工作流程的输入和输出处理
- 引用错误修复:解决Gemini节点实现中的错误引用问题
- 行结束标准化:自动检测和删除Windows行结束符,确保跨平台一致性
开发者体验
- 警告系统:添加torch导入错误警告,以捕获常见配置问题
- 模板更新:多个模板版本更新(0.1.36、0.1.37、0.1.39),改进自定义节点开发
- 文档:增强便携式配置中fast_fp16_accumulation的文档
高级采样和模型控制增强此版本在采样算法和模型控制系统方面提供了重大改进,特别有利于高级AI研究人员和工作流创建者:
新采样功能
- TCFG节点:增强的分类器无关引导控制,为您的工作流提供更细致的生成控制
- ER-SDE采样器:从VE迁移到VP算法,配备新的采样器节点,为复杂生成任务提供更好的数值稳定性
- 跳层引导(SLG):用于推理期间精确层级控制的替代实现,完美适用于高级模型导向工作流
增强的开发工具
- 自定义节点管理:新的
--whitelist-custom-nodes参数与--disable-all-custom-nodes配对,提供精确的开发控制 - 性能优化:双CFG节点现在在CFG为1.0时自动优化,减少计算开销
- GitHub Actions集成:自动化发布webhook通知让开发者及时了解新更新
图像处理改进
- 新变换节点:添加了ImageRotate和ImageFlip节点,增强图像操作工作流
- ImageColorToMask修复:修正了掩码值返回,提供更准确的基于颜色的掩码操作
- 3D模型支持:上传3D模型到自定义子文件夹,为复杂项目提供更好的组织
引导和条件增强
- PerpNeg引导器:更新了改进的前后CFG处理以及性能优化
- 潜在条件修复:解决了多步骤工作流中索引 > 0 的条件问题
- 去噪步骤:为多个采样器添加去噪步骤支持,获得更清洁的输出
平台稳定性
- PyTorch兼容性:修复了PyTorch nightly构建的连续内存问题
- FP8回退:当FP8操作遇到异常时自动回退到常规操作
- 音频处理:移除了已弃用的torchaudio.save函数依赖并修复警告
模型集成
- Moonvalley节点:为Moonvalley模型工作流添加原生支持
- 调度器重新排序:简单调度器现在默认优先,提供更好的用户体验
- 模板更新:多个模板版本更新(0.1.31-0.1.35),改进自定义节点开发
安全性和安全保护
- 安全加载:在不安全加载文件时添加警告,文档说明检查点文件默认安全加载
- 文件验证:增强检查点加载安全措施,确保工作流安全执行
增强模型支持与工作流可靠性本次发布在模型兼容性和工作流稳定性方面带来了重大改进:
- 扩展模型文档:为 Flux Kontext 和 Omnigen 2 模型添加了全面的支持文档,让创作者更容易将这些强大的模型集成到他们的工作流中
- VAE 编码改进:移除了 VAE 编码过程中不必要的随机噪声注入,使工作流运行的输出更加一致和可预测
- 内存管理修复:解决了专门影响 Kontext 模型使用的关键内存估算错误,防止内存不足错误并提高工作流稳定性
主要模型支持新增
- Cosmos Predict2 支持:全面实现文本到图像(2B 和 14B 模型)和图像到视频生成工作流,扩展视频创作功能
- 增强的 Flux 兼容性:Chroma Text Encoder 现在能与常规 Flux 模型无缝协作,提升文本条件质量
- LoRA 训练集成:使用权重适配器方案的全新原生 LoRA 训练节点,支持在 ComfyUI 工作流中直接进行模型微调
- AMD GPU 增强:在 GFX1201 和其他兼容的 AMD GPU 上启用 FP8 操作和 PyTorch 注意力机制,加速推理
- Apple Silicon 修复:解决了 Apple 设备上长期存在的 FP16 注意力问题,提升 Mac 用户的稳定性
- Flux 模型稳定性:解决了特定 Flux 模型在 FP16 精度下生成黑色图像的问题
- Rectified Flow (RF) 采样器:新增支持 RF 的 SEEDS 和多步 DPM++ SDE 采样器,为前沿模型提供更多采样选项
- ModelSamplingContinuousEDM:新增 cosmos_rflow 选项,增强对 Cosmos 模型的采样控制
- 内存优化:改进了支持无限分辨率的 Cosmos 模型的内存估算
- SQLite 数据库支持:增强自定义节点和工作流存储的数据管理功能
- PyProject.toml 集成:从 pyproject 文件自动注册 web 文件夹和配置设置
- 前端灵活性:支持语义化版本后缀和预发布前端版本,适用于自定义部署
- 分词器增强:通过 tokenizer_data 配置 min_length 设置,优化文本处理
- Kontext 宽高比修复:解决了仅限小组件的限制,现在在所有连接模式下都能正常工作
- SaveLora 一致性:统一所有保存节点的文件名格式,优化文件组织
- Python 版本警告:为过时的 Python 安装添加警报,防止兼容性问题
- WebcamCapture 修复:修正了 IS_CHANGED 签名,确保实时输入工作流的可靠性
本次发布为 ComfyUI 创作者带来了强大的新工作流实用工具和性能优化:
新的工作流工具
- ImageStitch 节点:在工作流中无缝拼接多个图像 - 非常适合创建对比网格或复合输出
- GetImageSize 节点:提取图像尺寸并支持批处理,对于动态调整大小的工作流至关重要
- Regex Replace 节点:高级文本处理功能,适用于提示词工程和字符串处理工作流
增强的模型兼容性
- 改进的张量处理:简化的列表处理使复杂的多模型工作流更加可靠
- BFL API 优化:完善了对 Kontext [pro] 和 [max] 模型的支持,提供更清晰的节点界面
- 性能提升:在色度处理中使用融合乘加运算,加快生成速度
开发者体验改进
- 自定义节点支持:添加 pyproject.toml 支持,改善自定义节点依赖管理
- 帮助菜单集成:在节点库侧边栏中新增帮助系统,加快节点发现速度
- API 文档:增强 API 节点文档,支持工作流自动化
前端和 UI 增强
- 前端更新至 v1.21.7:多项稳定性修复和性能改进
- 自定义 API 基础支持:改进了自定义部署配置的子路径处理
- 安全加固:修复 XSS 漏洞,确保工作流分享更安全
错误修复和稳定性
- Pillow 兼容性:更新了已弃用的 API 调用,保持与最新图像处理库的兼容性
- ROCm 支持:改进了 AMD GPU 用户的版本检测
- 模板更新:增强了自定义节点开发的项目模板