ComfyUI中使用Qwen3-tts记录
04 Feb 2026 ComfyUI Qwen3-tts
Qwen3-tts这个模型,据说效果不错,于是试着安装了下。
使用设备4060Ti,8GB显存。
版本信息:
- ComfyUI 0.12.0
- flybirdxx/ComfyUI-Qwen-TTS Commits on Jan 29, 2026
ComfyUI
ComfyUI使用的是官方的ComfyUI_windows_portable版本,在ComfyUI官方库的Release中可以找到。这个版本的依赖库是装好的,可以减少很多麻烦。用Desktop Application版本应该也是可以的,但是之前不知道点了什么功能,不小心把环境搞坏了,就换了portable的版本手动操作了。
Custom node安装
Portable版本可以很方便自己手动安装,在安装前在powershell中先调整python环境,让python.exe指向portable中嵌入的版本即可。例如,我是解包在F:\ComfyUI_windows_portable\,那么先执行以下指令,临时修改env便可:
$env:PATH = "F:\ComfyUI_windows_portable\python_embeded;" + $env:PATH
修改后执行
python -m pip --version
查看输出以确保当前powershell环境正确设置:
pip 26.0 from F:\ComfyUI_windows_portable\python_embeded\Lib\site-packages\pip (python 3.12)
不过需要留意,这样执行之后pip不会直接修改,需要使用
python.exe -m pip install -r .\requirements.txt
来安装python包,而不是直接执行pip。
之后cd .\ComfyUI\custom_nodes\切换到目录执行各个自定义节点提供的安装步骤即可。
ComfyUI-Qwen-TTS
这个在节点管理器里面有好几个,目前用的是这个版本:ComfyUI-Qwen-TTS
Huggingface镜像设置
使用这个插件的节点会自动下载模型,由于是huggingface的地址,如果有访问问题可以在执行ComfyUI前设置镜像地址
$env:HF_ENDPOINT = "https://hf-mirror.com"
pad_token_id问题
执行节点时报错
‘Qwen3TTSTalkerConfig’ object has no attribute ‘pad_token_id’
这个问题在Github上有,最终解决方案是降级transformers
可以先检查当前版本
python -m pip show transformers
我这边修改前的版本是
Name: transformers
Version: 5.0.0
Summary: Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, > audio, and multimodal models, for both inference and training.
执行以下指令安装目标版本
python -m pip install transformers==4.57.3
即可正常执行节点
使用效果
文档中有提供各个节点的功能,对于Qwen3-tts本身的能力范畴,可以参考Qwen3-tts官方说明。
这边测试的Qwen3-TTS CustomVoice,使用预设的几个声音进行生成,1.7B和0.6B模型都能执行,且生成速度在可接受范围内。