零样本语音克隆、自然语言控制音色及多种方言,低延迟的真人类听感体验
建议16GB以上内存。硬盘空间25GB以上。
macOS 15及以上版本,支持Intel和M系列芯片。
Windows 10/11,可用Intel, AMD CPU,推荐用NVIDIA GPU。
注意:NVIDIA显卡,请安装较新版本的驱动。2026年6月2日更新:搭载 Apple M 系列芯片的 macOS 电脑,可运行专为 MLX 框架优化的 AI 模型,实现生成速度大幅提升。在这之前安装的用户,可点击重新安装,可下载到 MLX 版的模型。
Qwen3-TTS 是由 阿里巴巴通义千问团队(Qwen Team) 开发的开源语音合成(TTS)模型系列。它不仅能将文字转为声音,更像是一位懂情感、会“模仿”的语音专家。无论你是想给视频配音,还是想打造一个有独特个性的 AI 助手,它都能轻松胜任。
功能亮点:
技术底座与团队: 本项目由阿里巴巴通义千问团队倾力打造,该团队在自然语言处理和多模态领域处于世界领先水平。