Qwen3-TTS PC端本地一键安装 | 魔当 | 见山行科技有限公司

应用特点

开源文本转语音TTS

建议16GB以上内存。硬盘空间25GB以上。
macOS 15及以上版本，支持Intel和M系列芯片。
Windows 10/11，可用Intel, AMD CPU，推荐用NVIDIA GPU。
注意：NVIDIA显卡，请安装较新版本的驱动。

2026年6月2日更新：搭载 Apple M 系列芯片的 macOS 电脑，可运行专为 MLX 框架优化的 AI 模型，实现生成速度大幅提升。在这之前安装的用户，可点击重新安装，可下载到 MLX 版的模型。

Qwen3-TTS 是由 阿里巴巴通义千问团队（Qwen Team） 开发的开源语音合成（TTS）模型系列。它不仅能将文字转为声音，更像是一位懂情感、会“模仿”的语音专家。无论你是想给视频配音，还是想打造一个有独特个性的 AI 助手，它都能轻松胜任。

功能亮点：

技术底座与团队： 本项目由阿里巴巴通义千问团队倾力打造，该团队在自然语言处理和多模态领域处于世界领先水平。

核心架构： 采用了先进的**离散多码本语言模型（Discrete Multi-Codebook LM）**架构，彻底告别了传统技术中容易出现的语调生硬问题。
底层引擎： 基于自研的 Qwen3-TTS-Tokenizer-12Hz 技术，能够对语音信号进行深度语义建模，完美保留语气、停顿和环境氛围等细微信息。

许可证Apache-2.0