零样本语音克隆逼真,多语言支持,语音参数可控,架构简洁高效
最低8GB内存。预留足够硬盘空间,建议10GB以上。
macOS 15及以上版本,支持Intel和M系列芯片。
Windows10/11,可使用CPU,推荐用NVIDIA GPU。
注意:NVIDIA显卡,请安装较新版本的驱动。Spark-TTS是由香港科技大学、上海交通大学、西北工业大学、网易伏羲人工智能实验室等多机构及独立研究者共同开发,由出门问问进行商业化应用的基于大型语言模型(LLM)的高效文本转语音工具。以下是其详细的特点和功能介绍: