高保真歌曲生成、精准歌词识别与结构化创作控制
建议32GB以上内存,需30GB硬盘空间。
macOS 15及以上版本,仅支持M系列芯片。
Windows 10/11,推荐用NVIDIA GPU(显存须大于12GB),还未验证Intel, AMD CPU的兼容性。
注意:NVIDIA显卡,请安装较新版本的驱动。HeartMuLa 就像一个精通多种语言、能听会唱的“AI 音乐全才”。
研发团队:该项目是由多方顶尖学术与研究机构联合开发的科研结晶。主要参与机构包括:
北京大学 (Peking University)
香港中文大学 (The Chinese University of Hong Kong)
Scale Global / Ario
此外还有来自独立研究者的贡献。
底层技术:
HeartMuLa LLM:基于大语言模型架构,将音乐创作转化为语言预测任务。
HeartCodec:自研高保真音频编解码器,确保生成的音质接近无损。
HeartCLAP:核心的跨模态对齐技术,让 AI 能够精准理解文本指令与音频之间的逻辑关系。