中文
发现令人惊叹的AI工具和应用
升级版语音合成系统,多语言、实时风格切换和高效推理
6GB低显存快速生成质量稳定的1分钟视频
功能强大、高度模块化的 Stable Diffusion 图形用户界面和后端系统
让文字秒变真实播客,支持多语言、多方言与情感化语音生成
工业级零样本语音合成系统,发音可控、效果好
零样本语音克隆逼真,多语言支持,语音参数可控,架构简洁高效
让数字人张嘴说话的智能唇同步神器
自动完成视频翻译、字幕生成与配音
支持普通话、英语、粤语,可高自然度合成语音并实现零样本声音克隆
支持 600+ 语言、语音设计与语音克隆,合成自然且速度极快
零样本语音克隆、自然语言控制音色及多种方言,低延迟的真人类听感体验
支持 23 种语言,跨语言克隆与精细情感控制
超轻量、极速音乐大模型,本地 4GB 显存可运行
通过几秒音频克隆声音并生成自然语音
能把歌词秒变歌曲,按关键词生成各种风格音乐,还能给清唱加伴奏,玩音乐超简单!
升级大模型架构,音质、歌曲完整性、生成速度全面拉满,支持超长时长、多语种创作
生成多说话人对话的语音合成系统,支持声音克隆和多语言
5秒声音,即刻克隆——GPT-SoVITS实现多语言AI语音合成。
轻量易上手的多端个人AI助手,支持多渠道对接与自定义技能
支持 52 种语言方言,具备极强的歌词识别与上下文理解能力
支持33种语言,兼顾端侧轻量化与专业高精度的开源快思考多语言翻译模型
轻量化音频大模型、多语言情感表达及流式实时生成,真人级自然语音
多语言语音识别、情感与音频事件检测,高效精准
支持多语言、实时/离线语音识别,易用高效
零样本声音克隆,情感表达能力
实时数字人,高保真、长时稳定的百帧级音画同步生成
开源翻译模型,33 种语言 + 5 种方言互译,精准灵活
零样本歌声合成项目,支持多语言、双模式控制,能零微调生成未知歌手高保真歌声并实现灵活的歌声编辑
一款 AI 客户端应用,可支持多种平台
实时肖像动画技术,将静态肖像转化为支持视频 / 音频驱动的动态三维模型
生成高质量古典音乐,支持按时期、作曲家和乐器生成
基于单张图片生成带深度信息的 3D 全景及场景模型
一站式本地智能助手,支持多平台运行与手机远程操控,能自动化完成办公、创作、信息处理等各类日常任务
基于 OpenClaw 开发的桌面图形化工具,一键安装
实现零件级 3D 物体生成,支持双体积打包处理与多 GPU 推理
超高音色相似度的零样本语音克隆,直接在波形隐空间生成高保真语音
一个带有可视化界面的大模型运行工具。
支持 17 种语言,方言与低音量识别精准
高保真歌曲生成、精准歌词识别与结构化创作控制
精准擦掉视频中的物体,生成自然画面
本地视频硬字幕与图片文本水印去除工具,支持无损分辨率处理
一款集成 RAG 管道、支持多模态交互与工作流编排的企业级开源 AI 助手。
给无声音视频配上贴合、真实的环境声音。
在本地轻松运行、自定义并管理各种大型语言模型
工作流自动化平台,支持无代码 / 代码双模式搭建
从单张图片像素级精准生成带PBR纹理的高保真3D模型
安全优先、更可靠高效的工作流自动化工具,支持可视化拖拽操作
跨平台、多模型、带 Agent 与知识库的可扩展 AI 聊天机器人
收录2000+现成n8n自动化工作流的智能搜索库
轻量高效文档解析工具,可将PDF/图片/电子书精准转为Markdown/JSON
零样本语音克隆与高表现力的情绪、风格和语气编辑
让本地语音转文本和翻译变得简单
支持零样本语音克隆、情感表达与流式推理
超轻量TTS工具,CPU即可运行,支持多语种朗读与零样本音色克隆
拖拽剪辑的轻量视频编辑器,支持丰富的特效和4K视频导出
可轻松查看音视频文件的技术信息和标签数据的工具
支持多语言互译,可离线使用且数据隐私可控
全自动生成含文案、素材、配音、字幕、配乐的高清短视频
支持文本、视频生成高品质逼真音效(仅可用英文提示词),适配各类音视频创作场景