声动视界SoundView是国产一站式「AI音频+视频+图像」多模态创作云,一句话slogan:“上传一段声音,即刻生成声动大片。”面向短视频博主、广告制片、教育讲师、自媒体与广电机构,提供「文字→声音→画面→成片」全自动链路,...
IndexTTS2是由B站(Bilibili)开发的自回归零样本语音合成模型,于2025年9月8日正式开源。IndexTTS2是首个支持精确时长控制的自回归TTS模型。支持零样本声音克隆,仅需一个音频文件即可精准复制音色、节奏和说话风格,支持多语言。IndexTTS2实现了...
UnifiedTTS是一个一站式文本转语音(TTS)API服务平台,旨在帮助开发者快速集成多种主流的语音合成服务。通过统一的API接口,UnifiedTTS 整合了包括 Microsoft Azure、MiniMax、阿里云和 ElevenLabs 等在内的多家主流TTS服务提供商。开发者无需分别研究不...
FireRedTTS-2是由小红书开源的一款面向多说话者对话生成的长篇流式文本转语音(TTS)系统,旨在提供稳定、自然的语音输出,同时实现可靠的说话人切换和语境感知的韵律。该系统在支持多语言、实现超低延迟方面取得了显著突破,使其成为长...
AI Speaker是一款基于微软 TTS 服务的在线文字转语音(TTS)工具,能够将文字即时转换为自然流畅的语音。它支持多种语言和声音选择,提供高度拟人的情感表达,适用于多种场景。 AI Speaker功能特点: 1、多语言与多声音支持: - 支持超...
EmotiVoice是由网易有道开发的一款开源文本转语音(TTS)引擎,支持中英双语,并配备超过2000种不同的音色。其最显著的特点是情感合成功能,能够生成包含快乐、兴奋、悲伤、愤怒等多种情感的语音。该引擎完全免费开源,基于Apache2.0许可证...
VoiceDub是一款前沿的在线工具,利用人工智能技术改变用户创作语音内容的方式。它提供了一系列功能,包括AI语音克隆、文本转语音转换以及用AI生成的声音替换现有音频文件中的歌声。该平台拥有超过10,000种AI语音的庞大库,满足从音乐家到内...
Fish Speech 是由 Fish Audio 团队开发的一款开源文本转语音(TTS)工具,支持多种语言(包括中文、英文、日文等),并具备强大的语音合成能力。该工具基于深度学习技术,如 Transformer 架构、VITS、VQVAE 等,能够生成接近人类水平的语音。Fish Sp...
