推豆包在线网页版一款AI工具,支持AI聊天,AI图片生成,AI漫画生成,AI写作等!
音剪融合智能语音转写、多情感多模态分析等多项AI技术,为音频创作者、主播、教育从业者及企业用户,提供高效、精准、一站式音频编辑解决方案。
入梦AI变声器基于RVC算法打造的高音质实时变声工具,适配游戏直播、在线聊天、音频创作等多元场景,凭借强悍性能与简易操作广受用户青睐。
声咔AI配音面向音频内容创作者,提供高效便捷的配音方案,广泛适用于视频解说、广告宣传、教育培训、游戏配音等各类场景。
简单听记助力提升办公与信息整理效率,适配会议记录、电话录音、课堂笔记、人物访谈等各类场景,支持文本编辑与格式自定义。
Yescribe.ai平台支持全球98种语言,涵盖爪哇语、祖鲁语等小众语种,轻松打破语言壁垒,适配跨境沟通与多语种内容创作。
UVR5依托顶尖音源分离算法,实现人声与伴奏的高精度拆分,广泛用于音乐制作、翻唱剪辑、视频配音等场景,专业用户与普通爱好者均可轻松使用。
Voicv搭载多语言适配及零样本学习能力,为用户交付专业级高精度语音克隆服务。
MockingBird语音克隆工具仅需5秒语音样本,即可精准复刻人声音色,任意生成自定义语音内容。依托编码器、合成器、声码器架构,高效提取人声音色、语调、语速等特征,实现高仿真语音克隆效果。
TTS-Vue基于Electron、Vue、ElementPlus、Vite技术栈开发,专为短视频配音、文案语音合成场景打造。
妙幕SmartSub支持音视频批量解析、语音自动转字幕,同时兼容外部字幕导入、在线编辑与多语言翻译,一站式满足剪辑、创作与内容出海需求。
GreenConvert搭载核心硬核能力:98%精准转录、高保真媒体转换、8K超高清视频处理。
秒言区别于传统工具单一的语音转写能力,秒言深度融合大模型技术,兼顾超高识别精度与语义理解能力,精准捕捉口语背后的核心意图。
Sanota将用户语音内容智能转化为流畅优美的文字故事,以自然便捷的方式捕捉生活回忆与专属故事,让灵感与记忆不再流失。
秒聽錄音全面支援中文、英文、日文、粤语、台语、韩语、德语等多种语言自动辨识,无需手动切换语言模式,开口即录、即录即转。
TypeNo用户只需短按Control键即可启动录音,松开后语音将在本地实时转写为文字,并自动粘贴到当前应用。
轻析LiteSight支持抖音、B站、快手、小红书、微博等主流平台,AI自动视频转文字,提取文案并生成结构化大纲与思维导图
百宝音内置近百种专业配音音色,覆盖影视解说、广告、宣传片、有声阅读、短视频等各类场景,可按需选择,轻松打造专属配音风格。
Voiceslab平台采用免费+付费的定价模式,免费用户可创建1个语音克隆、拥有500字符生成配额,付费详情暂未明确。
MeowTXT款极简、极速、高精度的在线AI音视频转录工具,专注为内容创作者、职场人士与专业用户提供秒级上传、分钟级出稿的高效转录体验。
Transcript LOL可直接通过URL导入YouTube、Zoom、Google Meet等1500+平台内容,无需下载、无需上传。
千音漫语近20个专业调音工具可精准优化配音效果,语音识别准确率高达95%,10秒声音样本即可实现逼真音色克隆,搭配音频处理“百宝箱”,一站式解决声音创作全流程痛点。
讯飞译制平台支持中文与英、日、韩、德、法等17种语言互译,搭载AI声纹克隆、多情绪配音、口型同步等高级能力。
爱给网配音提供音效、配乐、配音等声音素材,覆盖声音创作、影视后期、游戏开发、3D模型、平面设计等五大创意领域。
VPot内置多语种多声音角色,能将任意文字内容转化为流畅自然的语音文件,完全调用微软及Edge公共API接口,采用纯CPU处理,适用于短视频配音、教学平台、有声读书等各类场景。
Handy用户通过快捷键激活录音,语音经本地处理后直接转为文本,无需联网,保护隐私。Handy提供多种语音识别模型,如Whisper和Parakeet V3,支持GPU加速和自动语言检测。
小宇宙Studio支持将音频文件拖入项目,进行剪切、合并、插入空白片段、复制、淡入淡出等基本操作;多轨功能已在内测阶段,未来将实现更复杂的混音、多轨人声合并。
制片帮音分轨让音质更加饱满、均衡,强劲的云端服务,让声音制作人、音乐家、DJ、音视频创作人以及其他音乐专业人士、创作人更加便捷、高效的进行创作。
声动视界SoundView一句话slogan:“上传一段声音,即刻生成声动大片。”面向短视频博主、广告制片、教育讲师、自媒体与广电机构,提供「文字→声音→画面→成片」全自动链路,10分钟完成传统团队3天的制作
IndexTTS2支持零样本声音克隆,仅需一个音频文件即可精准复制音色、节奏和说话风格,支持多语言。
UnifiedTTS整合了多种主流的 TTS 服务,包括 Microsoft Azure、MiniMax、阿里云和 ElevenLabs 等。
FireRedTTS-2支持生成长达3分钟的四说话者对话,并可通过扩展训练语料轻松扩展至更长、更多说话者的对话场景。
Voxiyo帮助用户高效记录、整理和利用语音信息,将语音笔记转化为文字、摘要、关键点和待办事项,实现一键生成和管理。
智声云配提供语音合成(TTS)、音色迁移、歌声转换等多种功能。工具支持中文、英文、日文、粤语等多语言,拥有近2500种情绪语态!
Vocloner用户只需上传目标语音的音频文件并输入所需语音的文本,Vocloner能在几秒钟内将文本合成为克隆的语音,免费使用时每日限制为1000个字符。
音刻快速、准确的转录功能能够帮助用户节省大量手动整理的时间,提升工作效率和学习效果。
CreateWise AI播客帮助用户从音频内容中快速生成转录文本、节目摘要、章节划分、社交媒体帖子以及短视频剪辑。
EmotiVoice支持使用个人数据进行语音克隆,可以用于创建个性化的语音助手或定制的语音模型。
Wispr Flow支持超过 100 种语言,能够实时将语音转化为流畅自然的文字,速度比传统打字快 3 倍。
Noiz AI支持情感化的文本转语音功能,用户可以选择预设的情感标签(如喜悦、悲伤、愤怒等),或自定义情感强度和语调,使语音内容更具沉浸感。
悦录AI一款基于同花顺语音识别技术的智能办公助手,旨在为用户提供高效的文字转录、音频制作和翻译服务
配音神器Pro专为短视频创作者、自媒体人、广告制作者和有声内容制作者设计。
刺鸟配音支持多种语言和声音风格,无论是正式、活泼还是温柔,都能找到合适的声音类型。
TTSReader输入或上传任何文本、文件、网站和书籍,以便在线收听、校对、一起阅读或生成专业的mp3配音。
Fish Audio支持中文、日语和英语等多种语言,能够将文本快速转换为逼真、自然的语音。
REECHO睿声AI核心功能包括超拟真语音合成、5秒瞬时语音克隆以及多语言支持等,旨在为用户提供高质量、自然流畅的语音体验。
Ciallo TTS支持超过300种语言和口音,包括英语、法语、德语、西班牙语、阿拉伯语、中文(普通话、粤语)、日语、朝鲜语、越南语等。
声网Agora支持开发者快速构建实时音视频场景,包括语音通话、视频通话、互动直播、云信令、本地/云端录制等功能。
叮当好记一款功能强大且实用的AI工具,能够显著提升用户的学习和办公效率,适用于多种场景下的音视频内容处理需求。
趣丸千音用户可以自由调整年龄、情绪、口音、内容等设置,满足个性化需求,让声音传递价值。
CosyVoice-300M3秒极速复刻声音,精控情感如笑声、呼吸声,自然语音描述即可生成高级音色!
MVSEP一款功能强大且应用广泛的音频分离工具,适合各种专业用户的需求,并且提供了多种模型和分离类型供用户选择。
熊猫宝库超过500位配音员参与,包括地方方言、多国语言、童声等多种类型。支持的配音种类数量至少为600种。
迅捷文字转语音支持男声、女声、情感男声、女声等多种语音类型,用户可以根据个人喜好自由选择。
讯飞配音文字转语音用户只需一键合成语音,操作非常简便,适合各类用户使用。
d1tools TTS打开浏览器就可以使用,生成速度很快,不需要注册账户,也不限字数、不限次数,不限音频时长。
Payoneerr持有美国 FinCEN、欧盟 E-money、香港 MSO、日本资金移业者等 60+ 张支付/外汇牌照,业务覆盖 200+ 国家/地区。
画宇宙支持画宇宙系列模型、百度文心 AI 绘画大模型、Draft、社区大模型等多种模型。
GPT智库提供互联网境外访问绿色通道、汇聚了全球顶尖的人工智能大模型和学术资源。
艾迪无广影视专注整合全网影视资源的聚合平台,秉持无广告、纯免费、简约观影的理念,为用户打造干净流畅的观影体验。
APUS大模型具备对文本、图像、音频、视频等多种类型数据的深入理解和生成能力。
deckrobot能够快速将原始幻灯片转化为符合企业品牌形象的高质量演示文稿,支持智能设计、品牌合规和内容生成等功能。
中国艺术研究院涵盖戏曲、音乐、美术、舞蹈、电影、文艺学等多个领域。
HyperWriteHyperwrite 是一款人工智能写作工具,可帮助任何水平的创意作家更快、更自信地写作。
深圳教育云资源平台由深圳市教育局统筹组织全市名优教师录制并免费共享的优质教学资源平台。
懒猫书签清理它通过“一键扫描+本地AI分析”帮助用户快速发现并清理失效、重复书签及空文件夹,同时生成可视化“书签画像”,让书签栏从“年久失修”变为“井井有条”。
咕噜口语SpeakGuru一款由北京火山创想科技有限公司开发的AI口语学习应用,旨在通过人工智能技术提升用户的英语口语能力。
造物联盟设计网一站式综合创意设计交易平台,汇聚设计师、需求客户与配套服务商,搭建资源聚合、沟通协作、项目交易一体化设计生态。
拓元智慧聚焦AI数智大脑打造,通过文本、语音、视频、虚拟形象等多模态交互,实现技术的产业落地。
易企秀提供多种创意设计工具,包括H5页面、海报、长页、表单、互动、视频、电子画册等。