ai-audio-startups

ai-audio-startups

AI音频技术革新 音乐制作与语音处理新纪元

本项目收录了众多专注AI音频和音乐技术的创新企业,涉及音乐创作、制作、源分离、分析推荐、广播、播客、听力辅助、声音检测和语音技术等多个领域。这些初创公司运用人工智能,为音频内容创作者、音乐爱好者和专业人士开发先进工具和解决方案,推动音频技术不断进步。

AI音频音乐生成语音识别音频分析声音检测Github开源项目

AI音频创业公司

AI 音频和音乐技术初创公司社区列表

音乐

创作和制作

  • Sonauto - 使用 AI 创造 hit 歌曲
  • Microphone Studio - 无需昂贵的录音室设备即可进行多轨录音
  • TuneFlow - 生成歌词、旋律、鼓点等,同时可像专业 DAW 那样编辑和混音
  • CassetteAI - 基于 AI 的音乐制作平台:使用 AI 创造歌词、节奏和人声,然后直接从 Cassette 混音并发布
  • AIVA - 人工智能情感音乐创作
  • beatoven.ai - 简化版音乐创作工具,帮助您为视频和播客创作音乐
  • Infinite Album - 为游戏直播者提供自适应 AI 音乐
  • Epidemic Sound - 高质量音乐和音效,适用于所有内容,版权包含
  • Wonder - Dynascore:世界上第一个动态音乐引擎
  • Amper (被 Shutterstock 收购) - 内容创作者的 AI 音乐创作工具
  • mayk.it - 您的虚拟音乐工作室
  • boomy - 即时创作音乐,与世界分享
  • enote - 智能乐谱
  • Qosmo - Qosmo 是一个由艺术家、研究人员、设计师和程序员组成的团队
  • AI Music (被苹果公司收购) - 我们的音乐帮助品牌与受众建立更深厚的联系
  • Splash HQ - 下一代音乐制作人
  • musico - 基于 AI 的音乐生成软件引擎,可响应手势、动作、代码或其他声音
  • Yousician - 世界上最大的音乐教育平台
  • Tape It - 用于songwriting和音频录制的应用程序
  • sessionwire - 提供无缝工作室体验的全方位在线协作平台
  • Aflorithmic - 专业音频、语音、声音和音乐,可扩展性强
  • Audio Design Desk - 视频编辑器的音频解决方案
  • Never Before Heard Sounds - 由 AI 驱动的音乐工作室
  • NeuralDSP - 通过直观的软件/硬件生态系统,民主化世界级音质访问,赋能音乐玩家
  • Neutone - 桥接 AI 研究和创造力的 AI 音频插件和社区
  • RoEx - 为音乐人、制作人和内容创作者提供 AI 驱动的混音服务
  • LANDR - 面向创作者的在线音乐软件:音乐母带处理、数字音乐发行、租赁插件、免费采样包、协作工具
  • Accusonus (被 Meta 收购) - 面向创作者的音频和视频编辑软件
  • Moises - 音乐人应用
  • Waveshaper (先前为 Tonz) - 实时神经信号处理
  • Sonible - 由奥地利制造的音频软件和硬件
  • Accentize - 智能音频工具
  • AI Mastering - AI驱动的在线音频母带处理服务
  • Splice - 自动化制作和分享音乐的音乐创作技术平台
  • AudioStellar - 基于数据驱动的实验采样器(开源)
  • chord.ai - 任何歌曲的和弦和节拍!
  • DoReMIR - 唱歌和演奏到单个麦克风,即可获得带有歌词和和弦的lead sheet!
  • mubert - 即时生成完全匹配您内容的音乐曲目
  • Evoke Music - 为您的视频、播客和企业找到合适的音乐
  • Klangio - 我们的创新应用程序可以轻松快速地创作乐谱!
  • XLN Audio - Addictive Drums、Addictive Keys、RC-20和XO等VST插件开发商
  • Laplacian Audio - 前身为"Definite Technologies",开发使用AI进行声音处理/生成的VST/AU/AUv3
  • Lifescore - 自适应AI音乐平台。由高质量音频样本实时进行细胞自动化编曲
  • WaveAI - 包括歌词写作助手在内的AI音乐助手
  • Humtap - 实时音乐、音频和视频创作平台
  • Voctro Labs - 面向创意媒体应用的合成歌声
  • Loudly - 数字世界的音乐解决方案,包括 Soundtracks、AI Studio、Music Maker JAM
  • DeepMusic - AI音乐创作和制作
  • Soundraw - 自由定制高质量免版税音乐
  • BandLab - 全球音乐家和粉丝创作、协作和互动的云平台
  • Setmixer - 结合嵌入式软件、信号处理和 AI,帮助艺术家录制、混音和母带他们的现场表演
  • okio - 面向音乐的开源生成性工具
  • Audialab - 旨在利用 AI 赋能真正的艺术家而非取代他们的道德音频 AI 插件、工具和社区
  • suno - 使用 AI 创作音乐和语音
  • Lemonaide Music - 与 DAW 集成的生成式音乐工具,100% 免版税
  • tuney.io - 面向创意媒体的道德音乐 AI
  • KORUS AI - AI 音乐创作平台和您的个人音乐制作人,探索声音宇宙
  • TRINITI - 为您提供全新的音乐创作和表达方式
  • voice swap - 使用 AI 改变您的歌声
  • mix audio - 用于创意和生产力的 AI 音乐
  • Audiogen - 使用 AI 生成声音、音效、音乐、采样和氛围
  • Wavtool - 集成 AI 助手和本地 VST 插件支持的基于web的 DAW
  • Wavacity - Audacity®音频编辑器的网页版本
  • DIKTATORIAL Suite - 基于文本提示的 AI 音频母带处理

源分离

这是一份英文到中文的翻译:

  • TuneFlow——一款免费的DAW,提供高质量的人声、鼓点、旋律、低音干声分离,以及全方位的音频分离、编辑和人声/乐器到MIDI的转录功能。
  • Spliter.ai——AI音频处理
  • Gaudio——重新定义音乐/视频流和虚拟/增强现实中的音频体验。
  • AudioShake——面向音乐行业的按需音轨创造平台。
  • Audionamix——为娱乐行业提供音频分离解决方案,从经典内容中释放无穷的潜力。
  • vocali.se——在几秒钟内从任何歌曲中分离人声和音乐!
  • lalal.ai——基于世界第一的AI技术的高质量音轨分离。
  • VocalRemover——使用强大的AI算法免费分离歌曲中的人声。
  • PhonicMind——使用我们的HiFi AI分离您歌曲中的人声、鼓点、低音和其他乐器。
  • EasySplitter——基于AI的在线人声移除器,适合DJ和歌手使用。
  • Remover.studio/)——人声移除器和在线卡拉OK
  • MVSep——使用多种不同的算法(Demucs、MDX、UVR等)免费分离歌曲
  • MuzLab——从歌曲中移除人声,分离鼓点、低音和其他乐器。
  • Fadr——使用AI工具移除音轨、转换为MIDI,并创建高质量的重混和混音!

分析/建议

  • AIMS——为任何从事音乐发现业务的人提供AI驱动的音乐相似性搜索和自动标记。
  • FeedForward——直观的音频搜索引擎,适用于音频和声音目录。
  • Aimi——发现那些从歌曲和播放列表的束缚中解放了音乐的艺术家。
  • Utopia Music——每播放一次都得到公平报酬
  • Musiio(被SoundCloud收购)——使用人工智能来帮助自动化您的工作流程。
  • niland(被Spotify收购)——构建基于AI的音乐应用程序
  • cyanite——用于音乐标签和相似性搜索的AI
  • musicube(被SongTradr收购)——B2B AI音乐元数据服务,如自动标签、元数据丰富和语义搜索
  • Musixmatch——基于歌词的音乐发现、推荐和搜索算法和工具。
  • hoopr——找到最佳音乐,讲述更好的故事,扩大您的受众。一个基于AI的引擎,可帮助您找到合适的配乐。
  • Pex——音乐识别和版权合规。音频指纹、大规模的原创曲识别。
  • SONOTELLER——包括歌词总结、主题提取和音乐特征分析在内的AI音乐分析。

健康和福祉

  • Endel——个性化声景,帮助您专注、放松和睡眠。
  • Lucid——使用AI将音乐转化为药物,打造个性化的治疗音乐体验
  • Wavepaths——用于迷幻疗法的音乐
  • Suki——面向医疗保健的AI语音解决方案。
  • audEERING——可以从语音中检测情绪和健康信息的技术。
  • brain.fm——专注更好的音乐
  • SPOKE——低保真度和韵文主导的正念音乐片段
  • sona——音乐作为药物。由获格莱美奖的制作人创作的针对焦虑的研究型音乐。
  • Novoic——利用语音检测神经系统疾病。
  • Ubenwa——基于婴儿哭声信号的健康分析。

广播/播客

  • faidr——您最喜欢的无广告广播。
  • fathom——播客搜索引擎。
  • Nomono——一个适用于现场采访的自包含录音套件。
  • Descript——一体化音频和视频编辑,如同编辑文档一样简单。
  • auphonic——适用于播客、广播电台节目、电影、屏幕录制等的自动音频后期处理网络服务。
  • SimonSays——为团队构建的,编辑视频速度提高5倍
  • Podcastle——录音室品质录音、AI驱动编辑,以及无缝导出 - 使用简单且免费
  • cleanvoice——从您的播客或音频录制中删除填充音、口吃和口腔噪音
  • Super Hi-Fi——由人工智能驱动的音乐体验

听力

  • Whisper.ai——比您通常的助听器更智能。
  • Eargo——一种革命性的新型助听器。
  • Concha Labs——帮助您更清晰地听到

声音检测

  • Audio Analytic——通过更强大的听觉感知来创造卓越的人体体验。
  • SoundEye——具有高级声音识别能力,可分类诸如尖叫、枪声、咳嗽和哭泣等声音
  • cochl——下一代声音AI平台,可以像人类一样感知任何声音。
  • Josh.ai——一个语音控制的家庭自动化系统。
  • SEE SOUND——世界上第一个智能家居听力系统
  • Epigos.ai——可用于从音频源中提取隐藏数据的AI模型。
  • HyperSurfaces——无需键盘、按钮或触摸屏即可无缝融合物理世界和数据世界。
  • HyperSentience——HyperSentience为手机、VR/AR耳机、智能手表、扬声器和笔记本电脑提供环境感知能力。
  • Circulr Sound——智能音频可穿戴设备
  • Securaxis——我们将声音转化为信息。
  • Deeply——我们使用先进的深度学习技术为声音事件检测和上下文识别为世界上的每一个声音赋予意义
  • Reef Pulse——使用生物声学和AI进行珊瑚礁监测:声音事件检测(船只、潜水员、海浪、海洋哺乳动物、鱼类、无脊椎动物等),以影响海洋生态系统的管理。

语音

转录

  • Ava - 专业和基于AI的残障人士(聋人和听力受损者)字幕翻译服务(转写和说话人识别)
  • verbit - 专业的基于AI的转录和字幕服务
  • otter - 为混合团队提供高效、协作的会议所需的一切。
  • Trint - 音频转录软件 - 语音转文字到神奇
  • Rev - 99%准确的字幕、逐字稿和字幕。
  • voiceitt - 一款针对有非标准语音的人的应用
  • deepgram.com - 通过AI语音识别提供更快、更准确的语音应用
  • fireflies.ai - 会议AI助理
  • SoapBox - 让孩子们的声音被听到的语音技术。
  • Amberscript - 使用语音识别自动将音频和视频转换为文本和字幕的SaaS解决方案。
  • Speaksee - 在现场小组会议上实时显示正在说话的内容。
  • Speechmatics - 自主语音识别技术,能理解每一种声音。
  • sonix - 自动转录35种以上语言。
  • Picovoice - 端到端Edge Voice AI,设备内语音识别
  • BoldVoice - 自信清晰地说英语
  • Gladia - 使用单一API为您的产品提供尖端的AI转录、翻译和音频智能。
  • Podsqueeze - 将您的音频或视频播客重新利用为文字记录、节目说明、博客文章、视频剪辑和其他用于发布和推广您节目的资产。

合成(文本转语音)

  • adauris.ai - 将文字内容转换为引人入胜的音频,并实现无缝分发。
  • Aflorithmic - 专业音频、语音、音效和音乐,可扩展制作。
  • Sonantic(被Spotify收购) - 使用完全富有表现力的AI生成语音,提供引人入胜的逼真表演。
  • kroop AI - 利用合成媒体生成和检测,创造无限可能。
  • dubverse - 只需点击一下即可让您的内容实现多语种,触达更多人。
  • Resemble.ai - 生成听起来真实的AI语音。
  • Replica - 用于游戏、电影和元宇宙的AI配音员。
  • Respeecher - 内容创作者的语音克隆。
  • amai - 超逼真的文本转语音引擎。
  • AssemblyAI - 使用单一的AI驱动API进行音频转录和理解。
  • DAISYS - 新的声音听起来像真人
  • WellSaid - 创造听起来就像真人的合成语音技术。
  • Deepsync - 生成与您声音完全一样的音频内容。
  • coqui.ai - 为所有人提供开源语音技术
  • Voiseed - 基于AI的语音引擎能够模仿人类语音的情感和韵律。
  • Speechki - 基于NLP的最先进的文本和音频编辑平台,内置数百种AI语音。
  • MiSynth - 一种使用突触技术和大脑-计算机接口将想象中的声音转化为合成MIDI乐器的大脑控制乐器。
  • ElevenLabs - 为发布者和创作者开发最引人注目的AI语音软件
  • Wondercraft - Wondercraft使用文本转语音技术帮助用户生成播客。
  • play.ht - 基于生成式机器学习模型构建内容创作的未来。
  • Revocalize.ai - 从网页仪表板或VST插件生成工作室级别的AI语音,并训练AI语音模型。
  • morpheme.ai - 我们以演员为本的数字双重语音由最新的AI技术驱动,确保它们高效、真实和合乎道德。

增强与操作

  • Meaning - 实时流式语音和口音转换。
  • krisp - 一种基于AI的软件解决方案,用于有效的在线会议。
  • voicemod - 免费实时语音变音器。
  • audo - 为创作者、开发者和虚拟会议提供噪音消除产品。
  • AudioTelligence - 我们的软件可在具有挑战性的声学环境中提高语音的清晰度和可懂度。
  • immersitech.io - 我们不制造音频,而是让音频变得更好。
  • utterly - 会议和音频噪音消除。
  • claerity.ai - 利用尖端AI消除视频会议通话中的所有背景噪音。
  • Neural Love - 一套使用AI提升音频质量的工具。
  • HeardThat - 一款智能手机应用程序,可将您的智能手机变成一个复杂的语音增强设备。
  • Chatable - 一款智能手机应用程序,可消除扰乱性的背景噪音
  • BdSound - 用于音频和语音产品的智能音频解决方案。
  • echosonic - 通过将机器学习功能引入麦克风,革新了麦克风技术。
  • Insoundz - 基于生成式AI的音频增强
  • Xound - 只需一键即可进行AI驱动的音频增强。音频版Grammarly。

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

热门AI工具AI办公办公工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

模型训练热门AI工具内容创作智能问答AI开发讯飞星火大模型多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多