
在人工智能和语音交互技术快速发展的今天,文本转语音(TTS)和语音转文本(STT)技术已经成为许多应用不可或缺的功能。为了满足开发者对高质量、易用的语音合成库的需求,LobeHub 团队开发了 Lobe TTS 这一强大的开源工具。
Lobe TTS 是一个使用 TypeScript 开发的高质量 TTS 工具包,支持在服务器端和浏览器端使用。它的主要特点包括:
服务器端: 只需 15 行代码即可实现与 OpenAI TTS 服务相媲美的高质量语音生成功能。目前支持 EdgeSpeechTTS、MicrosoftTTS、OpenAITTS 和 OpenAISTT 等多种语音引擎。
浏览器端: 提供高质量的 React Hooks 和可视化音频组件,支持加载、播放、暂停、拖动时间轴等常见功能。此外,还提供了丰富的音频轨道样式调整能力。
Lobe TTS 的诞生源于 LobeHub 团队在开发 Lobe Chat 项目时的需求。他们发现市面上缺乏令人满意的 TTS 前端库,因此投入了大量精力进行开发,包括数据转换、音频进度管理和语音可视化等多项任务。
Lobe TTS 提供了简洁的 API,使开发者能够轻松地在服务器端生成高质量语音。以下是一个使用 EdgeSpeechTTS 引擎生成语音的示例:
import { EdgeSpeechTTS } from '@lobehub/tts'; import { Buffer } from 'buffer'; import fs from 'fs'; import path from 'path'; // 实例化 EdgeSpeechTTS const tts = new EdgeSpeechTTS({ locale: 'en-US' }); // 创建语音合成请求 const payload = { input: 'This is a speech demonstration', options: { voice: 'en-US-GuyNeural', }, }; // 调用 create 方法合成语音 const response = await tts.create(payload); // 生成语音文件 const mp3Buffer = Buffer.from(await response.arrayBuffer()); const speechFile = path.resolve('./speech.mp3'); fs.writeFileSync(speechFile, mp3Buffer);
这段代码展示了如何使用 Lobe TTS 在服务器端生成语音文件的过程。开发者可以根据需要选择不同的语音引擎和参数来定制语音输出。
对于前端开发者,Lobe TTS 提供了易用的 React 组件,使得在 Web 应用中集成语音播放功能变得简单。以下是一个使用 AudioPlayer 和 AudioVisualizer 组件的示例:
import { AudioPlayer, AudioVisualizer, useAudioPlayer } from '@lobehub/tts/react'; export default () => { const { ref, isLoading, ...audio } = useAudioPlayer(url); return ( <Flexbox align={'center'} gap={8}> <AudioPlayer audio={audio} isLoading={isLoading} style={{ width: '100%' }} /> <AudioVisualizer audioRef={ref} isLoading={isLoading} /> </Flexbox> ); };
这个例子展示了如何使用 Lobe TTS 的 React 组件创建一个带有可视化效果的音频播放器。
Lobe TTS 可以通过 npm 或 bun 等包管理器安装:
$ pnpm i @lobehub/tts
或者
$ bun add @lobehub/tts
值得注意的是,Lobe TTS 是一个 ESM-only 的包,这意味着它只支持 ES 模块的导入方式。
对于使用 Next.js 的开发者,需要在 next.config.js 中添加 transpilePackages: ['@lobehub/tts'] 以确保正确编译:
const nextConfig = { transpilePackages: ['@lobehub/tts'], };
高质量语音输出: Lobe TTS 使用先进的语音合成技术,能够生成自然、流畅的语音。
多平台支持: 无论是服务器端还是浏览器端,Lobe TTS 都能提供一致的高质量体验。
易用性: 简洁 的 API 和现成的 React 组件大大降低了开发者的学习和使用成本。
可定制性: 开发者可以根据需求选择不同的语音引擎和参数,实现个性化的语音效果。
开源社区支持: 作为开源项目,Lobe TTS 得到了活跃社区的支持,不断改进和更新。
Lobe TTS 为开发者提供了一个强大、灵活且易用的文本转语音解决方案。无论是构建聊天机器人、语音助手,还是需要语音功能的 Web 应用,Lobe TTS 都能满足各种场景的需求。随着语音交互技术的不断发展,Lobe TTS 将继续evolve,为开发者提供更多创新功能和优化体验。
如果你正在寻找一个高质量的 TTS 库,不妨尝试一下 Lobe TTS。它不仅能够帮助你快速实现语音功能,还能为你的应用带来出色的用户体验。立即访问 Lobe TTS GitHub 仓库 开始你的语音合成之旅吧!
Lobe TTS 是一个开源项目,欢迎开发者参与贡献。无论是报告 bug、提出新功能建议,还是提交代码,都能帮助 Lobe TTS 变得更好。如果你对项目感兴趣,可以查看 GitHub 仓库 了解更多信息。
让我们一起努力,为开发者社区创造更优秀的语音合成工具!


职场AI,就用扣子
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!


多风格AI绘画神器
堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。


零代码AI应用开发平台
零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。


AI论文写作指导平台
AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。


AI一键生成PPT,就用博思AIPPT!
博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。


AI赋能电商视觉革命,一站式智能商拍平台
潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号