gTTS(Google Text-to-Speech)是一个Python库和命令行工具,用于与Google Translate的文本转语音API进行交互。它允许用户将文本转换为语音,并将结果保存为MP3文件或进行进一步的音频处理。gTTS支持多种语言,并提供了丰富的自定义选项,使其成为一个强大而灵活的文本转语音解决方案。
gTTS具有以下主要特性:
支持多种语言:gTTS支持Google Translate提供的所有语言,包括英语、中文、日语、法语等多种语言。
自定义语音参数:用户可以调整语速、音量等参数,以获得理想的语音效果。
长文本支持:gTTS使用自定义的语音特定句子分词器,允许处理无限长度的文本,同时保持适当的语调、缩写和小数点等。
文本预处理:提供自定义的文本预处理器,可以进行发音纠正等操作。
命令行工具:除了作为Python库使用外,gTTS还提供了一个方便的命令行工具。
灵活的输出选项:可以将语音保存为MP3文件,或输出为字节串以进行进一步处理。
使用pip安装gTTS非常简单:
pip install gTTS
gtts-cli 'hello' --output hello.mp3
from gtts import gTTS tts = gTTS('hello') tts.save('hello.mp3')
gTTS支持多种语言,可以通过lang
参数指定:
tts = gTTS('你好', lang='zh-cn')
可以通过slow
参数调整语速:
tts = gTTS('hello', slow=True)
gTTS允许用户自定义分词器,以更好地处理特定语言或文本格式:
from gtts.tokenizer import pre_processors, Tokenizer, tokenizer_cases custom_tokenizer = Tokenizer( pre_processors=[pre_processors.abbreviations], tokenizer_cases=[tokenizer_cases.period_comma, tokenizer_cases.colon] ) tts = gTTS('hello', tokenizer_func=custom_tokenizer.run)
gTTS提供了专门的异常类gTTSError