Prosodic: 用Python实现的韵律-音系分析器

RayRay
Prosodic解析Python韵律分析Web应用Github开源项目

prosodic

Prosodic: 强大的诗歌韵律分析工具

Prosodic是一个用Python编写的韵律-音系分析器,为研究诗歌韵律和语言学提供了强大的工具支持。它由斯坦福大学的Ryan Heuser、Josh Falk和Arto Anttila共同开发,目前支持英语和芬兰语文本的分析,并且可以灵活地扩展以支持其他语言。

主要特点

  • 支持英语和芬兰语文本分析
  • 通过发音词典或自定义Python函数可轻松添加其他语言支持
  • 提供web应用程序界面,便于使用
  • 支持Python 3.9及以上版本
  • 开源项目,遵循GPL-3.0许可证

安装和使用

  1. 通过pip安装Python包:
pip install prosodic
  1. 安装espeak文本转语音软件,用于"读出"未知单词:
  • Mac: brew install espeak
  • Linux: apt-get install espeak libespeak1 libespeak-dev
  • Windows: 从官网下载并安装
  1. 运行web应用:
prosodic web

然后在浏览器中访问 http://127.0.0.1:8181/ 即可使用图形界面。

代码示例

以下是一些使用Prosodic进行文本分析的Python代码示例:

import prosodic # 加载文本 sonnet = prosodic.Text(""" Those hours, that with gentle work did frame The lovely gaze where every eye doth dwell, Will play the tyrants to the very same And that unfair which fairly doth excel; For never-resting time leads summer on To hideous winter, and confounds him there; Sap checked with frost, and lusty leaves quite gone, Beauty o'er-snowed and bareness every where: Then were not summer's distillation left, A liquid prisoner pent in walls of glass, Beauty's effect with beauty were bereft, Nor it, nor no remembrance what it was: But flowers distill'd, though they with winter meet, Leese but their show; their substance still lives sweet. """) # 查看文本结构 sonnet.show(maxlines=30, incl_phons=True) # 查看数据框形式 sonnet.df # 遍历文本结构 for stanza in sonnet.stanzas: for line in stanza: for wordtoken in line: for wordtype in wordtoken: for wordform in wordtype: for syllable in wordform: for phoneme in syllable: # 进行处理 pass # 直接访问组件 print(f""" 这首十四行诗有: * {len(sonnet.stanzas):,} 个"段落" * {len(sonnet.lines):,} * {len(sonnet.wordtokens):,} 个词语标记(包括标点) * {len(sonnet.wordtypes):,} 个词语类型 * {len(sonnet.wordforms):,} 个词形(单词+IPA发音,不含标点) * {len(sonnet.syllables):,} 个音节 * {len(sonnet.phonemes):,} 个音素 """ ) # 功能强大的分析工具 Prosodic提供了丰富的功能来分析诗歌的韵律结构: 1. **音节划分**: 自动将单词划分为音节。 2. **重音标记**: 识别每个音节的重音。 3. **韵律模式**: 分析诗行的韵律模式,如抑扬格、扬抑格等。 4. **韵脚识别**: 自动检测诗行末尾的韵脚。 5. **音素分析**: 提供详细的音素级别分析。 6. **语言扩展**: 可以轻松添加新语言的支持。 7. **可视化**: 通过web界面直观展示分析结果。 ### 应用价值 Prosodic在以下领域具有重要的应用价值: - **文学研究**: 帮助学者更深入地分析诗歌的形式和结构。 - **语言学**: 为韵律学和音系学研究提供数据支持。 - **自然语言处理**: 可用于改进文本到语音(TTS)系统的自然度。 - **诗歌创作**: 为诗人提供韵律参考工具。 - **教育**: 可作为诗歌教学的辅助工具。 ### 项目展望 Prosodic项目仍在积极开发中,未来可能的改进方向包括: - 支持更多语言 - 改进分析算法的准确性 - 增加更多可视化和交互功能 - 与其他NLP工具集成 总的来说,Prosodic为诗歌韵律研究提供了一个强大而灵活的工具平台。无论是文学研究者、语言学家,还是对诗歌创作感兴趣的爱好者,都可以从这个工具中获得有价值的洞察。 ![Prosodic web界面预览](https://private-user-images.githubusercontent.com/733853/353452068-d34278fd-a28e-4337-9bcf-8c3c57992bc2.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MjU1MTEzNTcsIm5iZiI6MTcyNTUxMTA1NywicGF0aCI6Ii83MzM4NTMvMzUzNDUyMDY4LWQzNDI3OGZkLWEyOGUtNDMzNy05YmNmLThjM2M1Nzk5MmJjMi5wbmc_WC1BbXotQWxnb3JpdGhtPUFXUzQtSE1BQy1TSEEyNTYmWC1BbXotQ3JlZGVudGlhbD1BS0lBVkNPRFlMU0E1M1BRSzRaQSUyRjIwMjQwOTA1JTJGdXMtZWFzdC0xJTJGczMlMkZhd3M0X3JlcXVlc3QmWC1BbXotRGF0ZT0yMDI0MDkwNVQwNDM3MzdaJlgtQW16LUV4cGlyZXM9MzAwJlgtQW16LVNpZ25hdHVyZT0wNmNmYzI2MjViZDgwODBiOTY1ZjVhOGI3MWI5NGE4MjI0YTk2NWQwMmQ2MzQzZWFhNjcwODc2MTdhY2Q3NDgwJlgtQW16LVNpZ25lZEhlYWRlcnM9aG9zdCZhY3Rvcl9pZD0wJmtleV9pZD0wJnJlcG9faWQ9MCJ9.6AYoEsPr96WdV6t5oPWTRD6s2F_nA8WbjV2id1T4unE) Prosodic的web界面直观展示了文本的韵律分析结果,包括音节划分、重音标记、韵律模式等信息,使用户能够方便地进行诗歌韵律研究。 ### 结语 Prosodic项目为诗歌韵律研究提供了一个强大而灵活的工具平台。它不仅可以帮助学者更深入地分析诗歌的形式和结构,还可以为语言学研究、自然语言处理、诗歌创作和教育等领域提供有力的支持。随着项目的不断发展和完善,Prosodic有望成为推动诗歌韵律研究和应用的重要工具。

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

热门AI工具AI办公办公工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

模型训练热门AI工具内容创作智能问答AI开发讯飞星火大模型多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多