HanLP1.x的Python接口,功能全面的中文NLP工具包
pyhanlp是HanLP1.x的Python接口,支持中文分词、词性标注、命名实体识别、依存句法分析等多种NLP任务。项目提供自动下载升级功能,算法经工业界和学术界验证。配套《自然语言处理入门》书籍,支持命令行和API调用,适合NLP研究和工程应用。
HanLP1.x的Python接口,支持自动下载与升级HanLP1.x,兼容Python<=3.8。内部算法经过工业界和学术界考验,配套书籍《自然语言处理入门》已经出版,欢迎查阅随书代码或点击在线运行。基于深度学习的HanLP2.x已于2020年初发布,次世代最先进的多语种NLP技术,与1.x相辅相成,平行发展。
懒人请点击;小白可直接使用傻瓜安装包;工程师请先安装conda,然后执行:
conda install -c conda-forge openjdk python=3.8 jpype1=0.7.0 -y pip install pyhanlp
使用命令hanlp
来验证安装,如因网络等原因自动安装失败,可参考手动配置或Windows指南。
使用命令hanlp segment