Skip to content

stefanxfy/hanlpHelper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

hanlpHelper

介绍

HanLP 1.x工具增强。引用依赖:

<dependency>
    <groupId>com.hankcs</groupId>
    <artifactId>hanlp</artifactId>
    <version>portable-1.8.2</version>
</dependency>

因为HanLP 1.x提供的繁简互转无法获取被转换的字符以及位置,也无法做到将文本再转回去(倒带),所以特此重新做了简单封装。以后使用其他功能不满足需求时再封装增强。

功能

[1.0.0] 新增ChineseDictionaryConverter繁简互转、获取转换字符偏移量、转换文本倒带,使用方式见测试用例:ChineseDictionaryConverterTest

HanLP: Han Language Processing

HanLP是一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。内部算法经过工业界和学术界考验,配套书籍《自然语言处理入门》已经出版。目前,基于深度学习的HanLP 2.x已正式发布,次世代最先进的NLP技术,支持包括简繁中英日俄法德在内的104种语言上的联合任务。

HanLP提供下列功能:

在提供丰富功能的同时,HanLP内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便。默认模型训练自全世界最大规模的中文语料库,同时自带一些语料处理工具,帮助用户训练自己的模型。

详见:https://github.com/hankcs/HanLP

About

HanLP 1.x工具增强

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages