2012-05-23
盘古文分词组件V2.3.1源码
盘古文分词组件V2.3.1源码程序介绍:盘古分词是一个中英文分词组件。作者eaglet曾经开发过KTDictSeg中文分词组件,拥有大量用户。作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。中文分词功能中文未登录词识别盘古分词可以对一些不在字典中的未登录词自动识别词频优先盘古分词可以根据词频来解决分词的歧义问题多元分词盘古分词提供多重输出解决分词粒度和分词精度权衡的问题中文人名识别输入:“张三说的确实在理”分词结果:张三/说/的/确实/在理/输入“李三买了一张三角桌子”分词结果:李三/买/了/一张/三角/桌子/强制一元分词输入“张三说的确实在理”分词结果:张(0,1)/张三(0,5)/三说的(1,1)/三(1,1)/说(2,5)/的(3,5)/确(4,1)/确实(4,5)/实(5,1)/在(6,1)/在理(6,5)/理(7,1)/繁体中文分词输入"我的選擇"分词结果:我/的/選擇/同时输出简体和繁体输入"我的選擇"分词结果:我(0,5)/的(1,5)/选择(2,1)/選擇(2,5)/中文词性输出盘古分词可以将以登录词的中文词性输出给用户,以方便用户做进一步处理