您当前的位置 - 首页编程开发编程工具 → python crf中文分词(crf++工具) v0.58 官方版

python crf中文分词(crf++工具)

v0.58 官方版
python crf中文分词(crf++工具)
  • 软件大小:434KB
  • 软件类别:编程开发 / 编程工具
  • 软件语言:简体中文
  • 推荐等级:4星
  • 授权方式:免费软件
  • 更新时间:2020-02-07 11:19
  • 运行平台:WinXP, Win7, Win8, Win10
  • 相关链接:暂无
好评:50%顶一个
坏评:50%踩一个
  • 软件介绍
软件标签: crf++ python 编程工具

crf++是一款非常常用的变成开源工具,主要用于文本标注、分词等等,用户可以非常轻松的的完成各种变成任务。目前,crf++是国内最实用的一款软件,深受广大程序员们的喜爱。还在等什么!快来旋风软件园下载吧!

crf++软件内容

doc文件夹:就是官方主页的内容

example文件夹:有四个任务的训练数据(test.data)、测试数据(train.data)和模板文件(template),还有一个执行脚本文件exec.sh。

libcrffpp.dll:训练程序和测试程序需要使用的静态链接库。

clr_learn.exe:crf++的训练程序

crl_test.exe:crf++的测试程序

sdk文件夹:crf++的头文件和静态链接库。

crf++最新版下载

相关介绍

条件随机场(crf)由lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果。条件随机场是一个典型的判别式模型,其联合概率可以写成若干势函数联乘的形式,其中最常用的是线性链条件随机场。若让x=(x1,x2,…xn)表示被观察的输入数据序列,y=(y1,y2,…yn)表示一个状态序列,在给定一个输入序列的情况下,线性链的crf模型定义状态序列的联合条件概率为

p(y|x)=exp{} (2-14)

z(x)={} (2-15)

其中:z是以观察序列x为条件的概率归一化因子;fj(yi-1,yi,x,i)是一个任意的特征函数;是每个特征函数的权值。

使用方法

1、解压后将crf_learn.exe crf_test.exe libcrfpp.dll文件复制到example文件夹的任意文件夹下

2、打开cmd命令行模式cd到1中目录。

3、输入指令crf_learn template train.data model即可生成model文件

预览截图
下载地址
最新更新
软件评论

热门评论

最新评论

发表评论 查看所有评论

昵称:
请不要评论无意义或脏话,我们所有评论会有人工审核.
字数: 0/500 (您的评论需要经过审核才能显示)
推荐软件