crf++是一款非常常用的变成开源工具,主要用于文本标注、分词等等,用户可以非常轻松的的完成各种变成任务。目前,crf++是国内最实用的一款软件,深受广大程序员们的喜爱。还在等什么!快来旋风软件园下载吧!
doc文件夹:就是官方主页的内容
example文件夹:有四个任务的训练数据(test.data)、测试数据(train.data)和模板文件(template),还有一个执行脚本文件exec.sh。
libcrffpp.dll:训练程序和测试程序需要使用的静态链接库。
clr_learn.exe:crf++的训练程序
crl_test.exe:crf++的测试程序
sdk文件夹:crf++的头文件和静态链接库。
条件随机场(crf)由lafferty等人于2001年提出,结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果。条件随机场是一个典型的判别式模型,其联合概率可以写成若干势函数联乘的形式,其中最常用的是线性链条件随机场。若让x=(x1,x2,…xn)表示被观察的输入数据序列,y=(y1,y2,…yn)表示一个状态序列,在给定一个输入序列的情况下,线性链的crf模型定义状态序列的联合条件概率为
p(y|x)=exp{} (2-14)
z(x)={} (2-15)
其中:z是以观察序列x为条件的概率归一化因子;fj(yi-1,yi,x,i)是一个任意的特征函数;是每个特征函数的权值。
1、解压后将crf_learn.exe crf_test.exe libcrfpp.dll文件复制到example文件夹的任意文件夹下
2、打开cmd命令行模式cd到1中目录。
3、输入指令crf_learn template train.data model即可生成model文件
大小:53.35M / 版本:v0.58 官方版
大小:78.17M / 版本:v0.58 官方版
大小:4.84M / 版本:v0.58 官方版
大小:34.58M / 版本:v0.58 官方版
大小:166.00M / 版本:v0.58 官方版
大小:3.03M / 版本:v0.58 官方版
大小:891.00M / 版本:v0.58 官方版
大小:20.40M / 版本:v0.58 官方版
大小:46.56M / 版本:v0.58 官方版
大小:227.69M / 版本:v0.58 官方版
大小:166.78M / 版本:v0.58 官方版
大小:3.48M / 版本:v0.58 官方版