字体:  

feature template怎么用?

liudong9183 发表于: 2008-6-12 11:08 来源: 语言技术网

呵...接触这一方面时间不长,请大家多指教
feature template ,如Bigram是做什么用的?
在看最大墒模型中,是不是把每个字的Bigram作为其上下文,然后统计这个字
在这个上下文的情况下的次数

最新回复

sickpig at 2008-6-13 16:16:50
特征模板只是定义特征函数的样式,一般作为一些寻找特征函数的工具的输入,工具/模块根据该模板统计出特征函数(会产生非常多的特征函数,差别在于发生次数的不同);最后再提交其它模块/工具计算参数/权值。
Bigram就是binary gram(我的理解),考虑2元关系,具体看你是选择词还是字作为统计单元。如,“很开心”
字一级就是,很/开/心,就统计“很开”,“开心”
词一级就是,很/开心,就统计“很开心”,词一级一般是经过分词处理后
liudong9183 at 2008-6-16 13:38:31
多谢sickpig大哥的回复。。
有一些问题请教,能不能告诉我你的qq,或者MSN。
wuxinlin at 2008-6-17 14:21:31
他的QQ是95491590