首页
博客
文件
书签
圈子
语言技术平台LTP
业内新闻
自然语言处理
信息检索
机器翻译
机器学习
文本挖掘
其他
您的位置:
语言技术网
>>
首页
>>
自然语言处理
>>
查看帖子
字体:
小
中
大
feature template怎么用?
liudong9183 发表于: 2008-6-12 11:08 来源:
语言技术网
呵...接触这一方面时间不长,请大家多指教
feature template ,如Bigram是做什么用的?
在看最大墒模型中,是不是把每个字的Bigram作为其上下文,然后统计这个字
在这个上下文的情况下的次数
最新回复
sickpig at 2008-6-13 16:16:50
特征模板只是定义特征函数的样式,一般作为一些寻找特征函数的工具的输入,工具/模块根据该模板统计出特征函数(会产生非常多的特征函数,差别在于发生次数的不同);最后再提交其它模块/工具计算参数/权值。
Bigram就是binary gram(我的理解),考虑2元关系,具体看你是选择词还是字作为统计单元。如,“很开心”
字一级就是,很/开/心,就统计“很开”,“开心”
词一级就是,很/开心,就统计“很开心”,词一级一般是经过分词处理后
liudong9183 at 2008-6-16 13:38:31
多谢sickpig大哥的回复。。
有一些问题请教,能不能告诉我你的qq,或者MSN。
wuxinlin at 2008-6-17 14:21:31
他的QQ是95491590
查看全部回复
我也来说两句
最新更新主题
哈工大IR实验室能不能给出LTP的词性...
关于张乐的最大熵工具包的编译
CRF中文分词的模板文件的格式是什么...
feature template怎么用?
我发现共享资源库句法分析的弧向是反的
[求助]刚刚开始学习用PERL编写组合歧...
这个地方有的..
文本处理动态库bow和文本分类rainbo...
哪位大虾有VC6.0下编译好的minipar的...
学习 自然语言处理 必读 书籍
语言技术网
|
交流论坛
|
快捷面板
|
站点地图
|
友情链接
|
空间列表
|
站点存档
|
联系我们
最新回复
Bigram就是binary gram(我的理解),考虑2元关系,具体看你是选择词还是字作为统计单元。如,“很开心”
字一级就是,很/开/心,就统计“很开”,“开心”
词一级就是,很/开心,就统计“很开心”,词一级一般是经过分词处理后
有一些问题请教,能不能告诉我你的qq,或者MSN。