字体:  

IT民工开发MT 急需资料

wlmqgzm 发表于: 2007-10-10 03:25 来源: 语言技术网

IT民工开发MT。
2007年春节后辞职在家休息,考虑再三,决定利用自己休息的时间,做点东西。
感觉MT机器翻译产品 似乎是一个创业的方向, 请大家提一下建议。

我的产品已经开始做了, 已经陆续断续做了几个月,首先是做一个搜索引擎,已经完成。目前已经给我down下来了30G的资料,1个月分析下来,已经分析完成了大约27万单词库,不包括短语,已经能够实现比较准确的汉字/英语单词的对应关系。
大家认为27万英语单词库,是什么样的规模?
短语 还在分析中, 估计大约有100万的短语吧, 计算机速度太慢, 过几天升级计算机。

思路是:
1)建立单词库, 短语库  数据库MYSQL
2)核心的算法,实现全文翻译。依据是:先短语匹配,再单词匹配, 最后合成输出。

按照设计进度,本月底 数据库WEB网络可以上线, 先实现单词库的查询。下个月实现短语库的查询, 12月实现全文查询翻译。现在在后台做了一下自己的东西测试, 感觉与google也差不多啊,呵呵。错得不太离谱。。

等本月底系统测试版本上线后, 再请大家提意见,呵呵。

第1次开发这样的系统, 如果大家有关于  全文翻译的技术 资料,请一定给我发一下,我现在急需,谢谢!!!
Email: wlmqgzm@sohu.com

[ 本帖最后由 wlmqgzm 于 2007-10-10 03:26 编辑 ]

最新回复

caohao at 2007-10-15 18:58:19
现在都用统计机器翻译的方法。可以去找两篇论文看看。
vegy at 2007-12-04 16:41:44
感觉还可以,就是方法比较原始,完全没有考虑语法之类的东西啊!
建议做辅助翻译引擎!
victor at 2008-1-21 15:25:11
楼主有在线的演示么?
zhanhua at 2008-4-24 11:14:35
呕液!