2012年3月13日星期二

为什么喜欢做研究

上周去南洋理工见了ivor 他问我为什么喜欢做研究 对于这个问题,我以前还真没认真思考过 只是对很多问题好奇,喜欢去刨根问底把一个问题搞清楚 现在想想 研究的乐趣 在于扩大自己的影响力 如果自己对某个领域做出了贡献 大家都引用我的文章 那岂不是很快乐的事情

2012年3月5日星期一

Word representations

Word representations: A simple and general method for semi-supervised learning 这个应用很广,有时间研究一下。

2012年2月19日星期日

2012年1月30日星期一

下一步工作

词对齐下一步研究的重点是11年日本那篇文章。这篇文章主要有两个优点: <1>可以比较好的解决 multiword expression 问题。 <2> 采用了adapter grammar , 短语可以复用。

2012年1月18日星期三

linux console graphics

linux console model 下的图形库,不需要启动X windows服务 Cursees/NCurses/SVGALIB

2011年12月29日星期四

language model and cyk

考虑划分短语的问题 是否可以通过使用语言模型的信息,然后通过进行cyk parse 来寻找短语呢? xiangyu 做过这方面的工作,不过他使用的是另外的统计信息。今天本来是想给 自己的模型加语言模型方面的特征来,忽然想到了这个问题。 如果能够parse 的比较好的话 双语同时做parse,那么是否可以获取对齐信息呢 这样做的一个很大优点就是速度快。parse的速度是O(n^3) 而ITG这种同步句法分析则需要O(n^6) 速度真是个问题啊。