machine learning
http://www.cl.ecei.tohoku.ac.jp/nlp100/
关于机器学习。
一直以来对机器学习都感兴趣,但是看见3个人的博客和,烦一下相关的百科似乎并没有让我懂。
今天和n聊了下,大致懂了点。
机器学习怎么处理自然语言,一言以蔽之,就是以统计的方法来处理,在上个世纪70年代和80年代,乔姆斯基和相关的生成语法学派,还比较流行,计算机学家们试图用乔姆斯基的,语法和结构来处理自然语言,但是得到的结果比较失败,因此另外一排也就是统计学派,就占据了上风,这两台的方法论上几乎没有相似之处,统计学派就是以同一个方法,大量的输入语料语言的材料,然后再来用,再来用机器的方式猜测得出的结果,不是他们也用,统计的方法来,统计哪一套土地是干校也就是说要经过三四层统计,还能得到一个比较完整的机器的,语言。
我问了一下在这不同的处理方式中是否存在,可凡也就是说一套同济浙大的机器人能否与另外一套机器语言翻。n回答说这个想法很奇怪,但是从原理上来说,是不是。
那么这套统计的,形式和过程到底是哪几部呢?首先,如果不是语音输入法输入文字的话,第一步是分词。我说这个分词好像感觉没有什么难度,然后对面告诉我说95/100的时候确实确实没有什么,但是这事再出现,有可能还是会有些麻烦的。
第二步,这也是整个部族中最,尤其是,当整个句子歧义都说得通的时候,这个时候,我们就,不能指望继续做个人类么好,因为要常识l,而机器没有。