北京大师


早上七点半,张老师把我接到北大招待所,放下行李,就把我带到研究所去。

研究所正在举行词义会议。这是一个两岸三地大师级的会议,大师包括了台湾的谢 清俊,黄居仁,北京的俞士汶,陆俭明,董振东,香港的郑锦全,都是搞了几十年 语言信息处理的大师。

语言信息处理研究语义,一个目的是搞机器翻译,机器理解,为的是让电脑更好地 为人际交流服务。但是一句话,有它的理性意义,内涵意义,社会意义,情感意义 ,反映意义,配搭意义和主题意义。同样一句话,人要理解比较容易,要机器理解 ,便要先做一段分析;一句话要分词,然后要从词典上去找词义,决定它的可能含 义分成义项,再对照使用的语境,才能理解那个句子。所以词典里头每一个词都要 跟据某个规范来分类词性,处理信息才能用这些词性来对句子作词语标注。由于语 言是活的,规范不能订死,怎样大盘规范,又怎样保留余地解决歧异,如何给规范 架上结构,让电脑能有效率地进行检索等各样处理,就是这些大师们研究的课题。 规范的的项目分别包括类别与属性,个体和关系,而最新的是概念。

什么是义项?举个例吧。门至少有两个义项,一个是指形体的门,一个是指入口出 口的门洞。下面这个笑话能说明这两个义项的不同。

元宵节,一个商店老板要去看花灯,跟伙计说:“你看好门。”就走了。伙计留在 店里,听见传来锣鼓咚咚声,心想,老板说看好门,可我也真想看花灯,不如就把 门背着,就可以又看花灯,又看好门。说做就做,把门拆下来背在身上,也看花灯 去了。老板回来,店里空空,东西全给小偷搬走了!

什么是语境?比方说,“鸡不吃了”在餐桌上说和在鸡寮里说,就有不同的意义:  因为语境不同,鸡就从“吃”的对象变成“吃”的主体!

要说到概念,那就更纠缠不清了。你随便在街上走,总会见到一两个光头佬吧?但 是一个人到底要有多少的头发才没有资格被称光头佬呢?

中文因为是方块字的缘故,有她特殊的难题,比如分词。怎样才是一个词,一直没 有定夺;早年更有“鸡是词,鸭不是词;鸭子才是词。”的争论。某大师没有把“ 水平”编入词典,就有了“某大师的词典没有水平”的笑话。虽然天下没有尽善尽 美的词典,可是现在电子化了的词典都有各自一套有检索,标注等功能的配搭软件 ,可以大事各种信息处理的工作,而增强词典的覆盖率和软件功能等的细节工作也 还在继续进行中。

从卖那磁石的发展角度来看,我要做“多语文”界面,跟语言信息处理挂钩的就是 自动机器翻译, 这本来只是应用的范围;我钻了牛角尖找到一个核对输入数值的 问题,作为研究课题,即是想进一步探讨自然语言中限制一个变量数值的各种表达 方式,以及自动机器翻译的处理手段,这给了我来计算语言学研究所做访问学者的 一个很好的理由。来到北大第一天,就能与这些大师们会晤,第一手接收了他们对 自身作品的精采的剖析,亲闻他们随口一引就是恰到好处的语句譬喻,不禁由衷地 感动钦佩;看来这场与大师的会晤已经让我不负此行了呢!


二零零一年五月十五日初草
六月九日定稿
八月廿三日小修