面向识别任务的汉语名词短语本体研究综述

面向识别任务的汉语名词短语本体研究综述

ID:26967458

大小:52.50 KB

页数:6页

时间:2018-11-30

面向识别任务的汉语名词短语本体研究综述_第1页
面向识别任务的汉语名词短语本体研究综述_第2页
面向识别任务的汉语名词短语本体研究综述_第3页
面向识别任务的汉语名词短语本体研究综述_第4页
面向识别任务的汉语名词短语本体研究综述_第5页
资源描述:

《面向识别任务的汉语名词短语本体研究综述》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、面向识别任务的汉语名词短语本体研究综述摘要:名词短语识别是汉语句法分析中的难点,挖掘和利用语言学知识是提高名词短语识别效率的关键。文章对汉语名词短语识别相关的本体研究进行了综述,讨论了名词短语的界定、分类、性质判定、结构关系和功能等问题,这些研究对于定义名词短语,抓取识别特征具有启发意义。中国4/vie  关�I词:面向识别任务汉语名词短语本体研究综述  一、中文信息处理与名词短语研究  在中文信息处理的基础研究中,名词短语的识别是一个重要问题,也是进一步作句法和语义处理的基础。研究汉语名词短语的专著较少,史锡尧(1990)对名词短语的内部结构、定语构成、中心语构成以及定语顺序进行

2、了较详细的描写。王珏(2001)涉及到名词的句法功能、语义关系、定语类型以及定语顺序等问题。其他论述多散见于单篇文献。从结构内容上划分,我们将面向识别任务的名词短语本体研究归纳为三个方面:(1)“的”的同一性;(2)含“的”名词短语研究;(3)不含“的”名词短语研究。这些研究涉及到名词短语的界定问题,以及潜在可用的识别资源和策略问题。本文通过对这些研究的整理分析,梳理和辨识对名词短语识别有用的语言学知识。  二、“的”的同一性  “的”的同一性问题涉及到名词短语界定。哪些“的”字短语是名词性的,存在争议。以De表示广义的“的”①,弱化其形式区分,同一性研究即如何对De进行更合理的分

3、类。字面上,“的”是一种文字形式。但语料中存在少量De字同形,如“的1”和“的3”同形,“的2”和“的3”同形,以前者为例,不应包含在名词短语的结构助词中。尽管汉语书面形式约定“的”“地”“得”分别是定语、状语、补语的标识,但实际语料中存在不合约定的用法,并且含“的”短语也并不完全对应着名词短语。  De的同一性研究包括四分说、二分说、三分说和同一说四种观点。  (一)四分说  黎锦熙(1924)把De分为“特别介词”“语尾”“联接代名词”和“确定语态的助词”四类,涉及到De字研究的一些重要问题,如De作为语气词、副词性语尾,引导补语,表领属关系以及构成“的”字短语等问题。这一分类

4、初步区分了副词性语尾“地”和补语标志“得”。  (二)二分说  吕叔湘(1942)论述了部分De表示语气的现象,提出把De分为关系词和语气词两类。关系词表示加语与端语的组合关系;语气词表示确认的语气。二分说把表示语气和修饰关系放在对立面上,区分了句末或动宾之间表语气的De和偏正结构中的De,引起了学术界对于语气词“的”的关注。  (三)三分说  朱德熙(1961)应用功能分布理论系统地研究了De的性质和分类问题,将“X的”语法功能的不同归结为De的不同功用,从而把De区分为三个语素:“的1”“的2”和“的3”,分别是副词性语法单位、形容词性语法单位、名词性语法单位的后附成分。这一分

5、类在语法学界引发了关于De的性质和分类问题的大讨论,问题涉及分类方法、分类内容等多个方面。以下两个问题特别值得我们注意。  1.是否存在语气词De。朱德熙(1961、1966)使用“是……的”框架,论证了“我会写的”中的“的”是“的3”,同时也指出作为语气词的De和“的3”的界限“实在不容易划清楚”,承认语气词De与否都会遇到困难。  2.是否存在时间助词De。宋玉柱(1981)论证了表示时间的De,指出这些De指明动作发生于过去,去掉De会改变动作时间,造成语义矛盾,如“他昨天晚上什么时候回来的?”。它们不能用于表示将来时的句子中,如“你明天什么时候回来的?”。  我们认为De表

6、示语气和时间的情况是客观存在的,但上述论述只有建立在De字功能单一的假设上才能成立,在“我昨天买的是这本书”中,“的”是时间助词还是“的3”,亦或同时实现了两种功能呢?仅看作时间助词至少是不全面的。  (四)同一说  随着研究的深入,学术界越来越倾向于De字功能同一的观点。石毓智(2000)从认知的角度,认为De的功能是用来确立认知域中的成员。功能同一性的论证多在认知层面进行,这种抽象的解释形式难以用来解决句法功能分类问题。  对于计算机而言,三分说系统地考察了“的1”“的2”和“的3”的分布位置,有较好的可操作性。首先,“的1”对应于形式“地”,不可能作为名词短语;其次,清楚地描

7、述了“的2”和“的3”的分布差异,可以较明确地分辨名词性和形容词性“的”字短语。  三、含“的”名词短语研究  构造名词短语的De,可以是“的2”或“的3”。一方面,De的问题受到广泛关注;另一方面,语言学家观察得到De的参与是形成复杂名词短语的重要因素。按照是否含有结构助词De,名词短语分为含De名词短语和不含De名词短语。  (一)“的”字短语研究  关于名词性“的”字短语的研究主要讨论了“的”的性质,“的”字短语的自指、转指和成分提取等方面的问题。  1.“的”

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。