编辑: 怪只怪这光太美 | 2019-07-01 |
0 ) 1] 之间. ( 2) 假定一个词完全满足某个词类的各种主要的分布特征时得
100 分, 即它完全属于这一 词类;
那么, 它属于这一词类的隶属度为 1. ( 3) 假定一个词完全不满足某个词类的各种主要的分布特征时得
0 分, 即它根本不属于这 个词类;
那么, 它属于这一词类的隶属度为 0. ( 4) 每个分布特征的权值根据经验来设定, 符合该特征的得正分, 不符合一般特征的得零 分, 不符合关键特征的得负分. ( 5) 根据一个词的总的得分 ( 积分) 来计算 ( 折合) 其相对于某个词类的隶属度, 并且取 其中最大的隶属度作为判定其词类归属的根据.如果最大的隶属度是相等的两个、或接近相等 的两个或多个, 那么这个词可能兼属于两种或多种词类. ( 6) 当某个词对于某个词类的积分小于
0 时, 按照
0 来计算. 3. 各别词类的分布特征和权值设定 限于篇幅, 下面只列出判定名词、时间词、方位词、处所词、动词、形容词、状态词、区 别词、副词等
9 种词类的有关的分布特征及其权值设定.
3 1
1 名词的分布特征和权值设定 ( 1) 一般可以受数量词的修饰. ? 例如: / 一个人、两张纸、几件事、一种习惯0.这种分布 特征的形式表示是: SL ;
其中, SL 代表数量词. 如果某词满足这种分布 ( 即能进入这一分布框架, 记作: K) , 那么它在名词性方面得
10 分(记作: WV = 10, WV 是weight value 的缩写) ;
也就是说, 光凭该词的这种分布特征 #
165 # 基于隶属度的汉语词类的模糊划分 ? 为了行文简便和流畅, 本文对于诸如 / 名词可以受数量词修饰, 不受 1单音2 副词修饰;
时间词可以 作 -在、到、从、等到. 的宾语;
处所词可以作 -在、到、从、往. 的宾语;
形容词可以受 -很. 修饰;
,,
0 等自 Chao Yuen Ren ( 1968) 、朱德熙 ( 1982) 以来已经深入人心的分布特征, 基本上不加 出处.这里先一并作出声明, 以示郑重. ( distribution feature, 缩写为 DF) , 该词对于名词这个词类的隶属度为
0 1
1 ( 记作: DM =
0 1 1, DM 是degree of membership 的缩写) .相反, 如果某词不满足这种分布 ( 即不能进入这一分布 框架, 记作: @ ) , 那么该词的这种分布特征使得它在名词性方面得
0 分;
也就是说, 光凭该词 的这种分布特征, 该词对于名词这个词类的隶属度为 0. 上面所说的可以简约地表示如下: DF1 : SL ;
i. K, WV= 10;
ii. @ , WV= 0. ( 2) 不受副词的修饰.例如: / * 很勇气、 * 早青年、 * 不战争、 * 刚睡眠、 * 最朝气0.这种分布 特征的形式表示是: * F ;
其中, F 代表副词. 如果某词满足这种分布 ( 不能进入 / * F
0 这一分布框架) , 那么它在名词性方面得
20 分;
相反, 如果某词不满足这种分布 ( 能进入 / * F
0 这一分布框架) , 那么它在名词性方面 得-
20 分.这-
20 分的意思是, 从该词在名词性方面的总的得分 ( 即积分) 中扣除
20 分. 上面所说的可以简约地表示如下: DF2 : * F ;
i. K, WV= 20;
ii. @ , WV= - 20. ( 3) 可以作典型的主语和/ 或宾语.例如: / 厂长走了、学科调整了、增加人员、下放权 力0.这种分布特征的形式表示是: Pred D Vt ;
其中, Pred 代表谓语, V t 代表可以带真 宾语的及物动词, D 代表析取 ( disjunction) 关系.其权值设定可以简约地表示如下: DF3 : Pred D Vt ;