一种汉语选词填空方法技术

技术编号:23363529 阅读:48 留言:0更新日期:2020-02-18 17:29
本发明专利技术公开了一种汉语选词填空方法,包括以下步骤:S1、从一给定的训练语料中获得词语特征及其出现的频次;S2、切分要进行汉语填空的汉语句子:将待填空的汉语句子切分为词语序列;S3、计算比较待填空的汉语句子所对应的词语序列条件下空白处填写每个候选词语的条件概率;S4、根据计算比较每个候选词语填入空白处的条件概率大小确定用于填空的汉语词语;S5、输出填空的汉语词语结果。本发明专利技术将汉语自动选词填空采用概率统计的方法实现,计算简单、运算量小、选词填空准确率较高。

A method of filling in blanks in Chinese word selection

【技术实现步骤摘要】
一种汉语选词填空方法
本专利技术属于计算机领域,具体涉及一种汉语选词填空方法。
技术介绍
本专利技术主要解决的技术问题和应用需求有两方面。其一是让计算机参加高考语文答题的部分试题求解,针对高考语文中选词填空试题。正确使用词语是每年高考的一个必考点,其考查范围包括两个层面:一是正确理解词语,二是正确使用词语。即理解词语在具体语境中的意义,根据语境使用词语。其二是辅助汉语初学者进行词语使用练习,包括中小学生的汉语选词填空练习和对外汉语教学中的词语使用练习,这些主要涉及同义词或形近词在汉语句子中的使用。从检索查阅的学术论文、专利、论著来看,还没有汉语自动选词填空的相关技术和方法的公开发表。因此,一种汉语选词填空方法亟待提出。
技术实现思路
为解决让计算机自动选词填空问题,本专利技术提供一种汉语选词填空方法。为了解决上述技术问题,本专利技术提供了如下的技术方案:本专利技术提供一种汉语选词填空方法,包括以下步骤:S1、从一给定的训练语料中获得词语特征及其出现的频次;S2、切分要进行汉语填本文档来自技高网...

【技术保护点】
1.一种汉语选词填空方法,其特征在于,包括以下步骤:/nS1、从一给定的训练语料中获得词语特征及其出现的频次;/nS2、切分要进行汉语填空的汉语句子:将待填空的汉语句子切分为词语序列;/nS3、计算比较待填空的汉语句子所对应的词语序列条件下空白处填写每个候选词语的条件概率;/nS4、根据计算比较每个候选词语填入空白处的条件概率大小确定用于填空的汉语词语;/nS5、输出填空的汉语词语结果。/n

【技术特征摘要】
1.一种汉语选词填空方法,其特征在于,包括以下步骤:
S1、从一给定的训练语料中获得词语特征及其出现的频次;
S2、切分要进行汉语填空的汉语句子:将待填空的汉语句子切分为词语序列;
S3、计算比较待填空的汉语句子所对应的词语序列条件下空白处填写每个候选词语的条件概率;
S4、根据计算比较每个候选词语填入空白处的条件概率大小确定用于填空的汉语词语;
S5、输出填空的汉语词语结果。


2.根据权利要求1所述的汉语选词填空方法,其特征在于,步骤S1包括:设定样本窗口大小,并选定特征模板集,从一给定的训练语料中按照设定的样本窗口大小通过特征模板集扩展出上下文词语特征,统计求取上下文词语特征及其频次,训练语料是经过汉语分词后的汉语语料。


3.根据权利要求1所述的汉语选词填空方法,其特征在于,步骤S2将待填空的汉语句子切分为词语序列W1W2……Wn。


4.根据权利要求1所述的汉语选词填空方法,其特征在于,对每个候选词语,计算待填空的汉语句子S所对应的词语序列条件下空白处填写该候选词语的条件概率;
一个句子具...

【专利技术属性】
技术研发人员:于江德李学钰王希杰武宇浩武肖菡张春雨常银辉
申请(专利权)人:安阳师范学院
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1