【技术实现步骤摘要】
一种信息处理方法、装置及电子设备
本专利技术涉及软件
,特别涉及一种信息处理方法、装置及电子设备。
技术介绍
在编辑文档时,经常会由于认知错误、按键错误、输入法候选选择错误等原因造成输入错误,比如意图输入“人生自古谁无死”,错输入为“人身自古谁无死”,意图输入“瑕不掩瑜”但错误输入为“瑕不掩玉”,这些错误往往不易发现,需要借助文本校验功能来辅助用户发现错误并纠正。目前的纠错功能实现基本是通过语言模型方法来实现,通过对原始输入词进行语言模型打分,语言模型的打分结果反应了原始输入词在原始输入内容中的流畅程度,当原始输入词的语言模型得分较低时,说明原始输入词存在错误,然后对原始输入词中语言模型打分较差的输入词替换为语言模型打分较好的候选词来纠正错误。语言模型对输入词的打分是基于全网统计得到的,对于使用频率较高、使用次数较多的输入词打分相对使用频率较低、使用次数较少的输入词而言较高,简单的通过比较输入词打分的高低来确定是否展示用于纠错的候选词,容易出现纠错候选词展示出错,导致纠错准确率较低的问题。例如:如某一原始文本中多次出现“扒开”,“扒开”为该用户的正确表达意图 ...
【技术保护点】
1.一种信息处理方法,其特征在于,所述方法包括:获得待检测信息中输入词的输入词频;获得表征所述输入词在所述待检测信息中流畅度的第一得分,及表征所述输入词对应的候选词在所述待检测信息中流畅度的第二得分;基于所述输入词频,对所述第一得分进行修正获得修正后的第一得分;基于所述修正后的第一得分和所述第二得分,选择是否展示用于纠正所述输入词的所述候选词。
【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:获得待检测信息中输入词的输入词频;获得表征所述输入词在所述待检测信息中流畅度的第一得分,及表征所述输入词对应的候选词在所述待检测信息中流畅度的第二得分;基于所述输入词频,对所述第一得分进行修正获得修正后的第一得分;基于所述修正后的第一得分和所述第二得分,选择是否展示用于纠正所述输入词的所述候选词。2.如权利要求1所述的方法,其特征在于,所述方法还包括:获得所述输入词与所述候选词之间的相似度;所述基于所述修正后的第一得分和所述第二得分,选择是否展示用于纠正所述输入词的所述候选词,包括:基于所述相似度,对所述第二得分进行修正获得修正后的第二得分;基于所述修正后的第一得分和所述修正后的第二得分,选择是否展示用于纠正所述输入词的所述候选词。3.如权利要1所述的方法,其特征在于,获得待检测信息中输入词的输入词频,包括:获得所述待检测信息中所述输入词的词频,以及获得所述待检测信息中搭配词的词频,其中,所述搭配词由所述输入词的上文和/或下文信息与所述输入词组成;将所述输入词的词频和所述搭配词的词频作为所述输入词频。4.一种信息处理方法,其特征在于,所述方法包括:获得待检测信息中输入词与所述输入词对应的候选词之间的相似度;获得表征所述输入词在所述待检测信息中流畅度的第一得分,及表征所述候选词在所述待检测信息中流畅度的第二得分;基于所述相似度,对所述第二得分进行修正获得修正后的第二得分;基于所述第一得分和所述修正后的第二得分,选择是否展示用于纠正所述输入词的所述候选词。5.一种信息处理装置,其特征在于,所述装置包括:获取单元,用于获得待检测信息中输入词的输入词频;打分单元,用于获得表征所述输入词在所述待检测信息中流畅度的第一得分,及表征所述输入词对应的候选词在所述待检测信息中流畅度的第二得分;修正单元,用于基于所述输入词频,对所述第一得分进行修正获得修正后的第一得分;展现单元,用于基于所述修正后的第一得分和所述第二得分,选择是否展示用于纠正所述输入词的所述候选词。6.一种信息处理装置,其特征在于,所述装置包括:获取模块,用于获得待检测信息中输入词与所述输入词对应的候选词之间的相似度;打分模块,用于获得表征所述输入词在所述待检测信息中流畅度的第一得分,及表征所述候选词在所述待检测信息中流畅度的第二得分;修正模块,...
【专利技术属性】
技术研发人员:陈小帅,马尔胡甫·曼苏尔,张扬,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。