【技术实现步骤摘要】
一种输入法评测方法、装置、设备及存储介质
本申请涉及输入法评测
,尤其涉及一种输入法评测方法、装置、设备及存储介质。
技术介绍
输入法是用户向电子设备输入文本内容的常用工具。用户在输入法输入的信息作为编码信息,输入法对用户输入的编码信息进行解码得到的文本解码结果,用户从输入法解码得到的文本解码结果中选择文本解码结果作为输入的文本内容。一款好的输入法对用户输入的编码信息的解码结果,应当符合用户的文本输入预期,从而保证用户的文本输入效率。而市面上的输入法琳琅满目,各种输入法的解码效果也各不相同,此时,如何对输入法进行评测从而了解输入法的解码效果,成为了开发者开发输入法以及用户选择输入法时的现实需求。
技术实现思路
基于上述需求,本申请提出一种输入法评测方法、装置、设备及存储介质,能够实现对输入法的评测。一种输入法评测方法,包括:从目标群体的历史输入文本中确定出至少一个文本单元集合,每一文本单元集合中的各文本单元对应同一编码信息;其中,所述同一编码信息的编码规范与待评测输入法的编码规范一致;分别将每一文本单元集合对应的编码信息输入待评测输入法,得到与每一文本单元集合对应的解码结果集合,所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果;至少根据各个文本单元集合及其对应的解码结果集合,确定所述目标群体对所述待评测输入法的评测结果。一种输入法评测装置,包括:测试集确定单元,用于从目标群体的历史输入文本中确定出至少一个文 ...
【技术保护点】
1.一种输入法评测方法,其特征在于,包括:/n从目标群体的历史输入文本中确定出至少一个文本单元集合,每一文本单元集合中的各文本单元对应同一编码信息;其中,所述同一编码信息的编码规范与待评测输入法的编码规范一致;/n分别将每一文本单元集合对应的编码信息输入待评测输入法,得到与每一文本单元集合对应的解码结果集合,所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果;/n至少根据各个文本单元集合及其对应的解码结果集合,确定所述目标群体对所述待评测输入法的评测结果。/n
【技术特征摘要】
1.一种输入法评测方法,其特征在于,包括:
从目标群体的历史输入文本中确定出至少一个文本单元集合,每一文本单元集合中的各文本单元对应同一编码信息;其中,所述同一编码信息的编码规范与待评测输入法的编码规范一致;
分别将每一文本单元集合对应的编码信息输入待评测输入法,得到与每一文本单元集合对应的解码结果集合,所述解码结果集合中包括所述待评测输入法对编码信息进行解码得到的至少一个解码结果;
至少根据各个文本单元集合及其对应的解码结果集合,确定所述目标群体对所述待评测输入法的评测结果。
2.根据权利要求1所述的方法,其特征在于,所述从目标群体的历史输入文本中确定出至少一个文本单元集合,包括:
获取目标群体在设定时间段内的历史输入文本;
对所述历史输入文本进行文本单元划分处理,得到各个文本单元,以及分别确定与各个文本单元对应的编码信息;
由所述各个文本单元中的、与同一编码信息对应的各个文本单元,组成与该同一编码信息对应的文本单元集合。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定各个文本单元集合中的各个文本单元的评分分值,以及确定各个解码结果集合中的各个解码结果的评分分值;其中,所述评分分值至少基于词频属性确定,所述词频属性为高频,或中频,或低频;
则,所述至少根据各个文本单元集合及其对应的解码结果集合,确定所述目标群体对所述待评测输入法的评测结果,包括:
根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值,以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值,确定所述目标群体对所述待评测输入法的评测结果。
4.根据权利要求3所述的方法,其特征在于,所述确定各个文本单元集合中的各个文本单元的评分分值,包括:
分别确定各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性;
至少根据各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性,以及预设的基于词频属性的评分规则,分别确定各个文本单元集合中的各个文本单元的评分分值。
5.根据权利要求4所述的方法,其特征在于,所述分别确定各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性,包括:
对应各个文本单元集合中的每个文本单元,分别根据其字长和其在所述目标群体的历史输入文本中出现的次数,确定其词频属性。
6.根据权利要求4所述的方法,其特征在于,所述基于词频属性的评分规则为评分分值大小与词频属性和/或词频排名相关的评分规则。
7.根据权利要求3所述的方法,其特征在于,所述确定各个解码结果集合中的各个解码结果的评分分值,包括:
分别确定各个文本单元集合中的各个文本单元在所述目标群体的历史输入文本中的词频属性;
对应每个解码结果集合中的每个解码结果,分别将与该解码结果所在的解码结果集合对应的文本单元集合中的、与该解码结果的内容相同的文本单元的词频属性,设定为该解码结果的词频属性;
至少根据各个解码结果集合中的各个解码结果的词频属性,以及预设的基于词频属性的评分规则,分别确定各个解码结果集合中的各个解码结果的评分分值。
8.根据权利要求3所述的方法,其特征在于,所述根据各个文本单元集合和各个文本单元集合中的各个文本单元的评分分值,以及各个解码结果集合和各个解码结果集合中的各个解码结果的评分分值,确定所述目标群体对所述待评测输入法的评测结果,包括:
对应每个文本单元集合,分别将该文本单元集合中的各个文本单元按照在所述目标群体的历史输入文本中出现的次数由高到低的顺序进行排序;
计算各个文本单元集合的前n个文本单元的评分分值的总和,以及计算各个解码结果集合的前n个解码结果的评分分值的总和;其...
【专利技术属性】
技术研发人员:杨勤英,殷运鹏,宋明,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。