输入法智能性评测系统和方法技术方案

技术编号:8532755 阅读:200 留言:0更新日期:2013-04-04 15:43
本发明专利技术提出一种输入法智能性评测系统和方法,用于评测预先选定的输入法软件的智能性,其中系统包括:测试集采集装置,用于采集测试集,将所述测试集提供给评测服务器;所述评测服务器,用于利用所述测试集对所述输入法软件的智能性进行评测。本发明专利技术能够自动、客观地评价输入法软件的智能性水平。

【技术实现步骤摘要】

本专利技术涉及计算机输入法
,特别涉及一种。
技术介绍
目前市场上输入法种类繁多,成熟的商业输入法功能全面,通常包含单字输入、词 语输入、整句输入等多种输入方式。其中,在整句输入方式下,用户的输入思维能够保持连 贯,用户能够更加专注于输入内容本身,而不是输入过程。整句输入方式成为当前用户的主 要输入方式。输入法在整句输入方式下的性能表现,是输入法智能性的直接体现。对于一款输入法软件,如何评价输入法的智能性呢?目前主要的评测方式为人工 评测。即,在开发过程中,由开发人员根据自己的个人习惯和喜好,挑选待输入的语句,用输 入法进行输入,观察输入法给出的候选输出是否符合预期,从而判断输入法的智能性高低。 这种方法的局限性在于,评测人员以及评测用例的代表性有限——代表的是相同类型用户 的特定的输入需求——使得测试结果的偏差较大。并且,评测人员对于输入法的智能性只 能够给出模糊的评价,如很好、好、还不错、不好等等,这些评价不够精确;在智能性没有 明显提高或降低的情况下,这些评价的区分度也不大。还有一种评测方法,就是将输入法发 布,直接让广大输入法用户进行评测。但由于此时输入法软件产品已经发布,如果智能性较 之前有所下降,则对广大用户来讲是一种损害;并且当产品发布周期较长时,这种做法是对 用户的不负责任。可见,现有的输入法智能性评测方法均无法自动、客观地评测输入法软件的智能 性。
技术实现思路
本专利技术实施例提出一种,能够自动、客观地评价输 入法软件的智能性水平。本专利技术的技术方案是这样实现的一种输入法智能性评测系统,包括测试集采集装置,用于采集测试集,将所述测试集提供给评测服务器;所述评测服务器,用于利用所述测试集对所述输入法软件的智能性进行评测。其中,上述测试集采集装置包括网页抓取器,用于抓取不同类别网页的内容,生成网页文本,将所述网页文本发送 至网页文本过滤器;所述网页的类别包括聊天网页、微博网页、论坛网页、博客网页、搜索 网页或正式文档网页;所述网页文本过滤器,用于对所述网页文本进行过滤,生成测试集,并将所述测试 集提供给评测服务器。评测服务器包括拼音标注工具,用于生成所述测试集中的原始文字所对应的拼音序列;按键产生器,用于将所述拼音序列转换为计算机按键的按键序列,并将所述按键序列输入到所述输入法软件,产生文字输出结果;文本校对器,用于将所述测试集中的原始文字和所述文字输出结果进行比对,得到所述输入法软件的智能性指标。输入法软件的智能性指标为句准确率、字准确率或测试集的迷惑度;其中,所述句准确率等于所述比对结果一致的句子数与测试集中的句子数的商;所述字准确率等于所述比对结果一致的文字数与测试集中的原始文字数的商; 测试集的迷惑度的计算方式为本文档来自技高网...

【技术保护点】
一种输入法智能性评测系统,用于评测预先选定的输入法软件的智能性,其特征在于,所述系统包括:测试集采集装置,用于采集测试集,将所述测试集提供给评测服务器;所述评测服务器,用于利用所述测试集对所述输入法软件的智能性进行评测。

【技术特征摘要】
1.一种输入法智能性评测系统,用于评测预先选定的输入法软件的智能性,其特征在于,所述系统包括 测试集采集装置,用于采集测试集,将所述测试集提供给评测服务器; 所述评测服务器,用于利用所述测试集对所述输入法软件的智能性进行评测。2.根据权利要求1所述的系统,其特征在于,所述测试集采集装置包括 网页抓取器,用于抓取不同类别网页的内容,生成网页文本,将所述网页文本发送至网页文本过滤器;所述网页的类别包括聊天网页、微博网页、论坛网页、博客网页、搜索网页或正式文档网页; 所述网页文本过滤器,用于对所述网页文本进行过滤,生成测试集,并将所述测试集提供给评测服务器。3.根据权利要求1所述的系统,其特征在于,所述评测服务器包括 拼音标注工具,用于生成所述测试集中的原始文字所对应的拼音序列; 按键产生器,用于将所述拼音序列转换为计算机按键的按键序列,并将所述按键序列输入到所述输入法软件,产生文字输出结果; 文本校对器,用于将所述测试集中的原始文字和所述文字输出结果进行比对,得到所述输入法软件的智能性指标。4.根据权利要求3所述的系统,其特征在于,所述输入法软件的智能性指标为句准确率、字准确率或测试集的迷惑度;其中, 所述句准确率等于所述比对结果一致的句子数与测试集中的句子数的商; 所述字准确率等于所述比对结果一致的文字数与测试集中的原始文字数的商; 测纖的迷惑度的计算方式为5.根据权利要求1至4任意一项所述的系统,其特征在于,所述系统还包括 代码管理服务器,用于接收并保存外界输入的输入法软件代码,所述输入法软件代码是根据所述输入法软件的智能性评测结果生成的; 输入法资源生成装置,用于生成优化词典和优化语言模型; 自动编译机,用于根据所述输入法软件代码、优化词典和优化语言模型...

【专利技术属性】
技术研发人员:司天歌曹菲侯杰周杨肖镜辉刘廷超杨洋周晓波
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1