一种分词查询方法、装置及存储介质制造方法及图纸

技术编号:30230311 阅读:11 留言:0更新日期:2021-09-29 10:02
本申请实施例公开一种分词查询方法、装置及存储介质。该方法包括:获取扫描笔扫描到的文字序列,确定文字序列中的各字符及其顺序;将文字序列与预设的数据库进行匹配,确定组成文字序列的第一字词元素,第一字词元素位于文字序列的预设位置处,第一字词元素为第一词元素或第一字元素;根据数据库中各字词元素关联的内容数据,查询第一字词元素关联的内容数据,对内容数据进行展示。采用上述技术手段,解决现有扫描笔无法精确查询字词含义的问题,提高用户使用体验。高用户使用体验。高用户使用体验。

【技术实现步骤摘要】
一种分词查询方法、装置及存储介质


[0001]本申请实施例涉及智能学习
,尤其涉及一种分词查询方法、装置及存储介质。

技术介绍

[0002]现在中小学生要求提前预习课文,并了解课文中生词或生字的含义,此时学生可以使用扫描笔点击课文中的生词或生字,扫描笔根据识别到字词进行查询,以获取对应的字词含义。
[0003]中文的语句排列一般都是字词混排的,而一个句子一般是由多个字词组成。当学生想用扫描笔查询句子中的一个词汇时,使用扫描笔点击课本上的该词汇,扫描笔头部的摄像头会将课本的对应区域拍摄成图片,以对图片进行文字识别。课文中字体大小是不可控的,拍摄区域是固定,当课文中字体较小时,摄像头很大概率会把该词汇邻近的文字拍摄到,导致识别到的词汇包含多余的文字信息,导致查询的词汇不满足用户期望,影响用户的使用体验。

技术实现思路

[0004]本申请实施例提供一种分词查询方法、装置及存储介质,解决现有扫描笔无法精确查询字词含义的问题。
[0005]在第一方面,本申请实施例提供了一种扫描笔的分词查询方法,包括:
[0006]获取扫描笔扫描到的文字序列,确定所述文字序列中的各字符及其顺序;
[0007]将所述文字序列与预设的数据库进行匹配,确定组成所述文字序列的第一字词元素,所述第一字词元素位于所述文字序列的预设位置处,所述第一字词元素为第一词元素或第一字元素;
[0008]根据所述数据库中各字词元素关联的内容数据,查询所述第一字词元素关联的内容数据,对所述内容数据进行展示。<br/>[0009]进一步的,所述下载用户当前学习的课本文件,包括:
[0010]在所述将所述文字序列与预设的数据库进行匹配之前还包括:
[0011]确定当前查询模式为外语翻译或汉语解析;
[0012]确定当前查询模式为外语翻译时,确定与所述文字序列进行匹配的数据库为外语词典数据库;
[0013]确定当前查询模式为汉语解析时,确定与所述文字序列进行匹配的数据库为汉语词典数据库。
[0014]进一步的,所述第一字词元素位于所述文字序列的开头;
[0015]相应的,所述将所述文字序列与预设的数据库进行匹配,确定组成所述文字序列的第一字词元素包括:
[0016]识别出所述文字序列的首字符,确定数据库中以所述首字符为开头的词;
[0017]将所述文字序列与数据库中以所述首字符开头的词进行匹配,若匹配成功,则确定匹配到的词为所述文字序列的第一词元素,否则确定所述首字符为所述文字序列的第一字元素。
[0018]进一步的,所述第一字词元素位于所述文字序列的结尾;
[0019]相应的,所述将所述文字序列与预设的数据库进行匹配,确定组成所述文字序列的第一字词元素包括:
[0020]识别出所述文字序列的尾字符,确定数据库中以所述尾字符为结尾的词;
[0021]将所述文字序列与数据库中以所述尾字符结尾的词进行匹配,若匹配成功,若匹配成功,则确定匹配到词为所述文字序列的第一词元素,否则确定所述尾字符为所述文字序列的第一字元素。
[0022]进一步的,所述若匹配成功,若匹配成功,则确定匹配到词为所述文字序列的第一词元素包括:
[0023]若所述文字序列匹配到数据库中至少一个词,则将匹配到的词中包含字符最多的词确定为所述文字序列的第一词元素。
[0024]进一步的,所述根据所述数据库中各字词元素关联的内容数据,查询所述第一字词元素关联的内容数据包括:
[0025]确定当前查询模式为外语翻译时,从所述外语词典数据库中获取所述第一字词元素关联的外语翻译内容;
[0026]确定当前查询模式为汉语解析时,从所述汉语词典数据库中获取所述第一字词元素关联的汉语解析内容。
[0027]进一步的,所述对所述内容数据进行展示包括:
[0028]将所述内容数据显示在所述扫描笔的显示屏中,和/或将所述内容数据进行语音播放。
[0029]在第二方面,本申请实施例提供了一种扫描笔的分词查询装置,包括:
[0030]识别模块,被配置为获取扫描笔扫描到的文字序列,确定所述文字序列中的各字符及其顺序;
[0031]分词模块,被配置为将所述文字序列与预设的数据库进行匹配,确定组成所述文字序列的第一字词元素,所述第一字词元素位于所述文字序列中预设位置处,所述第一字词元素为第一词元素或第一字元素;
[0032]查询模块,被配置为根据所述数据库中各字词元素关联的内容数据,查询所述第一字词元素关联的内容数据,对所述内容数据进行展示。
[0033]在第三方面,本申请实施例提供了一种扫描笔,包括:
[0034]一个或多个处理器;
[0035]存储器,用于存储一个或多个程序;
[0036]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的扫描笔的分词查询方法。
[0037]在第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的扫描笔的分词查询方法。
[0038]上述扫描笔的分词查询方法、装置、扫描笔及存储介质,通过获取扫描笔扫描到的
文字序列,确定文字序列中的各字符及其顺序;将文字序列与预设的数据库进行匹配,确定组成文字序列的第一字词元素,第一字词元素位于文字序列的预设位置处,第一字词元素为第一词元素或第一字元素;根据数据库中各字词元素关联的内容数据,查询第一字词元素关联的内容数据,对内容数据进行展示。通过上述技术手段,将文字序列的字符与数据库中的词汇进行比较,确定组成文字序列的字词元素,并从该字词元素中确定出用户点击的第一字词元素,并从数据库中各字词关联的内容数据中查询第一字词元素的内容数据,以保证反馈给用户的内容数据是满足用户期望的内容,提高文字点击查询的准确率,提高用户的使用体验。
附图说明
[0039]图1是本申请一个实施例提供的一种扫描笔的分词查询方法的流程图;
[0040]图2是本申请实施例提供的扫描笔的第一示意图;
[0041]图3是本申请实施例提供的扫描笔的第二示意图;
[0042]图4是本申请实施例提供的扫描笔的第三示意图;
[0043]图5是本申请实施例提供的显示屏的示意图;
[0044]图6是本申请一个实施例提供的一种扫描笔的分词查询装置的结构示意图;
[0045]图7是本申请一个实施例提供的一种扫描笔的结构示意图。
具体实施方式
[0046]为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种扫描笔的分词查询方法,其特征在于,包括:获取扫描笔扫描到的文字序列,确定所述文字序列中的各字符及其顺序;将所述文字序列与预设的数据库进行匹配,确定组成所述文字序列的第一字词元素,所述第一字词元素位于所述文字序列的预设位置处,所述第一字词元素为第一词元素或第一字元素;根据所述数据库中各字词元素关联的内容数据,查询所述第一字词元素关联的内容数据,对所述内容数据进行展示。2.根据权利要求1所述的方法,其特征在于,在所述将所述文字序列与预设的数据库进行匹配之前还包括:确定当前查询模式为外语翻译或汉语解析;确定当前查询模式为外语翻译时,确定与所述文字序列进行匹配的数据库为外语词典数据库;确定当前查询模式为汉语解析时,确定与所述文字序列进行匹配的数据库为汉语词典数据库。3.根据权利要求1所述的方法,其特征在于,所述第一字词元素位于所述文字序列的开头;相应的,所述将所述文字序列与预设的数据库进行匹配,确定组成所述文字序列的第一字词元素包括:识别出所述文字序列的首字符,确定数据库中以所述首字符为开头的词;将所述文字序列与数据库中以所述首字符开头的词进行匹配,若匹配成功,则确定匹配到的词为所述文字序列的第一词元素,否则确定所述首字符为所述文字序列的第一字元素。4.根据权利要求1所述的方法,其特征在于,所述第一字词元素位于所述文字序列的结尾;相应的,所述将所述文字序列与预设的数据库进行匹配,确定组成所述文字序列的第一字词元素包括:识别出所述文字序列的尾字符,确定数据库中以所述尾字符为结尾的词;将所述文字序列与数据库中以所述尾字符结尾的词进行匹配,若匹配成功,若匹配成功,则确定匹配到词为所述文字序列的第一词元素,否则确定所述尾字符为所述文字序列的第一字元素。5.根据权利要求3和4任一所述的方法,其...

【专利技术属性】
技术研发人员:吴迪
申请(专利权)人:东莞市小精灵教育软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1