System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及大数据处理,特别是涉及一种目标词汇的获取方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、随着数字化技术的普及,金融业务办理及日常办公实现了线上系统处理,但是金融业务及日常办公仍涉及大量的线下往来纸质文件、各种证件以及图片,其中的文字信息往往需要在线上沟通,或者系统输入进行录入,现有的操作系统输入软件,其使用的往往是离线联想词汇包,当用户使用拼音输入或者字形输入时,根据日常汉字使用规范、专业用语及词语输入频道给出补全提示。
2、然而,离线联想词汇属于标准化的词汇包,在用户输入文字后从其中可能无法选出符合当前应用场景的词汇来进行联想整合。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够筛选出符合当前应用场景的目标词汇的获取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种目标词汇的获取方法,包括:
3、在检测到用户有文本输入操作时,获取与文本输入操作对应的文本输入框的上下文信息;
4、根据上下文信息确定用于筛选目标词汇的词汇选择范围;
5、基于词汇选择范围从预先构建的候选词汇库中确定与文本输入操作相关联的目标词汇;候选词汇库基于第一词汇库和第二词汇库生成;第一词汇库根据目标图片中所包含的图片文字信息生成,目标图片是针对用户的视觉范围所采集到的图片;第二词汇库根据用户的终端屏幕信息中所包含的屏幕文字信息生成。
6、在其中一个实施例中
7、获取用户的视觉范围内的目标图片,以及获取用户的终端屏幕信息;
8、根据目标图片得到第一词汇库,以及根据终端屏幕信息得到第二词汇库;
9、对第一词汇库和第二词汇库中包含的词汇进行融合处理,构成候选词汇库;候选词汇库中的候选词汇分别对应各自的权重。
10、在其中一个实施例中,第一词汇库中的第一词汇分别对应各自的第一权重;第二词汇库中的第二词汇分别对应各自的第二权重;
11、对第一词汇库和第二词汇库中包含的词汇进行融合处理,包括:
12、若第一词汇库中的词汇也被包含在第二词汇库中,获取词汇在第一词汇库中对应的第一权重,以及获取词汇在第二词汇库对应的第二权重;
13、基于第一权重和第二权重进行加权平均处理,得到词汇的权重。
14、在一个示例性的实施例中,根据目标图片得到第一词汇库,包括:
15、获取用户的眼动影像信息;
16、基于用户的眼动影像信息计算出用户的视觉焦点,以及利用ocr识别技术从目标图片中提取出第一词汇;
17、根据各第一词汇与视觉焦点的距离,对各第一词汇进行第一权重的赋值,基于第一权重赋值后的各第一词汇构成第一词汇库。
18、在一个实施例中,根据终端屏幕信息得到第二词汇库,包括:
19、利用ocr识别技术从用户的终端屏幕信息中提取出第二词汇;第二词汇对应有在用户的终端屏幕信息中的显示时间;
20、根据显示时间以及时间逆序原则,对各第二词汇进行第二权重的赋值,基于第二权重赋值后的各第二词汇构成第二词汇库。
21、在其中一个实施例中,基于词汇选择范围从预先构建的候选词汇库中确定与文本输入操作相关联的目标词汇,包括:
22、基于词汇选择范围,从候选词汇库根据各候选词汇对应的权重的大小,筛选出与文本输入操作相关联的目标词汇。
23、在一个示例性的实施例中,在基于词汇选择范围从预先构建的候选词汇库中确定与文本输入操作相关联的目标词汇之后,还包括:
24、对目标词汇进行联想整合,生成与文本操作输入相关联的推荐文本;
25、将推荐文本显示在与文本操作对应的文本输入提示框内进行输入提示。
26、第二方面,本申请还提供了一种目标词汇的获取装置,包括:
27、上下文信息获取模块,用于在检测到用户有文本输入操作时,获取与文本输入操作对应的文本输入框的上下文信息;
28、词汇选择范围确定模块,用于根据上下文信息确定用于筛选目标词汇的词汇选择范围;
29、目标词汇确定模块,用于基于词汇选择范围从预先构建的候选词汇库中确定与文本输入操作相关联的目标词汇;候选词汇库基于第一词汇库和第二词汇库生成;第一词汇库根据目标图片中所包含的图片文字信息生成,目标图片是针对用户的视觉范围所采集到的图片;第二词汇库根据用户的终端屏幕信息中所包含的屏幕文字信息生成。
30、第三方面,本申请还提高了一种目标词汇的获取系统,包括:用户视觉范围拍摄模组、用户眼动跟踪模组和计算机设备;
31、用户视觉范围拍摄模组,用于采集用户的视觉范围内的目标图片,并发送至计算机设备;
32、用户眼动跟踪模组,用于采集用户的眼动影像信息,并发送至计算机设备;
33、计算机设备,用于在检测到用户有文本输入操作时,获取与文本操作对应的文本输入框的上下文信息,并根据上下文信息确定用于筛选目标词汇的词汇选择范围,基于词汇选择范围从预先构建的候选词汇库中确定与文本输入操作相关联的目标词汇;候选词汇库基于第一词汇库和第二词汇库生成;第一词汇库根据目标图片中所包含的图片文字信息和眼动影像信息生成;第二词汇库根据用户的终端屏幕信息中所包含的屏幕文字信息生成。
34、第四方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
35、在检测到用户有文本输入操作时,获取与文本输入操作对应的文本输入框的上下文信息;
36、根据上下文信息确定用于筛选目标词汇的词汇选择范围;
37、基于词汇选择范围从预先构建的候选词汇库中确定与文本输入操作相关联的目标词汇;候选词汇库基于第一词汇库和第二词汇库生成;第一词汇库根据目标图片中所包含的图片文字信息生成,目标图片是针对用户的视觉范围所采集到的图片;第二词汇库根据用户的终端屏幕信息中所包含的屏幕文字信息生成。
38、第五方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
39、在检测到用户有文本输入操作时,获取与文本输入操作对应的文本输入框的上下文信息;
40、根据上下文信息确定用于筛选目标词汇的词汇选择范围;
41、基于词汇选择范围从预先构建的候选词汇库中确定与文本输入操作相关联的目标词汇;候选词汇库基于第一词汇库和第二词汇库生成;第一词汇库根据目标图片中所包含的图片文字信息生成,目标图片是针对用户的视觉范围所采集到的图片;第二词汇库根据用户的终端屏幕信息中所包含的屏幕文字信息生成。
42、第六方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤本文档来自技高网...
【技术保护点】
1.一种目标词汇的获取方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述候选词汇库通过下述步骤构建得到:
3.根据权利要求2所述的方法,其特征在于,所述第一词汇库中的第一词汇分别对应各自的第一权重;所述第二词汇库中的第二词汇分别对应各自的第二权重;
4.根据权利要求2所述的方法,其特征在于,所述根据所述目标图片得到第一词汇库,包括:
5.根据权利要求2所述的方法,其特征在于,所述根据所述终端屏幕信息得到第二词汇库,包括:
6.根据权利要求2所述的方法,其特征在于,所述基于所述词汇选择范围从预先构建的候选词汇库中确定与所述文本输入操作相关联的目标词汇,包括:
7.根据权利要求1所述的方法,其特征在于,在基于所述词汇选择范围从预先构建的候选词汇库中确定与所述文本输入操作相关联的目标词汇之后,还包括:
8.一种目标词汇的获取装置,其特征在于,所述装置包括:
9.一种目标词汇的获取系统,其特征在于,包括:用户视觉范围拍摄模组、用户眼动跟踪模组和计算机设备;
...【技术特征摘要】
1.一种目标词汇的获取方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述候选词汇库通过下述步骤构建得到:
3.根据权利要求2所述的方法,其特征在于,所述第一词汇库中的第一词汇分别对应各自的第一权重;所述第二词汇库中的第二词汇分别对应各自的第二权重;
4.根据权利要求2所述的方法,其特征在于,所述根据所述目标图片得到第一词汇库,包括:
5.根据权利要求2所述的方法,其特征在于,所述根据所述终端屏幕信息得到第二词汇库,包括:
6.根据权利要求2所述的方法,其特征在于,所述基于所述词汇选择范围从预先构建的候选词汇库中确定与所述文本输入操作相关联的目标词汇,包括:
7.根据权利要求1所述的方法,其特征在于,在基于所述词汇...
【专利技术属性】
技术研发人员:张舟,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。