一种智能文本处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：24888135 阅读：12 留言：0更新日期：2020-07-14 18:15

本发明专利技术提供了一种智能文本处理方法，包括获取使用环境中的选中操作对应的文本内容；提取与文本内容相匹配的特征向量；根据特征向量确定与文本内容所对应的至少一个词语级的隐变量；根据至少一个词语级的隐变量，生成与词语级的隐变量相对应的候选词语以及候选词语的被选取概率；根据候选词语的被选取概率，选取至少一个候选词语组成与文本内容相对应的目标文本；在使用环境中的以与选中操作对应的显示方式显示目标文本。本发明专利技术还提供了智能文本处理装置、电子设备及存储介质。本发明专利技术能够减少用户由于可操作面积的限制或者用户视觉操作的习惯与熟练度的限制，所造成的无法高效准确地选择相应的文本信息，提升用户的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种智能文本处理方法、装置、电子设备及存储介质
本专利技术涉及信息处理技术，尤其涉及智能文本处理方法、装置、电子设备及存储介质。
技术介绍
传统技术中，在不同的使用环境中，用户均存在对使用环境中的文本信息进行选择的需求，例如对触摸屏使用环境中所显示的文本进行选择或者通过用户的视觉信息进行文本信息的选择，以满足用户的不同使用需求，但是传统的文本信息选择方式由于可操作面积的限制或者用户视觉操作的习惯与熟练度的限制，使得用户无法高效准确地选择相应的文本信息，经常遇到无法选择到理想的文本的情况，影响了用户对于文本的选择速度与选择精确度，为此，人工智能技术(AI，ArtificialIntelligence)提供了适当的文本处理进程的运行机制来支持上述应用的方案。其中，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能，在语音处理领域中，也就是通过利用数字计算机或者数字计算机控制的机器实现对文本信息的识别。
技术实现思路
有鉴于此，本专利技术实施例提供一种智能文本处理方法、装置、电子设备及存储介质，本专利技术实施例的技术方案是这样实现的：本专利技术实施例提供了一种智能文本处理方法，包括：获取使用环境中的选中操作对应的文本内容；提取与所述文本内容相匹配的特征向量；根据所述特征向量确定与所述文本内容所对应的

【技术保护点】
1.一种智能文本处理方法，其特征在于，所述方法包括：/n获取使用环境中的选中操作对应的文本内容；/n提取与所述文本内容相匹配的特征向量；/n根据所述特征向量确定与所述文本内容所对应的至少一个词语级的隐变量；/n根据所述至少一个词语级的隐变量，生成与所述词语级的隐变量相对应的候选词语以及所述候选词语的被选取概率；/n根据所述候选词语的被选取概率，选取至少一个候选词语组成与所述文本内容相对应的目标文本；/n在所述使用环境中以与所述选中操作对应的显示方式，显示所述目标文本。/n

【技术特征摘要】
1.一种智能文本处理方法，其特征在于，所述方法包括：
获取使用环境中的选中操作对应的文本内容；
提取与所述文本内容相匹配的特征向量；
根据所述特征向量确定与所述文本内容所对应的至少一个词语级的隐变量；
根据所述至少一个词语级的隐变量，生成与所述词语级的隐变量相对应的候选词语以及所述候选词语的被选取概率；
根据所述候选词语的被选取概率，选取至少一个候选词语组成与所述文本内容相对应的目标文本；
在所述使用环境中以与所述选中操作对应的显示方式，显示所述目标文本。

2.根据权利要求1所述的方法，其特征在于，所述提取与所述文本内容相匹配的特征向量，包括：
根据所述文本内容所携带的文本参数信息，触发相应的分词库；
通过所触发的所述分词库单词词典对所述文本内容进行分词处理，形成不同的词语级特征向量；
对所述不同的词语级特征向量进行除噪处理，形成与所述文本内容相对应的词语级特征向量集合。

3.根据权利要求2所述的方法，其特征在于，所述对所述不同的词语级特征向量进行除噪处理，形成与所述文本内容相对应的词语级特征向量集合，包括：
当所述使用环境为通过视觉信息选择文本信息，或者，对触摸屏中的文本信息进行选择时，
确定与文本处理模型的使用环境相匹配的动态噪声阈值；
根据所述动态噪声阈值对所述不同的词语级特征向量进行除噪处理，并触发与所述动态噪声阈值相匹配的动态分词策略；
根据与所述动态噪声阈值相匹配的动态分词策略，对所述文本内容进行分词处理，形成与所述文本内容相对应的动态词语级特征向量集合。

4.根据权利要求2所述的方法，其特征在于，所述对所述不同的词语级特征向量进行除噪处理，形成与所述文本内容相对应的词语级特征向量集合，包括：
当所述使用环境为在虚拟现实使用环境中选择文本信息时，
确定与文本处理模型的使用环境相对应的固定噪声阈值；
根据所述固定噪声阈值对所述不同的词语级特征向量进行除噪处理，并触发与所述固定噪声阈值相匹配的固定分词策略；
根据与所述固定噪声阈值相匹配的固定分词策略，对所述目标文本进行分词处理，与所述文本内容相对应的固定词语级特征向量集合。

5.根据权利要求1所述的方法，其特征在于，所述提取与所述文本内容相匹配的特征向量，包括：
对所述文本内容进行分词处理，形成分词处理结果；
响应于所述分词处理结果，对所述文本内容进行去停用词处理，以形成与所述文本内容相匹配的文本关键词；
根据所述文本内容相匹配的文本关键词，确定与所述文本内容相匹配的词性标注结果，并形成与所述文本内容相对应的词性特征向量集合。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：
获取与文本处理模型的使用环境相匹配的训练样本；
通过所述文本处理模型的提取与所述训练样本相匹配的特征集合；
根据与所述训练样本相匹配的特征集合和相应的目标文本标签对所述文本处理模型进行训练，以实现确定与所述文本处理模型相适配的模型参数。

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：
侦测不同用户对所述文本内容的处理结果，以及相应的操作参数；
根据对所述文本内容的处理结果，以及相应的操作参数形成与所述不同用户分别对应的历史数据索引；其中，所述历史数据索引用于对所述文本处理模型所生成的目标文本进行评价。

8.根据权利要求1至7任一项所述的方法，其特征在于，所述方法还...

【专利技术属性】
技术研发人员：田植良，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人