文本提取方法技术

技术编号:39580266 阅读:25 留言:0更新日期:2023-12-03 19:31
本公开涉及一种文本提取方法

【技术实现步骤摘要】
文本提取方法、装置、计算机设备和存储介质


[0001]本公开涉及数据处理
,特别是涉及一种文本提取方法

装置

计算机设备和存储介质


技术介绍

[0002]随着信息技术的发展,智能终端被广泛地应用于各种应用场景中

根据用户的需求,智能终端上的
APP
可以为用户提供不同的服务,因此,
APP
所提供的功能及其本身的性能影响着用户的体验感

[0003]传统技术中,可以根据用户针对
APP
的评论对
APP
进行针对性的优化改进

然而,面对海量的用户评论信息,通过人工操作从中获取有用的信息,操作繁琐,工作量大,效率低下,很难及时地进行
APP
的优化改进,用户体验感差


技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种简化流程提高效率的文本提取方法

装置

>计算机设备
...

【技术保护点】

【技术特征摘要】
1.
一种文本提取方法,其特征在于,所述方法包括:从应用程序的信息发布平台中获取所述应用程序的账户发布的评价信息文本;将所述评价信息文本输入至文本提取模型,经所述文本提取模型输出目标文本及所述目标文本属于预设文本类别的概率值,其中,所述文本提取模型为基于评价信息文本样本和对应的预设文本类别的文本标签之间的对应关系训练得到,属于所述预设文本类别的文本与所述应用程序的性能之间的相关度大于预设相关度;在所述概率值大于预设阈值的情况下,将所述评价信息文本和所述目标文本发送至目标账户
。2.
根据权利要求1所述的方法,其特征在于,所述文本提取模型的获取方式,包括:获取评价信息文本样本集合,所述集合中包括标注有预设文本类别的文本标签的评价信息文本样本;构建初始文本提取模型,所述初始文本提取模型中设置有训练参数;将所述评价信息文本样本集合输入至所述初始文本提取模型,经所述初始文本提取模型得到输出结果;基于所述输出结果和标注的预设文本类别的文本标签之间的差异,对所述初始文本提取模型进行迭代调整,直至所述差异符合预设要求,得到文本提取模型
。3.
根据权利要求2所述的方法,其特征在于,所述评价信息文本样本集合的获取方式,包括:从所述信息发布平台上获取历史评价信息文本;确定符合预设条件的历史评价信息文本为初始评价信息文本,所述预设条件为基于所述应用程序的历史更新数据和所述历史评价信息文本之间的相关度确定得到;利用所述初始评价信息文本中预设文本类别的文本对所述初始评价信息文本进行标注处理,得到评价信息文本样本集合
。4.
根据权利要求1所述的方法,其特征在于,所述从应用程序的信息发布平台中获取所述应用程序的账户发布的评价信息文本,包括:从应用程序的信息发布平台中获取所述应用程序的账户发布的原始评价信息文本;将所述原始评价信息文本输入至文本转换模型,经所述文本转换模型输出预设文本格式的评价信息文本,所述文本转换模型为基于原始评价信息文本样本和对应的预设文本格式的评价信息文本标签之间的对应关系训练得到
。5.
一种文本提取装置,其特征在于,所述装置包括:获取模块,用于从应用程序的信息发布平台中获取所述应用程序的账户发布的评价信息文本;输...

【专利技术属性】
技术研发人员:祁江楠袁玥雷禹
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1