文本排序方法、装置及计算机可读存储介质制造方法及图纸

技术编号:22166885 阅读:47 留言:0更新日期:2019-09-21 10:34
本发明专利技术公开了一种文本排序方法、装置及计算机可读存储介质,该方法包括:获取目标文本;根据文本内容信息确定每一所述目标文本基于文本内容维度的内容质量分数值,其中,所述文本内容信息包括文本长度值、图片数量值和业务关键词命中信息值中的至少一种;至少根据每一目标文本的所述内容质量分数值对所有所述目标文本进行排序;按照所述排序显示每一所述目标文本。

Text Sorting Method, Device and Computer Readable Storage Media

【技术实现步骤摘要】
文本排序方法、装置及计算机可读存储介质
本专利技术涉及自然语言处理
,更具体地,涉及一种文本排序方法、一种文本排序装置以及一种计算机可读存储介质。
技术介绍
目前,智能用户声音产品通过搜集站内反馈、舆情、服务热线等多渠道数据,并对多渠道数据进行分析,可以挖掘出用户在使用产品中的真实需求和体验痛点,为运营决策和产品设计提供关键依据。每个渠道数据都有各自的特点,比如服务热线渠道数据通常为用户投诉或者咨询信息,舆情渠道数据通常为一些风险事件信息,站内反馈渠道数据通常为用户建议等。现有技术中,多渠道数据的内容通常是基于用户信息维度计算质量分,并将该质量分作为多渠道数据排序的依据。用户信息包括用户行为信息和用户画像信息。用户行为信息包括用户访问的内容信息、用户收藏的内容信息和用户的浏览时长信息。用户画像信息包括用户等级信息、用户职业信息、用户年龄信息。这种基于用户维度信息计算多渠道数据的质量分的方式,并没有真实体现出多渠道数据的内容质量,导致得到的多渠道数据的排序的可靠性和准确性较差。
技术实现思路
本专利技术的一个目的是提供一种用于文本排序显示的新技术方案。根据本专利技术的第一方面,提供了一种文本排序方法,包括:获取目标文本;根据文本内容信息确定每一所述目标文本基于文本内容维度的内容质量分数值,其中,所述文本内容信息包括文本长度值、图片数量值和业务关键词命中信息值中的至少一种;至少根据每一目标文本的所述内容质量分数值对所有所述目标文本进行排序;按照所述排序显示每一所述目标文本。可选地,在根据文本内容信息确定每一所述目标文本基于文本内容维度的内容质量分数值之前,所述方法还包括获取每一所述目标文本的所述文本长度值:对所述目标文本的停用词进行过滤,得到过滤后的目标文本;统计所述过滤后的目标文本的字数,并将所述字数作为所述目标文本的文本长度值。可选地,在根据文本内容信息确定每一所述目标文本基于文本内容维度的内容质量分数值之前,所述方法还包括获取每一所述目标文本的所述业务关键词命中信息值:利用关键词提取方法提取所述目标文本的关键词;获得所述目标文本所属业务类别的业务关键词;将所述目标文本的关键词和所述目标文本所属业务类别的业务关键词进行比对,获得所述目标文本命中的业务关键词;确定所述目标文本命中的业务关键词的命中信息值。可选地,至少根据每一所述目标文本的所述内容质量分数值对所有所述目标文本进行排序,包括:根据每一所述目标文本基于文本内容维度的质量分数值和基于文本类别维度的类别质量分数值,对所有所述目标文本进行排序;其中,每一所述目标文本基于文本类别维度的类别质量分数值是根据文本所属业务类别信息确定,所述文本所属业务类别信息包括所述文本所属业务类别的概率值和所述文本所属业务类别对应的权重值。可选地,在根据文本所属业务类别信息确定每一所述目标文本基于文本类别维度的类别质量分数值之前,所述方法还包括获取每一目标文本所属业务类别的概率值:利用深度学习模型预测得到所述目标文本对应的各业务类别的概率值;从所述目标文本对应的各业务类别的概率值中筛选得到最高概率值,并将所述最高概率值记作为所述目标文本所属业务类别的概率值。可选地,在按照所述排序显示每一所述目标文本之前,所述方法还包括:获得每一所述目标文本所属业务类别的标签信息;在按照所述排序显示每一所述目标文本的同时,基于每一所述目标文本均相应显示对应的所属业务类别的标签信息。可选地,至少根据每一所述目标文本的所述内容质量分数值对所有所述目标文本进行排序,包括:基于多个来源渠道,根据每一所述目标文本的所述内容质量分数值和每一所述目标文本在各自来源渠道所处的排序位置对应的位置权重值,对所有所述目标文本进行排序;其中,每一个来源渠道的相邻排序位置的位置权重值相差一个数量级,且不同来源渠道的同一排序位置对应的位置权重值是相同的。可选地,在按照所述排序显示每一所述目标文本之前,所述方法还包括:获取每一所述目标文本的来源渠道的标签信息;在按照所述排序显示每一所述目标文本的同时,基于每一所述目标文本均相应显示对应的来源渠道的标签信息。根据本专利技术的第二方面,提供了一种文本排序装置,包括:获取模块,用于获取目标文本;质量分数值确定模块,用于根据文本内容信息确定每一所述目标文本基于文本内容维度的内容质量分数值,其中,所述文本内容信息包括文本长度值、图片数量值和业务关键词命中信息值中的至少一种;排序模块,用于至少根据每一目标文本的所述内容质量分数值对所有所述目标文本进行排序;显示模块,用于按照所述排序显示每一所述目标文本。根据本专利技术的第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器用于存储可执行的指令;所述处理器用于根据所述指令的控制执行根据第一方面中任意一项所述的方法。根据本专利技术的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据第一方面中任意一项所述的方法。本专利技术实施例提供的文本排序方法,从目标文本的内容出发,确定目标文本的质量分数值,提高了目标文本的质量分数值的确定的可靠性和专准确性,使得可以从大量目标文本中挖掘出高质量、高价值的内容,从而提高运营效率。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1是可用于实现本专利技术任意实施例的文本排序方法的电子设备的硬件配置的框图。图2是根据本专利技术一个实施例的文本排序方法的处理流程图。图3是根据本专利技术一个实施例的用户反馈文本的显示示意图。图4是根据本专利技术另一个实施例的用户反馈文本的显示示意图。图5是根据本专利技术另一个实施例的各用户反馈文本的显示示意图。图6为根据本专利技术实施例的文本排序装置的原理框图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。<硬件配置>图1是可用于实现本专利技术任意实施例的文本排序方法的电子设备的硬件配置的框图。在一个实施例中,电子设备1000可以是服务器,也可以是终端设备。服务器提供处理、数据库、通讯设施的业务点。服务器可以是整体式服务器或是跨多计算机或计算机数据中心的分散式服务器。服务器可以是各种类型的,例如但不限于,网络服务器,新闻服务器,邮件服务器,消息服务器,广告服务器,文件服务器,应用服务器,交互服务器,数据库服务器,或代理服务器。在一些实施例中,每个服务器可以包括硬件,软件,或用于执行服务器所支持或实现的合适本文档来自技高网...

【技术保护点】
1.一种文本排序方法,包括:获取目标文本;根据文本内容信息确定每一所述目标文本基于文本内容维度的内容质量分数值,其中,所述文本内容信息包括文本长度值、图片数量值和业务关键词命中信息值中的至少一种;至少根据每一目标文本的所述内容质量分数值对所有所述目标文本进行排序;按照所述排序显示每一所述目标文本。

【技术特征摘要】
1.一种文本排序方法,包括:获取目标文本;根据文本内容信息确定每一所述目标文本基于文本内容维度的内容质量分数值,其中,所述文本内容信息包括文本长度值、图片数量值和业务关键词命中信息值中的至少一种;至少根据每一目标文本的所述内容质量分数值对所有所述目标文本进行排序;按照所述排序显示每一所述目标文本。2.根据权利要求1所述的方法,其中,在根据文本内容信息确定每一所述目标文本基于文本内容维度的内容质量分数值之前,所述方法还包括获取每一所述目标文本的所述文本长度值:对所述目标文本的停用词进行过滤,得到过滤后的目标文本;统计所述过滤后的目标文本的字数,并将所述字数作为所述目标文本的文本长度值。3.根据权利要求1所述的方法,其中,在根据文本内容信息确定每一所述目标文本基于文本内容维度的内容质量分数值之前,所述方法还包括获取每一所述目标文本的所述业务关键词命中信息值:利用关键词提取方法提取所述目标文本的关键词;获得所述目标文本所属业务类别的业务关键词;将所述目标文本的关键词和所述目标文本所属业务类别的业务关键词进行比对,获得所述目标文本命中的业务关键词;确定所述目标文本命中的业务关键词的命中信息值。4.根据权利要求1所述的方法,至少根据每一所述目标文本的所述内容质量分数值对所有所述目标文本进行排序,包括:根据每一所述目标文本基于文本内容维度的质量分数值和基于文本类别维度的类别质量分数值,对所有所述目标文本进行排序;其中,每一所述目标文本基于文本类别维度的类别质量分数值是根据文本所属业务类别信息确定,所述文本所属业务类别信息包括所述文本所属业务类别的概率值和所述文本所属业务类别对应的权重值。5.根据权利要求4所述的方法,其中,所述文本所属业务类别的概率值通过以下方式确定:利用深度学习模型预测得到所述目标文本对应的各业务类别的概率值;从所述目标文本对应的各业务类别的概率...

【专利技术属性】
技术研发人员:袁翔张伟
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1