文本信息处理方法及介质、设备、系统技术方案

技术编号:29526547 阅读:27 留言:0更新日期:2021-08-03 15:12
本发明专利技术实施例提供了文本信息处理方法及介质、设备、系统。所述方法包括建立内容丰富度模型,所述内容丰富度模型用于对目标文本对应的内容丰富度进行评价,所述目标文本来源于用户的历史文本,所述内容丰富度至少包括:所述目标文本的信息量;基于所述丰富度模型对所述目标文本进行分析,得到丰富度衡量后的文本;根据所述丰富度衡量后的文本确定选定的文本集合。上述技术方案可以提升文本信息处理的效率。

【技术实现步骤摘要】
文本信息处理方法及介质、设备、系统
本专利技术涉及信息处理领域,具体地,涉及文本信息处理方法及介质、设备、系统。
技术介绍
随着数据化时代的到来,越来越多的信息以文本信息的形式呈现。如何从文本信息中高效的挖掘符合预期目标的信息成为亟待解决的问题。该问题呈现在各种领域中。例如,在旅游服务领域,如何挖掘得到符合预期目标的优质文本,已成为该领域中信息服务提供方研究的热点。以旅游服务领域为例,随着互联网技术的发展,在线旅行社(OnlineTravelAgency,OTA)应运而生。OTA指"旅游消费者通过网络向旅游服务提供商预定旅游产品或服务,并通过网上支付或者线下付费,即各旅游主体可以通过网络进行产品营销或产品销售"。OTA的出现将原来传统的旅行社销售模式放到网络平台上,更广泛的传递了线路信息,互动式的交流更方便了客人的咨询和订购。大型的OTA平台积累了大量的用户文本(评论,问答,攻略分享等等)信息。这些信息包含了用户的真实的评价,如何合理运用这些宝贵的信息是众多OTA平台亟待解决的问题。一方面面对上亿级别的数据,传统的人工挑本文档来自技高网...

【技术保护点】
1.一种文本信息处理方法,其特征在于,包括:/n建立内容丰富度模型,所述内容丰富度模型用于对目标文本对应的内容丰富度进行评价,所述目标文本来源于用户的历史文本,所述内容丰富度至少包括:所述目标文本的信息量;/n基于所述丰富度模型对所述目标文本进行分析,得到丰富度衡量后的文本;/n根据所述丰富度衡量后的文本确定选定的文本集合。/n

【技术特征摘要】
1.一种文本信息处理方法,其特征在于,包括:
建立内容丰富度模型,所述内容丰富度模型用于对目标文本对应的内容丰富度进行评价,所述目标文本来源于用户的历史文本,所述内容丰富度至少包括:所述目标文本的信息量;
基于所述丰富度模型对所述目标文本进行分析,得到丰富度衡量后的文本;
根据所述丰富度衡量后的文本确定选定的文本集合。


2.根据权利要求1所述的文本信息处理方法,其特征在于,对所述目标文本的信息量进行评价包括:利用信息熵、词性以及依存句法中至少一种确定所述目标文本对应的语句信息量。


3.根据权利要求1所述的文本信息处理方法,其特征在于,所述文本信息处理方法还包括:获取指定产品的信息;所述内容丰富度模型用于对目标文本对应的内容丰富度进行评价还包括:评价所述目标文本与所述指定产品的内容关联关系。


4.根据权利要求3所述的文本信息处理方法,其特征在于,所述目标文本与所述指定产品的内容关联关系基于实体识别技术以及知识图谱确定。


5.根据权利要求1所述的文本信息处理方法,其特征在于,所述文本信息处理方法还包括:获取所述目标文本对应的应用场景;所述内容丰富度模型用于对目标文本对应的内容丰富度进行评价包括:基于所述应用场景对所述目标文本进行评价。


6.根据权利要求5所述的文本信息处理方法,其特征在于,基于所述应用场景对所述目标文本进行评价包括:
建立对应不同应用场景的评价维度及评价维度分类模型;
基于所述评价维度及评价维度分类模型对所述目标文本进行评价。


7.根据权利要求1所述的文本信息处理方法,其特征在于,在所述建立内容丰富度模型之前还包括:对所述用户的历史文本进行预处理,筛选情感为正向的文本作为所述目标文本。


8.根据权利要求1所述的文本信息处理方法,其特征在于,还包括:
获取用户的个性化要求;
基于所述个性化要求,建立个性化匹配模型;
根据所述个性化匹配模型对所述目标文本或所述丰富度衡量后的文本进行匹配,以得到个性化匹配后的结果;
所述根据所述丰富度衡量后的文本确定选定的文本集合包括:结合所述个性化匹配后的结果以及所述...

【专利技术属性】
技术研发人员:朱登龙邹宇何蜀波孙玉霞刘新刘洋余迁
申请(专利权)人:携程旅游信息技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1