文档推送方法、装置和存储介质制造方法及图纸

技术编号:20680895 阅读:26 留言:0更新日期:2019-03-27 18:52
本发明专利技术提供一种文档推送方法、装置和存储介质,该方法包括:获取用户输入的会话消息中的目标词语;获取本地数据库中每个文档的每个关键词与目标词语的第一语义相似度;获取第一语义相似度大于相似度阈值的第一关键词;推送第一关键词对应的第一文档,以及,第二文档,第二文档中的关键词为第一关键词在第一文档中的第一关联词,第一关键词和第一关联词组合成的组合词用于表示:第一文档中包括第一关键词和第一关联词的语句的语义。本发明专利技术中通过推送关键词对应的文档,以及关键词的关联词对应的文档,且关联词和关联词形成的组合词能够表示文档的语义,使得推送的文档更为准确、全面,提高了用户体验。

【技术实现步骤摘要】
文档推送方法、装置和存储介质
本专利技术涉及通信
,尤其涉及一种文档推送方法、装置和存储介质。
技术介绍
文档是指人们在社会活动和工作中形成的,以计算机盘片、固态硬盘、磁盘和光盘等化学磁性物理材料为载体的文字材料等。依赖计算机系统存取并可在通信网络上传输。文档的文档类型可以为PPT(MicrosoftOfficePowerPoint,演示文稿)、word、HTML(HyperTextMarkupLanguage,超级文本标记语言)、Txt等类型。现有技术中,文档管理系统根据用户输入的查询语句为用户推送文档,具体的,是将文档的关键词与用户输入的查询语句中的关键词相同的文档推送给用户。但这种文档推送方式依赖于用户输入的查询语句,当用户输入的查询语句中的关键词不准确,或者并非是用户真正需求的文档的关键词时,文档管理系统推送的文档不是用户真正需求的文档,用户只能反复改变搜索的查询语句进行文档的搜索。
技术实现思路
本专利技术提供一种文档推送方法、装置和存储介质,通过推送关键词对应的文档,以及关键词的关联词对应的文档,且关联词和关联词形成的组合词能够表示文档的语义,使得推送的文档更为准确、全面,提高了用户体验。本专利技术的第一方面提供一种文档推送方法,包括:获取终端发送的会话消息中的目标词语;获取本地数据库中每个文档的每个关键词与所述目标词语的第一语义相似度;获取所述第一语义相似度大于相似度阈值的第一关键词;推送所述第一关键词对应的第一文档,以及,第二文档,以使所述终端显示所述第一文档,以及,所述第二文档,所述第二文档中的关键词为所述第一关键词在所述第一文档中的第一关联词,所述第一关键词和所述第一关联词组合成的组合词用于表示:所述第一文档中包括所述第一关键词和所述第一关联词的语句的语义。可选的,所述方法还包括:获取所述本地数据库中每个所述文档的至少一个关键词,以及,每个所述关键词的关联词。可选的,所述获取所述本地数据库中每个所述文档的至少一个关键词,以及,每个所述关键词的关联词之后,还包括:根据每个所述关键词的语义,以及每个所述关键词的关联词的语义,获取每个所述关键词的同义词集合;所述推送所述第一关键词对应的第一文档,以及,所述第二文档,包括:推送所述第一文档、所述第二文档,以及,所述第一关键词的同义词集合中包含的词语对应的第三文档,以使所述终端显示所述第一文档、所述第二文档和所述第三文档,所述第三文档的关键词为所述第一关键词的同义词集合中包含的词语,所述第一关键词的同义词集合中包含的词语为除了所述第一文档和所述第二文档之外的其他文档的关键词或关联词。可选的,所述获取每个所述关键词的同义词集合,包括:获取每个所述关键词的语义与其他每个关键词的语义的第二语义相似度,以及,每个所述关键词的语义与每个关键词的关联词的语义的第三语义相似度;根据所述第二语义相似度和所述第三语义相似度,获取每个所述关键词的同义词集合。可选的,所述获取本地数据库中每个所述文档的至少一个关键词,以及,每个所述关键词的关联词之后,还包括:根据每个所述关键词的语义,以及每个所述关键词的关联词的语义,获取每个所述关键词的关联词的同义词集合;所述推送所述第一关键词对应的第一文档,以及,第二文档,包括:推送所述第一文档、所述第二文档,以及,所述第一关联词的同义词集合中包含的词语对应的第四文档,以使所述终端显示所述第一文档、所述第二文档和所述第四文档,所述第四文档的关键词为所述第一关联词的同义词集合中包含的词语,所述第一关联词的同义词集合中包含的词语为除了所述第一文档和所述第二文档之外的其他文档的关键词或关联词。可选的,所述根据每个所述关键词的语义,以及每个所述关键词的关联词的语义,获取每个所述关键词的关联词的同义词集合,包括:获取每个所述关键词的关联词的语义与每个关键词的语义的第四语义相似度,以及,每个所述关键词的关联词的语义与其他关联词的语义的第五语义相似度;根据所述第四语义相似度和所述第五语义相似度,获取每个所述关键词的关联词的同义词集合。可选的,所述推送所述第一关键词对应的第一文档,以及,第二文档,包括:推送所述第一文档、所述第二文档,以及,第五文档,以使所述终端显示所述第一文档、所述第二文档和所述第五文档,所述第五文档的关键词为所述第一关联词在所述第二文档中作为关键词时的第二关联词。可选的,所述获取用户输入的会话消息中的目标词语,包括:将所述用户输入的会话消息进行分词处理,获取多个待选词语;根据多个所述待选词语的词性,将预设词性对应的词语确定为所述目标词语。本专利技术的第二方面提供一种文档推送方法,包括:向服务器发送会话消息;接收第一关键词对应的第一文档,以及,第二文档;其中,所述第一关键词为所述服务器的本地数据库中与所述目标词语的第一语义相似度大于相似度阈值的关键词,所述第二文档的关键词为所述第一关键词在所述第一文档中的第一关联词,所述第一关键词和所述第一关联词组合成的组合词用于表示:所述第一文档中包括所述第一关键词和所述第一关联词的语句的语义;显示所述第一文档,以及,所述第二文档。可选的,所述接收第一关键词对应的第一文档,以及,第二文档,包括:接收所述第一文档、所述第二文档,以及,第三文档,所述第三文档为所述第一关键词的同义词集合中包含的词语对应的第三文档,所述第一关键词的同义词集合中包含的词语为除了所述第一文档和所述第二文档之外的其他文档的关键词或关联词;显示所述第一文档、所述第二文档和所述第三文档。可选的,所述在接收第一关键词对应的第一文档,以及,第二文档,包括:接收所述第一文档、所述第二文档,以及,第四文档,所述第四文档的关键词为所述第一关联词的同义词集合中包含的词语,所述第一关联词的同义词集合中包含的词语为除了所述第一文档和所述第二文档之外的其他文档的关键词或关联词;显示所述第一文档、所述第二文档和所述第四文档。可选的,所述在接收第一关键词对应的第一文档,以及,第二文档,包括:接收所述第一文档、所述第二文档,以及,第五文档,所述第五文档的关键词为所述第一关联词在所述第二文档中作为关键词时的第二关联词;显示所述第一文档、所述第二文档和所述第五文档。本专利技术的第三方面提供一种文档推送装置,包括:目标词语获取模块,用于终端发送的会话消息中的目标词语;语义相似度获取模块,用于获取本地数据库中每个文档的每个关键词与所述目标词语的第一语义相似度;关键词获取模块,用于获取所述第一语义相似度大于相似度阈值的第一关键词;推送模块,用于推送所述第一关键词对应的第一文档,以及,第二文档,所述第二文档中的关键词为所述第一关键词在所述第一文档中的第一关联词,所述第一关键词和所述第一关联词组合成的组合词用于表示:所述第一文档中包括所述第一关键词和所述第一关联词的语句的语义。本专利技术的第四方面提供一种文档推送装置,包括:会话消息发送模块,用于向服务器发送会话消息;接收模块,用于接收第一关键词对应的第一文档,以及,第二文档;其中,所述第一关键词为所述服务器的本地数据库中与所述目标词语的第一语义相似度大于相似度阈值的关键词,所述第二文档的关键词为所述第一关键词在所述第一文档中的第一关联词,所述第一关键词和所述第一关联词组合成的组合词用于表示:所述第一文档中包括所述第一关本文档来自技高网...

【技术保护点】
1.一种文档推送方法,其特征在于,包括:获取终端发送的会话消息中的目标词语;获取本地数据库中每个文档的每个关键词与所述目标词语的第一语义相似度;获取所述第一语义相似度大于相似度阈值的第一关键词;推送所述第一关键词对应的第一文档,以及,第二文档,以使所述终端显示所述第一文档,以及,所述第二文档,所述第二文档中的关键词为所述第一关键词在所述第一文档中的第一关联词,所述第一关键词和所述第一关联词组合成的组合词用于表示:所述第一文档中包括所述第一关键词和所述第一关联词的语句的语义。

【技术特征摘要】
1.一种文档推送方法,其特征在于,包括:获取终端发送的会话消息中的目标词语;获取本地数据库中每个文档的每个关键词与所述目标词语的第一语义相似度;获取所述第一语义相似度大于相似度阈值的第一关键词;推送所述第一关键词对应的第一文档,以及,第二文档,以使所述终端显示所述第一文档,以及,所述第二文档,所述第二文档中的关键词为所述第一关键词在所述第一文档中的第一关联词,所述第一关键词和所述第一关联词组合成的组合词用于表示:所述第一文档中包括所述第一关键词和所述第一关联词的语句的语义。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述本地数据库中每个所述文档的至少一个关键词,以及,每个所述关键词的关联词。3.根据权利要求2所述的方法,其特征在于,所述获取所述本地数据库中每个所述文档的至少一个关键词,以及,每个所述关键词的关联词之后,还包括:根据每个所述关键词的语义,以及每个所述关键词的关联词的语义,获取每个所述关键词的同义词集合;所述推送所述第一关键词对应的第一文档,以及,所述第二文档,包括:推送所述第一文档、所述第二文档,以及,所述第一关键词的同义词集合中包含的词语对应的第三文档,以使所述终端显示所述第一文档、所述第二文档和所述第三文档,所述第三文档的关键词为所述第一关键词的同义词集合中包含的词语,所述第一关键词的同义词集合中包含的词语为除了所述第一文档和所述第二文档之外的其他文档的关键词或关联词。4.根据权利要求3所述的方法,其特征在于,所述获取每个所述关键词的同义词集合,包括:获取每个所述关键词的语义与其他每个关键词的语义的第二语义相似度,以及,每个所述关键词的语义与每个关键词的关联词的语义的第三语义相似度;根据所述第二语义相似度和所述第三语义相似度,获取每个所述关键词的同义词集合。5.根据权利要求2所述的方法,其特征在于,所述获取本地数据库中每个所述文档的至少一个关键词,以及,每个所述关键词的关联词之后,还包括:根据每个所述关键词的语义,以及每个所述关键词的关联词的语义,获取每个所述关键词的关联词的同义词集合;所述推送所述第一关键词对应的第一文档,以及,第二文档,包括:推送所述第一文档、所述第二文档,以及,所述第一关联词的同义词集合中包含的词语对应的第四文档,以使所述终端显示所述第一文档、所述第二文档和所述第四文档,所述第四文档的关键词为所述第一关联词的同义词集合中包含的词语,所述第一关联词的同义词集合中包含的词语为除了所述第一文档和所述第二文档之外的其他文档的关键词或关联词。6.根据权利要求5所述的方法,其特征在于,所述根据每个所述关键词的语义,以及每个所述关键词的关联词的语义,获取每个所述关键词的关联词的同义词集合,包括:获取每个所述关键词的关联词的语义与每个关键词的语义的第四语义相似度,以及,每个所述关键词的关联词的语义与其他关联词的语义的第五语义相似度;根据所述第四语义相似度和所述第五语义相似度,获取每个所述关键词的关联词的同义词集合。7.根据权利要求1所述的方法,其特征在于,所述推送所述第一关键词对应的第一文档,以及,第二文档,包括:推送所述第一文档、所述第二文档,以及,第五文档,以使所述终端显示所述第一文档、所述第二文档和所述第五文档,所述第五文档的关键词为所述第一关联词在所述第二文档中作为关键词时的第二关联词。8.根据权利要求1所述的方法,其特征在于,所述获取用户输入的会话消息中的目标词语,包括:将所述用户输入的会话消息进行分词处理,获取多个待选词语;根据多个所述待选词语的词性,将预设词性对应的词语确定为所述目标词语。9.一种文档推送方法,其特征在于,包括:向服务器发送会话消息;接收第一关键词对应的第一文档,以及,第二文档;其中,...

【专利技术属性】
技术研发人员:张道琳龙岳蒋成郭佳睿张金玲
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1