【技术实现步骤摘要】
一种基于自然语言的素材推荐方法、系统、设备及介质
[0001]本专利技术涉及素材推荐
,特别是涉及一种基于自然语言的素材推荐方法、系统、设备及介质。
技术介绍
[0002]存在大量新闻稿件、通知、报告等文档写作需求时,文档编写人员需花费大量人力从海量的存留文档中层层分析,筛选写作素材,存在遗漏、费时、费力等诸多问题,写作效率较低,基层负担较重。特别是针对当前用户正在写作的内容进行选题、结构化模板、关键词等方面的提示和推荐,需要一种的智能写作辅助系统,有效地解决用户缺乏写作素材或主题模板的问题;包括实时获取编辑文本信息、查询分析、语义搜索及L2R(Learning to Rank)、候选短语推荐、例句实时推荐、相关主题段落推荐及推荐标题等;所述编辑信息获取模块用于实时采集用户输入,并将获取的输入数据自动发送给查询分析模块、L2R(Learning to Rank),实现候选短语推荐、例句推荐、主题段落推荐等功能。
技术实现思路
[0003]本专利技术的目的在于,提出一种基于自然语言的素材推荐方法、系统、设 ...
【技术保护点】
【技术特征摘要】
1.一种基于自然语言的素材推荐方法,其特征在于,包括:采集目标用户输入的实时内容;根据预设的行业知识库对所述目标用户输入的实时内容进行查询分析,得到相应的关键词;并通过预设的检索算法对所述相应的关键词进行检索,得到第一推荐结果;将输入的实时内容转化为语义向量输入预先训练的句向量搜索引擎,得到第二推荐结果;将所述第一推荐结果和所述第二推荐结果作为输入量输入预先训练的排序模型,输出所述第一推荐结果和所述第二推荐结果对应的相似性得分,并根据对应的相似性得分对所述第一推荐结果和所述第二推荐结果进行排序,将得到排序结果输出为最终的推荐结果。2.如权利要求1所述的方法,其特征在于,所述预设的行业知识库根据以下过程获得:采集行业语料数据并转换成预设的格式;识别所述行业语料数据中的文本元素,生成文档树;根据预设的电力行业知识图谱识别对应关键词,并根据预设的知识三元组数据对所述关键词进行拆分;判断拆分后的关键词是否存在语义相同的词语,并将语义相同的词语组成为一个新的关键词集;将关键词集预设的电力行业知识图谱中,得到预设的行业知识库;其中,所述预设的行业知识库包括用于检索的词语、与所述词语对应的问句及对应的答案。3.如权利要求1所述的方法,其特征在于,所述预先训练的句向量搜索引擎根据以下过程进行训练:将采集的行业语料数据按照预设的格式进行格式转化;对格式转化后的采集的行业语料数据按照预设的类别标准进行分类,得到电力行业知识相似问句样本数据集;将所述电力行业知识相似问句样本数据集按照预设比例组成电力专业知识问答训练数据集。4.如权利要求3所述的方法,其特征在于,所述预先训练的句向量表示模型通过以下过程获得:将电力专业知识问答训练数据集作为输入项输入预设的句向量表示模型,得到领域知识问答问句的句向量;将得到的领域知识问答问句的句向量存入预设的向量搜索引擎,得到句向量搜索引擎;其中,所述句向量搜索引擎包括问句向量、对应的问句答案。5.一种基于自然语言的素材推荐系统,用以实现如权利要求1
‑
4任一项所述的方法,其特征在于,包括:数据采集模块,用以采集目标用户输入的实时内容;第一推荐模块,用以根据预设的行业知...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。