The present invention provides a method for automatically generating answers to open-ended questions, including: access to content library, the contents of the items in the library include at least one attribute projects source, content and project title; establish rules and obtain answers that conforms to the rules of the project the answer from the content library to set up answer the answer rules library, including at least source, and the project content, project title in a corresponding screening condition; the input of the project and find word segmentation has all the objectives of the project answer database; comprehensive correlation calculation for the project with the goal of the project and find out the highest correlation the goal of the project to output. The invention can provide an autonomous reply to the open problem in the network application.
【技术实现步骤摘要】
一种自动生成开放式问题答案的方法
本专利技术涉及计算机应用
,特别涉及一种自动生成开放式问题答案的方法。
技术介绍
随着互联网的发展,问答社区逐渐成为深受网民欢迎的一种互联网产品,如国内的“知乎”、“头条问答”,美国的Quora,用户可以在社区中提出各种问题,其它用户看到自己熟悉领域的问题就可以发布自己的答案。这些答案会被所有浏览该问题的用户看到,点赞或点踩,受欢迎的答案会被系统排到靠前的位置。这类社区的一个挑战是,随着用户量的增长,越来越多的问题很少被其它用户关注到,导致无人回答,提问者的积极性大受打击。有些社区提供了答主自动邀请的功能,会根据用户的回答历史为问题自动邀请合适的用户来回答。可是这样会导致活跃的答主收到过多的邀请,没有办法在保证回答质量的情况下及时回答问题。因此,目前这个问题尚没有有效的解决方案。在自动回答方面,现有的技术主要聚焦在解决封闭性问题的回答生成上,比如“奥巴马是美国第几届总统?”。现有的一些系统一般会把利用NLP技术把问题转化为一个结构化的查询语言并通过查询预先构建的知识图谱返回答案。但是现有的自动回答生成技术无法解决开放式问题的回答自动生成问题,比如:“你对乐视的生态化反战略怎么看?”这类问题的提问者需要的不是知识性的答案,而是对问题的分析和观点的阐述,从而达到思想的交流。目前的网络问答社区无法对上述具有开放式特定的网络问题进行自动答复,也没有实现网络问题的自动生成答案的功能。上述功能的欠缺导致网络资源的大量浪费,无法整合网络资源,也不能实现网络自适应地处理问答机制,使得大量用户问题无法得到及时反馈与解决。
技术实现思路
本 ...
【技术保护点】
一种自动生成开放式问题答案的方法,其特征在于,包括:获取内容库,所述内容库中的项目至少包括项目来源、项目内容及项目标题中的一种属性;建立答案规则并从所述内容库中获取符合所述答案规则的项目以组建答案库,所述答案规则包括至少与所述项目来源、项目内容、项目标题中一种对应筛选条件;对输入的问题项目进行分词并寻找答案库中具备所有分词的目标项目;计算所述问题项目与目标项目的综合相关度并找出综合相关度最高的目标项目以输出。
【技术特征摘要】
1.一种自动生成开放式问题答案的方法,其特征在于,包括:获取内容库,所述内容库中的项目至少包括项目来源、项目内容及项目标题中的一种属性;建立答案规则并从所述内容库中获取符合所述答案规则的项目以组建答案库,所述答案规则包括至少与所述项目来源、项目内容、项目标题中一种对应筛选条件;对输入的问题项目进行分词并寻找答案库中具备所有分词的目标项目;计算所述问题项目与目标项目的综合相关度并找出综合相关度最高的目标项目以输出。2.如权利要求1所述的自动生成开放式问题答案的方法,其特征在于,所述获取内容库包括:根据内部提供或外部抓取的文档或视频建立内容库中的项目。3.如权利要求1所述的自动生成开放式问题答案的方法,其特征在于,所述建立答案规则包括:从内容库中筛选符合如下条件中的至少一项的项目:所述项目来源的权威度合法;所述项目内容的时效合法;所述项目标题中包含实体词语;所述项目标题是疑问句。4.如权利要求1所述的自动生成开放式问题答案的方法,其特征在于,所述建立答案规则包括:从所述内容库中人工筛选所述符合所述答案规则的项目及不符合所述答案规则的项目以分别作为第一正样本及第一负样本;将所述项目的属性、第一正样本及第一负样本输入答案规则建立模型、训练所述答案规则建立模型以建立所述答案规则。5.如权利要求4所述的自动生成开放式问题答案的方法,其特征在于,所述训练所述答案规则建立模型以建立所述答案规则包括:获取所述第一正样本/第一负样本相对于所述项目属性的第一真实数据/第二真实数据;使用所述答案规则建立模型预测所述第一正样本/第一负样本相对于所述项目属性的第一预测数据/第二预测数据;调整所述答案规则建立模型的模型参数,当所述第一预测数据与第一真实数据一致且第二预测数据与第二真实数据一致则输出所述模型参数及其答案规则建立模型。6.如权利要求4所述的自动生成开放式问题答案的方法,其特征在于,所述答案规则建立模型基于机器学习算法。7.如权利要求6所述的自动生成开放式问题答案的方法,其特征在于,所述机器学习算法为朴素贝叶斯算法、GBDT算法、SVM算法及RNN算法中的一种。8.如权利要求1所述的自动生成开放式问题答案的方法,其特征在于,所述对输入的问题项目进行分词并寻找答案库中具备所有分词的目...
【专利技术属性】
技术研发人员:曹欢欢,罗立新,
申请(专利权)人:北京字节跳动科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。