一种面向开放平台的提问质量判定方法和系统技术方案

技术编号:8959408 阅读:147 留言:0更新日期:2013-07-25 18:58
本发明专利技术实施方式提出了一种面向开放平台的提问质量判定方法和系统。方法包括:从用户提问中抽取出用户提问特征,并由用户提问特征确定该用户提问的基础质量指数;确定开放平台中回答站点的特征,并根据用户提问特征与回答站点特征的匹配度获得用户提问与各个回答站点的匹配指数;由该用户提问的基础质量指数以及该用户提问与各个回答站点的匹配指数确定该用户提问相对各个回答站点的质量指数。应用本发明专利技术实施方式之后,严格区分了问答站点,提问可以正确派发到合适站点,增强了提问质量判定准确率,提高了提问被回答的概率。

【技术实现步骤摘要】

本专利技术实施方式涉及互联网应用
,更具体地,涉及一种面对开放平台的提问质量判定方法和系统。
技术介绍
随着计算机技术和网络技术的飞速发展,互联网(Internet)在人们的日常生活、学习和工作中发挥的作用也越来越大。问答社区是一种由用户参与提问和回答,并按照这种问答关系将用户和数据组织起来的互联网产品。目前已经有各种基于开放平台的问答社区。开放平台是一种开放性知识分享平台,旨在搭建知识需求者(即提问用户和浏览用户)和知识提供者(即回答用户)之间的桥梁。合作伙伴可以根据网站自身情况,自由选择合作模式,为用户带来及时、便捷、准确的问答体验,同时通过平台将本地用户产生的有价值的问答内容进行传播,满足站外网友的浏览性需求,从而更好地发挥知识的价值,吸引新用户的到来。在开放问答平台中,有众多各具特色的回答站点,而不是单一的回答站点。因此,当用户发出提问后,需要对提问进行评估,从而确定将该提问派发到哪个具体的回答站点予以回答。现有的提问质量评价方案一般都是针对单一站点的。主要包括:根据编辑评测的提问语料进行规则抽取或者训练模型,从而预测新提问的质量。一般用于描述提问的特征有回答文本的长度、用户的信誉度等。然而,现有的这种针对单一站点的提问质量评价方案并不适用于开放问答平台,主要体现在以下几点:(I)在现有的提问质量评价方案中,并不区分具体的问答站点。实际上,相同提问在不同的问答站点应该有完全不同的质量。如提问“心情不好怎么办? ”,在知识类的问答站点上可能不会有人回答,而在社区类问答站点中,可能就会收到众多好友的回答,如果针对该提问这两种问答站点的评价是一样的,则无法体现这种区分。正是由于现有技术的提问质量评价方法并不区分问答站点,从而造成提问可能无法正确派发到合适站点,因此提问质量判定准确率不高,进而降低了提问被回答的概率。(2)针对开放平台的提问往往缺少单一问答站点中丰富的用户特征。在现有技术中针对单一问答站点提问质量评价方法中,提问用户的个人档信息等用户特征往往是提问质量评估的重要特征之一。也就是说,具有活跃度高、历史积分高等用户特征的用户,其新的提问一般也会被认为是好的提问。而在开放平台中,用户个人档等详细信息一般很难获取,因此无法利用这些用户特征进行相应的提问质量评估,而且看人给分也不符合开放平台的基本宗旨
技术实现思路
本专利技术实施方式提出一种面对开放平台的提问质量判定方法,以提高提问质量判定准确率。本专利技术实施方式提出一种面对开放平台的提问质量判定系统,以提高提问质量判定准确率。本专利技术实施方式的具体方案如下:一种面向开放平台的提问质量判定方法,该方法包括:从用户提问中抽取出用户提问特征,并由所述用户提问特征确定该用户提问的基础质量指数;确定所述开放平台中回答站点的特征,并根据用户提问特征与所述回答站点特征的匹配度获得用户提问与各个回答站点的匹配指数;由该用户提问的基础质量指数以及该用户提问与各个回答站点的匹配指数确定该用户提问相对各个回答站点的质量指数。一种面向开放平台的提问质量判定系统,该系统包括基础质量指数确定单元、匹配指数确定单元和质量指数确定单元,其中:所述基础质量指数确定单元,用于从用户提问中抽取出用户提问特征,并由所述用户提问特征确定该用户提问的基础质量指数;所述匹配指数确定单元,用于确定所述开放平台中回答站点的特征,并根据用户提问特征与所述回答站点特征的匹配度获得用户提问与各个回答站点的匹配指数;所述质量指数确定单元,用于由该用户提问的基础质量指数以及该用户提问与各个回答站点的匹配指数确定该用户提问相对各个回答站点的质量指数。从上述技术方案可以看出,在本专利技术实施方式中,首先从用户提问中抽取出用户提问特征,并由用户提问特征确定该用户提问的基础质量指数;然后确定开放平台中回答站点的特征,并根据用户提问特征与回答站点特征的匹配度获得用户提问与各个回答站点的匹配指数;再由该用户提问的基础质量指数以及该用户提问与各个回答站点的匹配指数确定该用户提问相对各个回答站点的质量指数。由此可见,应用本专利技术实施方式之后,可以根据回答站点的不同,给出每个提问和问答站点对的质量评分。正是由于区分问答站点,提问可以正确派发到合适站点,因此增强了提问质量判定准确率,进而显著提高了提问被回答的概率。附图说明图1为根据本专利技术实施方式的面向开放平台的提问质量判定方法流程图;图2为根据本专利技术实施方式的面向开放平台的提问质量判定系统的结构图。具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步的详细描述。在本专利技术实施方式中,针对开放平台的站点之间具有区别的特性,有针对性地提供了基于提问的提问质量评价方案,实现针对不同的站点,对提问和问答站点对给出质量评分。而且,在本专利技术实施方式中,针对开放平台中用户特征较少的特性,无需或者尽量少地采用特定用户特征(比如用户描述、提问用户个人档等信息),提供了基于提问的提问质量评价方案。图1为根据本专利技术实施方式的面向开放平台的提问质量判定方法流程图。如图1所示,该方法包括:步骤101:从用户提问中抽取出用户提问特征,并由用户提问特征确定该用户提问的基础质量指数。在这里,由用户提问特征确定该用户提问的基础质量指数具体可以包括:收集标注语料,将标注语料用特征进行表示以建立训练模型;将用户提问特征应用于该训练模型以确定该用户提问的基础质量指数。步骤102:确定开放平台中回答站点的特征,并根据用户提问特征与所述回答站点特征的匹配度获得用户提问与各个回答站点的匹配指数。在一个实施方式中,可以首先根据用户提问特征确定用户提问模型,根据回答站点特征确定回答站点模型;然后计算用户提问模型与回答站点模型之间的余弦距离,再将该余弦距离与该回答站点的活跃度相乘,作为用户提问与该回答站点的匹配指数。步骤103:由该用户提问的基础质量指数以及该用户提问与各个回答站点的匹配指数确定该用户提问相对各个回答站点的质量指数。在这里,优选可以将该用户提问的基础质量指数和该用户提问与各个回答站点的匹配指数进行线性加权,从而确定该用户提问相对各个回答站点的质量指数。优选地,该方法进一步包括,再将该用户提问分发到相对该用户提问的质量指数最闻的回答站点。下面结合具体实例对本专利技术实施方式进行更详细的说明。针对开放平台的特点,本专利技术实施方式可以将某个提问的提问质量定义为该提问被回答的概率。实际上,具体的提问质量评分由两部分组成,一是提问本身的基础质量评分(即该用户提问的基础质量指数),二是具体的提问问题和不同问答站点的匹配程度得分(即用户提问与各个回答站点的匹配指数),最终的得分可以是两项评分的线性加权(即该用户提问相对各个回答站点的质量指数)。针对提问的基础质量评分主要衡量问题本身的清晰度等基础特性。该项得分可以采用传统的自动分类方法,将提问分为“好”和“差”两个类别。自动分类方法一般可分为训练和预测2个过程。对于训练过程:首先需要收集对应分类体系的大规模标注语料;然后用特征方法来表示以建立模型,形成分类器。对于预测过程:对于新提问,用特征来表示,输入到分类器,最后输出类别。在语料的标注方面,需要根据预先设定的标准判定提问是否是高质量提问。一个高质量的问题,应该描述清楚、语气较为诚恳,而且不含不本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/201210015745.html" title="一种面向开放平台的提问质量判定方法和系统原文来自X技术">面向开放平台的提问质量判定方法和系统</a>

【技术保护点】
一种面向开放平台的提问质量判定方法,其特征在于,该方法包括:从用户提问中抽取出用户提问特征,并由所述用户提问特征确定该用户提问的基础质量指数;确定所述开放平台中回答站点的特征,并根据用户提问特征与所述回答站点特征的匹配度获得用户提问与各个回答站点的匹配指数;由该用户提问的基础质量指数以及该用户提问与各个回答站点的匹配指数确定该用户提问相对各个回答站点的质量指数。

【技术特征摘要】
1.一种面向开放平台的提问质量判定方法,其特征在于,该方法包括: 从用户提问中抽取出用户提问特征,并由所述用户提问特征确定该用户提问的基础质量指数; 确定所述开放平台中回答站点的特征,并根据用户提问特征与所述回答站点特征的匹配度获得用户提问与各个回答站点的匹配指数; 由该用户提问的基础质量指数以及该用户提问与各个回答站点的匹配指数确定该用户提问相对各个回答站点的质量指数。2.根据权利要求1所述的面向开放平台的提问质量判定方法,其特征在于,该方法进一步包括:将该用户提问分发到相对该用户提问的质量指数最高的回答站点。3.根据权利要求1所述的面向开放平台的提问质量判定方法,其特征在于,所述由所述用户提问特征确定该用户提问的基础质量指数包括: 收集标注语料,将所述标注语料用特征进行表示以建立训练模型; 将所述用户提问特征应用于该训练模型以确定该用户提问的基础质量指数。4.根据权利要求1所述的面向开放平台的提问质量判定方法,其特征在于,所述根据用户提问特征与所述回答站点特征的匹配度获得用户提问与各个回答站点的匹配指数包括: 根据用户提问特征确定用户提问模型,根据回答站点特征确定回答站点模型; 计算所述用户提问模型与回答 站点模型之间的余弦距离; 将该余弦距离与该回答站点的活跃度相乘,作为用户提问与该回答站点的匹配指数。5.根据权利要求1所述的面向开放平台的提问质量判定方法,其特征在于,所述根据用户提问特征确定用户提问模型包括:根据朴素贝叶斯或逻辑回归方式计算用户提问模型。6.根据权利要求1所述的面向开放平台的提问质量判定方法,其特征在于,所述由该用户提问的基础质量指数以及该用户提问与各个回答站点的匹配指数确定该用户提问相对各个回答站点的质量指数包括...

【专利技术属性】
技术研发人员:王亮杨月奎姚从磊刘春博焦峰郭奇庄子明王钰琨周建勋
申请(专利权)人:深圳市腾讯计算机系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1