根据基于社区的问题回答档案库的自动常问问题汇编制造技术

技术编号：8219332 阅读：180 留言：0更新日期：2013-01-18 01:59

使用基于社区的问题回答（CQA）数据来生成常问问题（FAQ）数据。题目层次生成模块接收多个数据源并且生成数据源的题目层次，其中数据源具有一个或多个主题，而主题具有一个或多个题目。特征分类器基于题目层次将多个CQA数据分类成一个或多个题目，其中CQA数据包含多个问题回答对。选择模块基于分类从CQA数据中选择多个问题回答对，测量所选择的问题回答对的质量，并且使用所选择的CQA数据的问题回答对来生成FAQ数据。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】根据基于社区的问题回答档案库的自动常问问题汇编相关申请的交叉引用本申请要求于2010年4月6日提交的、名称为“Automatic Frequently AskedQuestion Compilation from Community-based Question Answering Achieve，，的美国临时申请第61/321，133号的权益，其全部内容通过引用结合于此。
技术介绍
本专利技术一般地涉及来自社区生成的问题回答对的数据或者其它非结构化的存档数据的常问问题(FAQ)列表的生成。基于社区的问题回答(CQA)数据和常问问题(FAQ)数据的相似之处在于两者均使用成对的问题与回答来提供信息。然而，在提供CQA数据的服务累积用户生成的问题回答对的同时，FAQ数据通常以显著的成本由专家关于一个或多个主题手工进行汇编。因此，FAQ数据通常是简练的、全面的、良好划分的，并且以正式的合乎文法的语言书写，然而，CQA数据在语言和内容两方面具有参差不齐的质量，并且由于大量的提供数据的参与者而通常具有松散的结构并且被粗糙地划分。通过要求FAQ数据领域的一个或多个专家监视FAQ主题的发展和FAQ主题用户行为的变化，FAQ数据的维护引入了额外的复杂性。因此，常规的FAQ数据通常是欠维护的并且很快变得过时。虽然CQA数据更能被维护，但是甚至在最特定层级的CQA数据中都会有的大量的问题回答对导致了信息超载。另外，用于生成CQA数据的内容的质量从极好到不切题急剧变化。进一步，CQA数据的常规种类结构通常没有特定得足以包括便于用户访问的特定关系。
技术实现思路
本专利技术的实施例涉及用...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：蔡达成，明朝燕，
申请(专利权)人：新加坡国立大学，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人