【技术实现步骤摘要】
本专利技术涉及自然语言处理领域,特别是涉及。
技术介绍
21世纪以来,随着互联网的飞速发展,人们越来越多地在网络上表达自己的观点与情感,这类文本往往以商品评论、论坛评论、博客的形式存在,并且大部分文本能很好的反映人们的看法和意见。而通过人工的方法来分析这些海量文本中的情感信息需要耗费大量的时间,人力和物力,在这种背景下,情感分析技术应运而生,并在自然语言处理研究领域得到了广大研究者的关注,具有很大的应用价值。在现有的大多数的情感分析中,主要关注于评论语料。而摘要也应用到各个领域,如:新闻文章、科技文章和语音领域,语音领域包括广播新闻、会议、对话、和演讲。然而,对情感摘要的研究还比较少。情感摘要旨在于对有情感的文本进行浓缩提炼生成带有情感的摘要。而现有的情感摘要主要集中在对评论语料的研究。随着对话记录的大量增加,作用于对话的情感摘要变得十分的迫切。对话文本的情感摘要具有其自己的特征:1.需要关注对话的主题相关性和情感相关性;2.对话的结构对摘要的选取起到重要的作用;3.对话文本中存在许多毫无信息量的句子,如:“Uh”,“Yeah”,“Well”等。虽然这些 ...
【技术保护点】
一种对话文本情感摘要的生成方法,该对话文本为英文对话文本,其特征在于,包括:1)将英文对话文本进行分句处理;2)将步骤1)中获得的句子进行分词处理,获取单词特征;3)抽取步骤2)中具有情感词的句子,标记成情感特征,并根据单词特征和情感特征构建句子的特征向量;4)采用余弦算法计算向量间的相似度;5)根据所得相似度计算句子间的转移概率;6)采用PageRank算法获取句子的权值;7)根据所述句子的权值进行排序,抽取句子,获得摘要。
【技术特征摘要】
1.一种对话文本情感摘要的生成方法,该对话文本为英文对话文本,其特征在于,包括: 1)将英文对话文本进行分句处理; 2)将步骤1)中获得的句子进行分词处理,获取单词特征; 3)抽取步骤2)中具有情感词的句子,标记成情感特征,并根据单词特征和情感特征构建句子的特征向量; 4)采用余弦算法计算向量间的相似度; 5)根据所得相似度计算句子间的转移概率; 6)采用PageRank算法获取句子的权值; 7)根据所述句子的权值进行排序,抽取句子,获得摘要。2.根据权利要求1所述的生成方法,其特征在于:所述步骤I)中是按所述英文对话文本中的结束标志进行分句,所述结束标志为句话、感叹号、问号或省略号中的一种。3.根据权利要求1所述的生成方法,其特征在于:所述步骤2)中分词处理是据英文句子的空格,将一个句子分 成各个单词。4.根据权利要求1所述的生成方法,其特征在于...
【专利技术属性】
技术研发人员:李寿山,林莉媛,王中卿,周国栋,
申请(专利权)人:苏州大学张家港工业技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。