一种针对在线协作讨论交互文本的自动分类方法技术

技术编号:35762331 阅读:17 留言:0更新日期:2022-12-01 13:57
本发明专利技术涉及一种针对在线协作讨论交互文本的自动分类方法,该方法包括:收集若干条在线协作讨论交互文本,对文本进行文本分词处理,将分词后的文本转换成为词向量形式;采用非对称Bi

【技术实现步骤摘要】
一种针对在线协作讨论交互文本的自动分类方法


[0001]本专利技术属于人工智能自然语言处理领域,具体涉及一种针对在线协作讨论交互文本的自动分类方法。

技术介绍

[0002]在线协作讨论场景中基于讨论的学习能够为学生提供重要的益处。通过技术支持的在线协作讨论使得学习者能够跨越时空的局限,更大程度上询问问题,彼此交换观点,进行意义协商,最终提升学习者的协作讨论能力、促进其认知技能和批判性思维的发展。学习者之间的交互是协作学习的基本活动内容,在协作学习过程中具有非常重要的作用。学习者在交互的过程中会产生大量文本语料,分析这些交互文本中的语义信息,对于识别在线讨论过程中的认知发展、情感交流、争论过程,协商模式等特征行为具有重要作用。
[0003]学习者在协作讨论中使用的话语隐含着一定的行为,表达某种意图或目的。在研究在线协作学习的交互话语时,识别学习者从交流中表达的意图、目的或效果对于理解学生参与的认知、元认知、情感和动机是至关重要的。因此,言语意图识别是在特定语境下分析和理解协作话语语义的必要语境。研究者通过分析在线协作学习环境下学习者的言语意图,可以来明确学习者的参与模式、交互策略等,并进一步预测学习效果、挖掘协作问题解决规律及协作知识演变规律等问题。
[0004]目前,通过学习者的交互文本识别言语意图,在本质上是一个文本分类问题。已有研究在对在线协作讨论中的交互文本进行分类时,大多采用人工编码的方法,该方法主要基于内容分析法,依据不同视角的编码表进行人工编码和分析。该方法分析视角相对灵活、范围相对广阔,但其主要存在人工编码费时费力的局限性。同时,在分析上具有滞后性,与当前实时分析的需求相矛盾。
[0005]除上述方法外,还可以采用机器学习的方法对交互文本进行分类,长短时记忆网络(Long short

Term memory,LSTM)深度学习方法是当前计算机领域用于自然语言处理的一种有效方法,它可以利用大规模语料,主动学习文本中潜在的语义和结构特征,有效地弥补传统机器学习存在的特征表达能力弱以及人工提取特征等方面的不足,可以获得较好的分类效果。与CNN和RNN等深度学习算法相比,该方法能够克服CNN分类算法无法学习句子的结构信息以及RNN存在梯度消失,和无法充分获取上下文语义联系的局限,非常适合于文本分类问题。但是,LSTM与其他深度学习算法相同,将输入序列中的每个单词同等对待,忽略了对文本中关键信息的提取,导致分类的精度和准确性不高。

技术实现思路

[0006]本专利技术的目的是提供一种针对在线协作讨论交互文本的自动分类方法,用于解决现有方法对交互文本的分类精度较低的问题。
[0007]基于上述目的,一种针对在线协作讨论交互文本的自动分类方法的技术方案如下:
[0008](1)收集若干条在线协作讨论交互文本,对文本进行文本分词处理,将原始文本分割成多个词汇的形式,得到分词后的文本;
[0009](2)将分词后的文本转换成为词向量形式;
[0010](3)非对称Bi

LSTM网络提取文本的上下文语义特征,结合上下文语义特征获取文本中的特征信息,即输出特征;
[0011]所述的非对称Bi

LSTM网络为:通过在传统Bi

LSTM网络的前后向两侧的每个LSTM神经元进行循环,从全局角度按前向权重值α、后向权重值1

α提取上下文语义特征,分别对前后两层网络的特征进行自适应权值的加权,然后以相加的形式合并前后两层网络的特征,得到输出特征;
[0012](4)利用全局注意力机制模型,从局部角度提取重点关注文本中和任务相关的关键特征并赋予权重,对双向编码进行加权学习,得到加权后的输出特征;
[0013](5)利用条件随机场模型对加权后的输出特征进行解码,获取文本序列的最优标签;
[0014](6)采用全连接层对带有最优标签的文本序列进行处理,全连接层的输出特征作为Softmax函数的输入,使用Softmax函数对在线协作讨论交互文本进行分类,输出每个在线协作讨论交互文本在不同类别上的分布概率,将在线讨论交互文本进行分类。
[0015]上述技术方案的有益效果是:
[0016]本专利技术的在线协作讨论交互文本的自动分类方法,采用非对称Bi

LSTM网络,通过自适应权值a和1

a对前向输出特征和后向输出特征进行处理,获得全局上下文信息的基础之上,有效增强了对在线协作讨论交互文本特征的获取能力,提高了在线协作讨论交互文本的多种类型的分类精度。
[0017]通过全局注意力机制模型对非对称Bi

LSTM网络输出特征进行处理,加大局部关键信息的语义特征表达,相比与现有技术更好地提升了分类精度。通过非对称Bi

LSTM网络、全局注意力机制模型、CRF模型的多模型集成,从全局和局部两个角度增强了对在线协作讨论交互文本特征的获取能力。
[0018]进一步的,步骤(3)中,所述非对称Bi

LSTM网络的输出特征的公式如下:
[0019]h=αh
f
+(1

α)h
b
[0020]其中,h表示输出特征,α、1

α分别表示非对称Bi

LSTM网络的前、后向权重值,h
f
为前向网络的输出特征,h
b
为后向网络的输出特征。
[0021]进一步的,步骤(1)中,所述对文本进行文本分词处理,将原始文本分割成多个词汇的形式,得到分词后的文本包括:
[0022]1)对输入文本进行分词将句子拆分成为多个词汇的形式;
[0023]2)基于前缀词典实现词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图,采用动态规划查找最大概率路径,找出基于词频的最大切分组合;
[0024]3)对于未登录词,采用基于汉字成词的隐马尔科夫模型,将原始句子作为观测序列,分词结果最为状态序列;通过语料训练出隐马尔科夫模型,然后利用Viterbi算法进行求解,得到最优的状态序列,最终根据状态序列,输出分词结果。
[0025]进一步的,步骤(2)中,采用Word2Vec方法,训练过程采用无监督方式,将分词后的文本转换成为词向量形式。
[0026]进一步的,步骤(4)中,全局注意力机制模型提取的权重计算如下:
[0027]u
i
=tanh(Wh
i
+b)
[0028][0029][0030]其中,u
i
为全连接层的输出,h
i
为输入隐向量,W为设置的权重,b为偏置量,a
i
为各个时刻的权重,u
w
为可训练上下文向量,u
T
为训练所得参数向量的转置,t为语句序列长度,v为利用tanh()激本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对在线协作讨论交互文本的自动分类方法,其特征在于,包括以下步骤:(1)收集若干条在线协作讨论交互文本,对文本进行文本分词处理,将原始文本分割成多个词汇的形式,得到分词后的文本;(2)将分词后的文本转换成为词向量形式;(3)采用非对称Bi

LSTM网络提取文本的上下文语义特征,结合上下文语义特征获取文本中的特征信息,即输出特征;所述的非对称Bi

LSTM网络为:通过在传统Bi

LSTM网络的前后向两侧的每个LSTM神经元进行循环,从全局角度按前向权重值α、后向权重值1

α提取上下文语义特征,分别对前后两层网络的特征进行自适应权值的加权,然后以相加的形式合并前后两层网络的特征,得到输出特征;(4)利用全局注意力机制模型,从局部角度提取重点关注文本中和任务相关的关键特征并赋予权重,对双向编码进行加权学习,得到加权后的输出特征;(5)利用条件随机场模型对加权后的输出特征进行解码,获取文本序列的最优标签;(6)采用全连接层对带有最优标签的文本序列进行处理,全连接层的输出特征作为Softmax函数的输入,使用Softmax函数对在线协作讨论交互文本进行分类,输出每个在线协作讨论交互文本在不同类别上的分布概率,将在线讨论交互文本进行分类。2.根据权利要求1所述的针对在线协作讨论交互文本的自动分类方法,其特征在于,步骤(3)中,所述非对称Bi

LSTM网络的输出特征的公式如下:h=αh
f
+(1

α)h
b
其中,h表示输出特征,α、1

α分别表示非对称Bi...

【专利技术属性】
技术研发人员:郑娅峰高张浩马宁李继蕊米慧超
申请(专利权)人:河南财经政法大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1