一种针对在线协作讨论交互文本的自动分类方法技术

技术编号：35762331 阅读：17 留言：0更新日期：2022-12-01 13:57

本发明专利技术涉及一种针对在线协作讨论交互文本的自动分类方法，该方法包括：收集若干条在线协作讨论交互文本，对文本进行文本分词处理，将分词后的文本转换成为词向量形式；采用非对称Bi

全部详细技术资料下载

【技术实现步骤摘要】
一种针对在线协作讨论交互文本的自动分类方法

[0001]本专利技术属于人工智能自然语言处理领域，具体涉及一种针对在线协作讨论交互文本的自动分类方法。

技术介绍

[0002]在线协作讨论场景中基于讨论的学习能够为学生提供重要的益处。通过技术支持的在线协作讨论使得学习者能够跨越时空的局限，更大程度上询问问题，彼此交换观点，进行意义协商，最终提升学习者的协作讨论能力、促进其认知技能和批判性思维的发展。学习者之间的交互是协作学习的基本活动内容，在协作学习过程中具有非常重要的作用。学习者在交互的过程中会产生大量文本语料，分析这些交互文本中的语义信息，对于识别在线讨论过程中的认知发展、情感交流、争论过程，协商模式等特征行为具有重要作用。
[0003]学习者在协作讨论中使用的话语隐含着一定的行为，表达某种意图或目的。在研究在线协作学习的交互话语时，识别学习者从交流中表达的意图、目的或效果对于理解学生参与的认知、元认知、情感和动机是至关重要的。因此，言语意图识别是在特定语境下分析和理解协作话语语义的必要语境。研究者通过分析在线协作学习环境下学习者的言语意图，可以来明确学习者的参与模式、交互策略等，并进一步预测学习效果、挖掘协作问题解决规律及协作知识演变规律等问题。
[0004]目前，通过学习者的交互文本识别言语意图，在本质上是一个文本分类问题。已有研究在对在线协作讨论中的交互文本进行分类时，大多采用人工编码的方法，该方法主要基于内容分析法，依据不同视角的编码表进行人工编码和分析。该方法分析视角相对灵活、范围相对广阔，...

【技术保护点】

【技术特征摘要】
1.一种针对在线协作讨论交互文本的自动分类方法，其特征在于，包括以下步骤：(1)收集若干条在线协作讨论交互文本，对文本进行文本分词处理，将原始文本分割成多个词汇的形式，得到分词后的文本；(2)将分词后的文本转换成为词向量形式；(3)采用非对称Bi
‑
LSTM网络提取文本的上下文语义特征，结合上下文语义特征获取文本中的特征信息，即输出特征；所述的非对称Bi
‑
LSTM网络为：通过在传统Bi
‑
LSTM网络的前后向两侧的每个LSTM神经元进行循环，从全局角度按前向权重值α、后向权重值1
‑
α提取上下文语义特征，分别对前后两层网络的特征进行自适应权值的加权，然后以相加的形式合并前后两层网络的特征，得到输出特征；(4)利用全局注意力机制模型，从局部角度提取重点关注文本中和任务相关的关键特征并赋予权重，对双向编码进行加权学习，得到加权后的输出特征；(5)利用条件随机场模型对加权后的输出特征进行解码，获取文本序列的最优标签；(6)采用全连接层对带有最优标签的文本序列进行处理，全连接层的输出特征作为Softmax函数的输入，使用Softmax函数对在线协作讨论交互文本进行分类，输出每个在线协作讨论交互文本在不同类别上的分布概率，将在线讨论交互文本进行分类。2.根据权利要求1所述的针对在线协作讨论交互文本的自动分类方法，其特征在于，步骤(3)中，所述非对称Bi
‑
LSTM网络的输出特征的公式如下：h＝αh
f
+(1
‑
α)h
b
其中，h表示输出特征，α、1
‑
α分别表示非对称Bi...

【专利技术属性】
技术研发人员：郑娅峰，高张浩，马宁，李继蕊，米慧超，
申请(专利权)人：河南财经政法大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人