【技术实现步骤摘要】
界定上下文窗口文本范围的方法、系统、介质及电子设备
[0001]本专利技术属于界定上下文窗口文本范围领域,具体涉及一种界定上下文窗口文本范围的方法、系统、介质及电子设备。
技术介绍
[0002]在服务领域场景中,需要对文本内容进行语义结构化分析来实现数据抽象。对于单一句子进行分词、匹配得到的结果并不能推断出真实的语义。大量语义是需要针对连续的对话内容进行上下文理解。
[0003]服务领域的对话文本,由于其场景不确定性,现有的文本处理程序很难找到上下文的准确边界。因此我们需要一种具备具通用性、易用性、易扩展性、可训练提高的窗口规则来描述上下文语义,从而对对话文本进行结构化处理。
[0004]人工成本高,无法有效的进行分工和协作是在现有技术中的比较大的缺点。在目前的技术中,对文本进行结构化处理的准确率及稳定性都得不到保证,无法形成方法论持续复用;因此,无法科学的训练模型来提高语音识别和语义理解的准确率,本专利技术是用来解决现有技术中的技术问题。
技术实现思路
[0005]本申请实施例提供了一种界定 ...
【技术保护点】
【技术特征摘要】
1.一种界定上下文窗口文本范围的方法,其特征在于,包括:确定中心句步骤:遍历对话文本中每一个语句,根据中心句判定规则确定第一中心句;确定命中句步骤:在所述第一中心句的预设文本查找范围中,基于命中句判定规则搜索并确定所述第一中心句对应的所述第一命中句;标签标注步骤:根据所述第一中心句及所述第一命中句的位置界定第一语义窗口的文本范围,进而对位于所述第一语义窗口范围内的文本整体添加第一语义标签。2.如权利要求1所述的方法,其特征在于,所述中心句判定规则及所述命中句规则包括:在所述对话文本中,任一对话角色的对话文本句中出现中心句标签提及词,且所述对话文本句中按照预设规则出现或不出现中心句标签关键词,则判定所述对话文本句为中心句;在所述对话文本中,任一对话角色的所述对话文本句中出现命中句标签提及词,且所述对话文本句中按照预设规则出现或不出现命中句标签关键词,则判定所述对话文本句为命中句。3.如权利要求1所述的方法,其特征在于,所述文本查找范围包括:查找方向和查找句数。4.如权利要求1所述的方法,其特征在于,当所述命中句判定规则搜索到所述命中句时,则窗口边界完成;若所述中心句和所述命中句为同一语句,则所述窗口为所述中心句。5.一种界定上下文窗口文本范围的系统,其特征在于,包括:确定中心句模块,所述确定中心句模块遍历对话文本中每一个语句,根据中心句判定规则确定第一中心句;确定命中句模块,所述确定命中句模块...
【专利技术属性】
技术研发人员:刘畅奕航,梁志婷,徐世超,
申请(专利权)人:北京明略昭辉科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。