用于实时谈话的渐进式并置制造技术

技术编号:33078992 阅读:13 留言:0更新日期:2022-04-15 10:24
在训练语料库链接模型和生成用于通道内和通道间活动的并置术语的方法中,一个或多个计算机处理器基于语言语料库的分析和一个或多个作者度量的分析来训练语料库链接模型。所述一个或多个计算机处理器基于经训练的语料库链接模型的一个或多个计算生成一个或多个并置术语。所述一个或多个计算机处理器为一个或多个所生成的并置术语中的每一个生成同现评级。所述一个或多个计算机处理器根据每个并置术语的所生成的同现评级来显示一个或多个所生成的并置术语。所生成的并置术语。所生成的并置术语。

【技术实现步骤摘要】
【国外来华专利技术】用于实时谈话的渐进式并置

技术介绍

[0001]本专利技术一般涉及通信领域,并且更具体地涉及实时通信应用。
[0002]现代协作通信应用和套件(在组织、团体和公司内)的不断增长和普及已显著影响对准确、可靠和搜索术语生成和适用性的需要。现代协作通信套件和应用具有多个包含的聊天室和通道,每个聊天室和通道通常专用于话题、主旨、纪律、主题或目的。虽然存在用于确定相关术语的解决方案(诸如概率搜索、适应性学习搜索和语料库语言学分析方法),但是由于该解决方案依赖于利用不完整句子、措辞和具有模糊术语的搜索的广义概率模型,导致模糊性和不相关的搜索结果,因此这些解决方案完全无效。此外,所述解决方案不针对协作通信应用内的多个通道或子通道中包含的特定用户语言趋向和倾向创建特定允许或假设。
[0003]协作软件或群件是被设计成帮助共同任务中涉及的多个个体实现一个或多个协作目标的应用软件。在交互级别方面,协作软件可以被分成:实时协作编辑(RTCE)平台,其允许多个用户参与单个文件的实况、同时和可逆的编辑;以及版本控制(例如,修订控制和源控制)平台,其允许单个用户对文件做出并行编辑,同时将每个保存的编辑保存为多个文件。协作软件是与计算机支持的协作工作(CSCW)显著重叠的广义概念。协作工作系统成为理解与CSCW的更宽泛概念相关联的行为和组织变量的有用的分析工具。
[0004]循环神经网络(RNN)是一类人工神经网络,其中节点之间的连接沿着序列形成有向图,从而允许网络展现时间序列的时间动态行为。不同于前馈神经网络,RNN可以使用内部状态(存储器)来处理允许RNN适用于诸如未分段连接的手写识别或语音识别之类的任务的输入序列。长短期记忆(LSTM)单元是循环神经网络(RNN)的替代层单元。由LSTM单元组成的RNN被称为LSTM网络。常见的LSTM单元由单元、输入门、输出门和遗忘门组成。该单元记忆任意时间间隔上的值,并且门调节进入和离开该单元的信息流。门控的循环单元(GRU)是循环神经网络中的门控机制。发现在多音音乐建模和语音信号建模上的GRU性能类似于LSTM。然而,GRU对较小的数据集展现更好的性能。
[0005]协作服务在现代组织中是普遍存在的,从而允许多个个体和群组具有实时进行多个并发讨论的能力。就协作服务和应用而言,实时聊天是大多数组织的主要通信方法。团队、组织和/或公司的成员使用协作聊天应用来识别、诊断和纠正难题和问题。例如,软件开发团队或支持人员利用协作聊天应用来识别故障代码的各部分并讨论潜在解决方案(例如,替代代码结构等)。在该示例中,不同的软件或支持群组可具有专用于特定问题或难题的不同通道或子通道。
[0006]当应用于实时协作应用内的专用通道或聊天室时,通用搜索术语生成和产生允许无效的错误应用的、不相关的和模糊的并置术语,阻止其他人找到与通道或聊天室有关的相关信息,以及阻止其他人在有意义的谈话中有效地通信和参与。传统地,术语生成系统在使得用户能够具有在协作聊天搜索的构造内被提供所链接的术语的最佳集合的能力方面是无效的。此外,无效的传统系统尝试使用单词、位置和语法到固定分层结构的放置来消歧所分析的通信的含义,并且利用该固定分层结构过滤搜索结果。通常,已知当在初始通信范
围之外(例如,不同的人群、话题或通道)泛化时,分层结构表现不佳。

技术实现思路

[0007]本专利技术的第一方面公开了计算机实现的方法,包括一个或多个计算机处理器基于语言语料库的分析和一个或多个作者度量的分析来训练语料库链接模型。所述一个或多个计算机处理器基于经训练的语料库链接模型的一个或多个计算生成一个或多个并置术语。所述一个或多个计算机处理器为所述一个或多个所生成的并置术语中的每一个生成同现评级。所述一个或多个计算机处理器根据所生成的每个并置术语的同现评级来显示一个或多个所生成的并置术语。本专利技术的实施例利用基于特定语料库的经训练的模型来生成通用并置术语,从而允许在协作聊天搜索的构造内呈现最佳链接术语集合。
[0008]本专利技术的第二方面公开了计算机实现的方法,包括一个或多个计算机处理器基于语言语料库的分析和一个或多个作者度量的分析来训练语料库链接模型。所述一个或多个计算机处理器基于经训练的语料库链接模型的一个或多个计算生成一个或多个并置术语。所述一个或多个计算机处理器为所述一个或多个所生成的并置术语中的每一个生成同现评级。所述一个或多个计算机处理器根据每个并置术语的同现评级利用一个或多个所生成的并置术语来标记一个或多个网页。本专利技术的实施例利用基于特定语料库的经训练的模型来生成通用并置术语,从而允许在内容管理系统的构造内标记链接术语的最佳集合。
[0009]本专利技术的第三方面公开了计算机程序产品,包括一个或多个计算机可读存储设备以及存储在所述一个或多个计算机可读存储设备上的程序指令。所存储的程序指令包括基于语言语料库的分析和一个或多个作者度量的分析来训练语料库链接模型的程序指令。所存储的程序指令包括基于经训练的语料库链接模型的一个或多个计算生成一个或多个并置术语的程序指令。所存储的程序指令包括为一个或多个所生成的并置术语中的每一个生成同现评级的程序指令。所存储的程序指令包括根据每个并置术语的所生成的同现评级来显示一个或多个所生成的并置术语的程序指令。本专利技术的实施例利用基于特定语料库的经训练的模型来生成通用并置术语,从而允许在协作聊天搜索的构造内呈现最佳链接术语集合。
[0010]本专利技术的第四方面公开了计算机系统,包括一个或多个计算机处理器和一个或多个计算机可读存储设备,其中,程序指令存储在一个或多个计算机可读存储设备上以供一个或多个计算机处理器中的至少一个执行。所存储的程序指令包括基于语言语料库的分析和一个或多个作者度量的分析来训练语料库链接模型的程序指令。所存储的程序指令包括基于经训练的语料库链接模型的一个或多个计算生成一个或多个并置术语的程序指令。所存储的程序指令包括为一个或多个所生成的并置术语中的每一个生成同现评级的程序指令。所存储的程序指令包括根据每个并置术语的所生成的同现评级来显示一个或多个所生成的并置术语的程序指令。本专利技术的实施例利用基于特定语料库的经训练的模型来生成通用并置术语,从而允许在协作聊天搜索的构造内呈现最佳链接术语集合。
附图说明
[0011]现在将参考附图仅通过示例的方式来描述本专利技术的实施例,在附图中:
[0012]图1是示出根据本专利技术的实施例的计算环境的功能框图;
[0013]图2是描绘根据本专利技术实施例的在图1的计算环境内的服务器计算机上的用于训练语料库链接模型和生成用于通道内和通道间活动的并置术语的程序的操作步骤的流程图;
[0014]图3A描绘了根据本专利技术的实施例的协作实时通信会话的示例300;
[0015]图3B描绘了根据本专利技术的实施例的协作实时通信会话的示例350;以及
[0016]图4是根据本专利技术的实施例的执行程序的服务器计算机的组件的框图。
具体实施方式
[0017]本专利技术的实施例认识到,协作环境可引入混淆和可读性问题。本专利技术的一些实施例认本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:由一个或多个计算机处理器基于语言语料库的分析和一个或多个作者度量的分析来训练语料库链接模型;由一个或多个计算机处理器基于所训练的语料库链接模型的一个或多个计算生成一个或多个并置术语;由一个或多个计算机处理器为一个或多个所生成的并置术语中的每一个生成同现评级;以及由一个或多个计算机处理器根据每个并置术语的所生成的同现评级,显示一个或多个所生成的并置术语。2.根据权利要求1所述的方法,进一步包括:由一个或多个计算机处理器监控一个或多个查询。3.根据权利要求2所述的方法,其中,查询是从以下各项组成的组中选择的:实时聊天谈话、用户话语、用户评论、用户句子、用户搜索查询或者用户搜索术语。4.根据权利要求2所述的方法,其中,监控一个或多个查询包括:由一个或多个计算机处理器检测用户输入查询;以及由一个或多个计算机处理器提取特定于包含在所检测的查询中的通信介质的话题信息。5.根据权利要求1所述的方法,其中,所述语言语料库包含历史并置术语、联合术语、相关联的话题、以及作者度量,其中,作者度量包括作者

话题映射和作者通道频率、作者帖子频率、作者平均帖子长度、作者平均帖子阅读水平、以及由所述作者频繁利用的术语。6.根据权利要求5所述的方法,其中,基于所述语言语料库训练语料库链接模型包括:由一个或多个计算机处理器从所述语言语料库中检索一个或多个历史通信;由一个或多个计算机处理器识别与所检索的一个或多个历史通信相关联的一个或多个查询;由一个或多个计算机处理器确定与所识别的一个或多个查询相关联的一个或多个并置术语;以及由一个或多个计算机处理器至少部分基于利用所识别的查询和所确定的一个或多个并置术语的受监督的训练来训练所述语料库链接模型。7.根据权利要求2所述的方法,其中,基于经训练的语料库链接模型的一个或多个计算生成一个或多个并置术语包括:由一个或多个计算机处理器确定一个或多个被监控的查询与一个或多个所生成的并置术语之间的句法或词汇关系;以及由一个或多个计算机处理器确定接近所述查询的位置。8.根据权利要求1所述的方法,进一步包括:由一个或多个计算机处理器基于正在进行的热门事项的相关或类似群组的通信来创建一个或多个预测性渐进式并置群组模型,其中所述预测性渐进式并置群组模型允许利用群组语言模式对频繁通信的群组进行剖析。9.根据权利要求8所述的方法,进一步包括:由一个或多个处理器利用一个或多个所创建的预测性渐进式群组模型来计算聊天应
用内的多个通道之间的时间段上的一个或多个并置趋势。10.根据权利要求1所述的方法,其中,利用概率模型为一个或多个所生成的并置术语生成所述同现评级。11.根据权利要求1所述的方法,其中,所述语料库链接模型包含一个或多个可堆叠循环神经网络。12.根据权利要求11所述的方法,其中,基于由经训练的语料库链接模型的一个或多个计算生成一个或多个并置术语包括:由一个或多个计算机处理器基于一个或多个可堆叠循环神经网络在应用级别生成一个或多个并置术语,其中所述一个或多个可堆叠循环神经网络中的每个循环神经网络是基于通信介质内包含的不同通道来训练的。13.根据权利要求1所述的方法,其中,所述同现评级包含表示查询与一个或多个并置和一个或多个联合术语相关联的可能性的一个或多个概率。14.根据权利要求13所述的方法,进一步包括:由一个或多个计算机处理器显示一个或多个所显示的并置术语的所生成的同现评级。15.根据权利要求1所述的方法,其中,根据每个并置术语的所生成的同现评级显示所述一个或多个所生成的并置术语包括:响应于超过同现评级阈值,由一个或多个计算机处理器将一个或多个所生成的并置术语显示在一个或多个被监控的查询附近。16.根据权利要求1所述的方法,其中,根据每个并置术语的所生成的同现评级显示所...

【专利技术属性】
技术研发人员:J
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1