【技术实现步骤摘要】
【国外来华专利技术】用于学习词和多词表达的特性的分类引擎
技术介绍
本公开涉及对词和表达进行分类,并且更具体地涉及用于训练分类器以基于包括词或表达的句子来确定词或表达与类别之间的相似性的度量的技术。词的心理语言特性对认知过程的影响在近几十年来已经成为科学查询的主要主题。最多研究的心理语言学类别中是抽象度、具体性、熟悉性、影像性、以及平均采集年龄。例如,抽象度评估由表达式表示的概念是指人类感觉不能直接感知的实体的程度。确定词和表达的心理语言学类别在人工智能(AI)上下文中通常是有用的,诸如动态地响应于由用户(例如,通过聊天)输入的文本。此外,词和表达的心理语言类别在确定要提供给应用程序的用户的内容的类型时也是有用的。例如,“趣闻(anecdotal)”段落(例如,包含真实事件或人的短账户)通常包括可以被分类为具体而不是抽象的更多词或短语。照此,理解词是抽象的还是具体的可以在特定环境下为用户自动选择内容(诸如趣闻的内容)中是有用的。由于其固有成本,对心理语言特性或类别的手动确定通常导致创建有限大小的数据集,并且因此具有有限的实用性。照此,本领域中需要确定词和短语的心理语言特性或类别的改进方法。
技术实现思路
根据本专利技术的一个实施例,一种方法包括:接收包括与类别相关联的第一词的第一多个句子和包括不与该类别相关联的第二词的第二多个句子。在一些实施例中,该方法还包括使用基于第一多个句子的类别的积极(positive)训练数据和基于第二多个句子的类别的消极(negative)训练数据来训练分类器。在一些实施例中,该方法还包括通过使用包括第 ...
【技术保护点】
1.一种方法,包括:/n接收包括与类别相关联的第一词的第一多个句子和包括不与所述类别相关联的第二词的第二多个句子;/n使用基于所述第一多个句子的所述类别的积极训练数据和基于所述第二多个句子的所述类别的消极训练数据来训练分类器;/n通过使用包括第三词的句子作为对所述分类器的输入来确定所述第三词与所述类别之间的相关性的度量;以及/n使用所述相关性度量来执行从以下列表中选择的动作:/n选择要提供给用户的内容;/n确定自动聊天响应;或/n过滤一组内容。/n
【技术特征摘要】
【国外来华专利技术】20181030 US 16/174,8191.一种方法,包括:
接收包括与类别相关联的第一词的第一多个句子和包括不与所述类别相关联的第二词的第二多个句子;
使用基于所述第一多个句子的所述类别的积极训练数据和基于所述第二多个句子的所述类别的消极训练数据来训练分类器;
通过使用包括第三词的句子作为对所述分类器的输入来确定所述第三词与所述类别之间的相关性的度量;以及
使用所述相关性度量来执行从以下列表中选择的动作:
选择要提供给用户的内容;
确定自动聊天响应;或
过滤一组内容。
2.如权利要求1所述的方法,其中,训练所述分类器包括识别所述第一多个句子中的所述第一词的上下文以及所述第二多个句子中的所述第二词的上下文。
3.如权利要求2的方法,其中,识别所述第一多个句子中的所述第一词的所述上下文和所述第二多个句子中的所述第二词的所述上下文包括:识别所述第一多个句子中的所述第一词附近的词,以及识别所述第二多个句子中的所述第二词附近的词。
4.如权利要求1所述的方法,其中,所述积极训练数据包括以下各项中的一项或多项:词、短语、前缀、或后缀。
5.如权利要求1所述的方法,其中,所述分类器包括以下各项之一:最近邻算法、或天然贝叶斯算法。
6.如权利要求1的方法,其中,选择要提供给所述用户的所述内容包括基于所述相关性度量来识别趣闻内容。
7.如权利要求1的方法,其中,确定所述自动聊天响应的步骤包括:
基于所述相关性的度量来确定问题的难度;以及
基于所述问题的所述难度来选择是否将所述问题升级到现场支持代理。
8.如权利要求1所述的方法,其中,所述类别包括被定义为抽象的词。
9.如权利要求1所述的方法,其中,训练所述分类器包括从所述第一多个句子和所述第二多个句子中滤除非字母词和特殊字符。
10.如权利要求1所述的方法,其中,训练所述分类器包括对所述第一多个句子中的所述第一词掩蔽并且对所述第二多个句子中的所述第二词掩蔽。
11.一种系统,包括:一个或多个处理器;以及存储指令的非暂态计算机可读介质,所述指令在由所述一个或多个处理器执行时使所述一个或多个处理器执行方法,所述方法包括:
接收包括与类别相关联的第一词的第一多个句子和包括不与所述类别相关联的第二词的第二多个句子;
使用基于所述第一多个句子的所述类别的积极训练数据和基于所述第二多个句子的所述类别的消极训练数据来训练分类器;
通过使用包括第三词的句子作为对所述分类器的输入来确...
【专利技术属性】
技术研发人员:E拉比诺维奇,B斯纳杰德,A斯佩克特,I什纳伊德曼,R阿哈罗诺夫,D科诺普尼基,N斯洛尼姆,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。