用户文本分析制造技术

技术编号:17490852 阅读:42 留言:0更新日期:2018-03-17 13:49
文档中的自由形式文本可以使用自然语言处理来分析,以例如通过自动分析来自多个用户的文本,确定由用户在文本中指定的可动作项或者提供推荐。文本的单词或短语可以被映射到模型的类。可动作项可以使用与所选择的语法模式相匹配的所映射的单词或短语来确定。项可以例如基于跨多个文档的频率而被排名。在一些示例中,类可以包括建议指示符类或情态指示符类,并且所选择的语法模式可以包括这些类中的一个类。在一些示例中,映射可以使用词典。不在词典中的新的项可以基于新的项的属性和词典中的项的属性(例如,新的项的词性或邻近项)而自动与类相关联。

User text analysis

The free form text in the document can be analyzed by Natural Language Processing, for example, by automatically analyzing the text from multiple users, determining the action items specified by the user in the text, or providing recommendations. The word or phrase of a text can be mapped to the class of the model. An action item can be determined using a mapped word or phrase that matches the selected grammatical pattern. Items can be ranked, for example, based on frequency across multiple documents. In some examples, a class can include a suggested indicator class or a modality indicator class, and the selected syntax pattern can include a class in these classes. In some examples, a map can be used in a dictionary. New items that are not in dictionaries can be automatically associated with classes based on attributes of new items and properties of items in dictionary, for example, part of speech or adjacent items of new items.

【技术实现步骤摘要】
【国外来华专利技术】用户文本分析
技术介绍
用户经常通过各种手段提供关于服务、软件元素或硬件元素的反馈。在一些情况下,反馈涉及软件或硬件的错误或其他问题,而在其他的一些情况下,反馈涉及询问问题或提供用于改进软件或硬件的建议。在又一些情况下,反馈包括文本或其他信息,诸如关于软件或硬件如何工作的一般描述、用户喜欢或不喜欢的特征、与软件或硬件无关的信息等。例如,用户可以由使用操作系统提供的支持界面让管理员了解用户喜欢的功能以及用户使用操作系统的特定功能所遇到的问题。在很多情况下,反馈由软件或硬件的管理员手动查看和评估,以标识需要修复的软件或硬件的错误或其他议题(issue)。由于反馈是手动评估的,并且通常涵盖多种不同类型的信息(这些信息可能适用或不适用于管理员),因此管理员花费大量时间分析反馈。
技术实现思路
本公开描述了用于分析自由形式文本以例如确定用户建议的系统、方法和计算机可读介质。在一些情况下,可以接收包括关于来自用户的反馈的自由形式文本的文档。文档(例如,文档的文本)可以被映射到本体(ontology)或其他类型的结构化模型的一个或多个类。本体的映射信息可以用于标识文档中的建议。例如,文档中的单词或短语可以用本文档来自技高网...
用户文本分析

【技术保护点】
一种系统,包括:一个或多个处理器;存储器,通信地耦合到所述一个或多个处理器;接口,通信地耦合到所述一个或多个处理器并且被配置为接收多个文档,所述多个文档中的个体文档包括自由形式用户文本;映射模块,被存储在所述存储器中并且由所述一个或多个处理器可执行,以针对所述多个文档中的个体文档,将相应文档的所述自由形式用户文本的个体单词或短语映射到模型的个体类,所述模型包括建议指示符类或情态指示符类;分析模块,被存储在所述存储器中并且由所述一个或多个处理器可执行,以针对所述多个文档中的个体文档,至少部分地基于针对相应文档的所映射的单词或短语与选择的语法模式的比较,来确定关于软件或硬件的对应的用户建议;以及推...

【技术特征摘要】
【国外来华专利技术】2015.06.30 US 14/788,6951.一种系统,包括:一个或多个处理器;存储器,通信地耦合到所述一个或多个处理器;接口,通信地耦合到所述一个或多个处理器并且被配置为接收多个文档,所述多个文档中的个体文档包括自由形式用户文本;映射模块,被存储在所述存储器中并且由所述一个或多个处理器可执行,以针对所述多个文档中的个体文档,将相应文档的所述自由形式用户文本的个体单词或短语映射到模型的个体类,所述模型包括建议指示符类或情态指示符类;分析模块,被存储在所述存储器中并且由所述一个或多个处理器可执行,以针对所述多个文档中的个体文档,至少部分地基于针对相应文档的所映射的单词或短语与选择的语法模式的比较,来确定关于软件或硬件的对应的用户建议;以及推荐模块,被存储在所述存储器中并且由所述一个或多个处理器可执行,以分析所述用户建议中的个体用户建议以生成推荐;以及报告模块,被配置为呈现或传输所述推荐的指示。2.根据权利要求1所述的系统,其中所述报告模块被配置为:向与所述软件或硬件的管理相关联的用户的计算设备发送所述推荐。3.根据权利要求1或2所述的系统,其中所述分析模块还由所述一个或多个处理器可执行,以标识与所述选择的语法模式相对应的所述所映射的单词或短语的一个或多个集合,所述选择的语法模式与表示所述用户建议的主题相关联,并且所述选择的语法模式定义在所述模型的第二类之前的所述模型的第一类。4.根据权利要求1到3中的任一项所述的系统,其中所述推荐包括所述用户建议的排名,比第二用户建议在所述多个文档中出现更频繁的第一用户建议被排名为高于所述第二用户建议。5.根据权利要求1到4中的任一项所述的系统,还包括:知识库修改模块,被存储在所述存储器中并且由所述一个或多个处理器可执行以:确定所述自由形式用户文本中的第一单词或短语;确定所述第一单词或短语与被表示在知识库的词典中的不同的第二单词或短语具有阈值水平的相似度;以及用所述第一单词或短语代替所述知识库的所述词典中的所述第二单词或短语。6.根据权利要求1到4中的任一项所述的系统,还包括:知识库修改模块,被存储在所述存储器中并且由所述一个或多个处理器可执行,以针对被映射到所述模型的至少一个类的个体单词,向知识库的词典添加相应单词的一个或多个同义词或者相应单词的一个或多个词汇或形态形式中的至少一个,所述词典与所述模型相关联。7.根据权利要求1到4中的任一项所述的系统,还包括:分类模块,被存储在所述存储器中并且由所述一个或多个处理器可执行以自动地:确定不与所述知识库的词典相关联并且存在于所述多个文档中的一个或多个文档中的特定单词或短语,其中所述词典包括针对所述词典中的单词或短语中的一个或多个个体单词或短语的一个或多个相应属性;确定所述特定单词或短语的一个或多个相应属性;以及至少部分地基于所述特定单词或短语的所述一个或多个属性以及所述词典中的单词或短语中的一个或多个个体单词或短语的一个或多个属性中的一个或多个属性,在所述词典中将所述特定单词与所述模型的特定类相关联。8.一种方法,包括:由计算设备接收多个文档,所述多个文档中的个体文档包括自由形式文本;由所述计算设备针对所述多个文档中的个体文档,利用类集合中的个体类来标记相应文档的所述自由形式文本的个体单词或短语,所述类集合中的所述个体类中的至少一个类包括建议指示符类或情态指示符类;由所述计算设备针对所述多个文档中的个体文档,至少部分地基...

【专利技术属性】
技术研发人员:N·贾因R·杜贝H·P·M·道A·J·贝兹J·M·戴金斯
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1