Including an unstructured data analysis system: unstructured data analysis algorithm, which resides on the server and can access through the browser, structured data analysis algorithm can be used for the non receiving unstructured data from one or more remote source to non structured data using one or more analysis the tool, and displays summary information to one or more users; in the presentation layer, layer and layer to explore the annotation of the one or more users to display the summary information. The unstructured data analysis algorithm can also be operable to receive external data from one or more remote sources. The presentation layer displays one or more of the following: unstructured data, summary of unstructured data, and summary information. The exploratory layer allows one or more users to modify the granularity of the summary information, thereby modifying the granularity of the presentation layer. One or more users can interact with unstructured data analysis systems at the annotation level.
【技术实现步骤摘要】
非结构化数据分析系统和方法相关申请的交叉引用本专利申请/专利要求共同未决的在2015年5月11日递交的标题为“UNSTRUCTUREDDATAANALYTICSSYSTEMSANDMETHODSINCLUDINGAVISUALIZATIONINTERFACE”的美国临时专利申请No.62/159,662以及在2015年5月11日递交的标题为“UNSTRUCTUREDDATAANALYTICSSYSTEMSANDMETHODSINCLUDINGNATURALLANGUAGEPROCESSINGANDSTATISTICSFUNCTIONS”的美国临时专利申请No.62/159,683的优先权,通过引用将这二者的全部内容并入本文。
本专利技术一般涉及用于分析大文本语料和非结构化数据的方法和系统。更具体地,本专利技术涉及使用可视化分析和话题建模、可视化界面、以及自然语言处理及统计功能分析大文本语料和非结构化数据的方法和系统。
技术介绍
对文本信息和非结构化数据的大量且日益增长的集合的管理是一个挑战性的问题。知识丰富的文本信息的数据存储库已经变得普及,导致要整理、发掘和分析海量数据。随着文档数量的增加,学习文本语料的含义变得认知成本高昂且耗时。对于自然语言处理(NLP)领域中的研究者,对大文本语料的自动总结这一挑战已经成为主要关注点。为了总结文本语料,研究者已经开发了诸如用于提取并表示词语的上下文使用环境下的含义的隐含语义分析(LSA)之类的技术。LSA产生可以用于文档分类和聚类的概念空间。最近,已经出现了作为用于找到非结构化文本集合中的语义上有意义的话题的有利新技 ...
【技术保护点】
一种非结构化数据分析系统,包括:驻留在服务器上并能够经由浏览器访问的非结构化数据分析算法,所述非结构化数据分析算法能够操作用于:从一个或更多个远程源接收非结构化数据,向非结构化数据应用一个或更多个分析工具,以及向一个或更多个用户显示总结信息;其中在呈现层、探索层和注释层中的一个或更多个中向一个或更多个用户显示所述总结信息。
【技术特征摘要】
2016.05.11 US 15/151,5721.一种非结构化数据分析系统,包括:驻留在服务器上并能够经由浏览器访问的非结构化数据分析算法,所述非结构化数据分析算法能够操作用于:从一个或更多个远程源接收非结构化数据,向非结构化数据应用一个或更多个分析工具,以及向一个或更多个用户显示总结信息;其中在呈现层、探索层和注释层中的一个或更多个中向一个或更多个用户显示所述总结信息。2.根据权利要求1所述的系统,其中所述非结构化数据包括下述中的一个或更多个:客户体验数据、电信数据、电子邮件数据、社交媒体数据、以及交易数据。3.根据权利要求1所述的系统,其中所述非结构化数据分析算法还能够操作用于:从一个或更多个远程源接收外部数据。4.根据权利要求3所述的系统,其中所述外部数据包括下述中的一个或更多个:互联网数据、政府数据、以及商业数据。5.根据权利要求1所述的系统,其中向非结构化数据应用的一个或更多个分析工具包括下述中的一个或更多个:统计算法、机器学习、自然语言处理、以及文本挖掘。6.根据权利要求1所述的系统,其中所述呈现层显示下述中的一个或更多个:非结构化数据、非结构化数据的总结、以及所述总结信息。7.根据权利要求1所述的系统,其中所述探索层允许一个或更多个用户修改所述总结信息的粒度,由此修改呈现层的粒度。8.根据权利要求1所述的系统,其中一个或更多个用户能够经由注释层同时与所述非结构化数据分析系统进行交互。9.根据权利要求1所述的系统,其中还在组合层中向一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。