【技术实现步骤摘要】
基于电力专业术语的语义分析方法
本专利技术涉及一种语义分析方法,具体涉及一种基于电力专业术语的语义分析方法,属于电力计算机信息通信
技术介绍
随着移动互联网的高速发展,智能手机移动应用在各行各业爆发式增长,各种类型的用户交互方式层出不穷。但考虑到受使用人群年龄、文化水平、使用习惯、使用环境等各方面因素的限制,交互的准确性及便捷性还有很大的提升空间。尤其是在电力专业,作业人员在相对恶劣的操作环境中如何更方便、快速、高效的使用业务应用,成为行业面临的一项重大课题。近年来,随着云计算、人工智能、网络通信技术迅猛发展,自然语言处理技术发展迅速,促使机器能够在一定程度上“理解”语音。基于云服务的语音智能识别、语义分析在理论研究和技术实践层面均取得关键性突破,业界涌现出一批以科大讯飞为代表的语音识别、语义分析解决方案。语义分析技术,是让机器通过识别和理解过程使之听懂人类语言的技术。语义分析技术是信息技术中人机交互的关键技术,目前已经在呼叫中心、电信增值业务、企业信息化系统中有了广泛的应用。但是以科大讯飞为代表的 ...
【技术保护点】
1.一种基于电力专业术语的语义分析方法,其特征在于:包括文本预处理、中文分词、中文标注、专业术语语音库、机器学习、语义模型、业务流程控制以及服务器端内网私有云服务。/n
【技术特征摘要】
1.一种基于电力专业术语的语义分析方法,其特征在于:包括文本预处理、中文分词、中文标注、专业术语语音库、机器学习、语义模型、业务流程控制以及服务器端内网私有云服务。
2.根据权利要求1所述基于电力专业术语的语义分析方法,其特征在于:文本预处理具体步骤包括对收集的地方方言、专业术语及操作指令在书写形式上进行统一规范,修正错别字及非常规词,对语句段落进行重新划分,通过以上描述的文字预处理方法为下一步语义分析提供准确的数据源。
3.根据权利要求1所述基于电力专业术语的语义分析方法,其特征在于:中文分词具体步骤包括结合电力专业文本自身特点及其应用时所依赖的物理环境设计电力专业术语的分词规则,规则遵循以分词时以具有真实物理含义的词为语义单元的原则,同时采用基于词典的分词方法和统计模型的分词方法,基于词典的分词方法把文本中的文字与词典中的词汇进行匹配,将匹配到的文字单元作为一个分词结果,基于统计模型的分词方法按照位置将每个字用标签进行标注,通过标注的标签对中文文本进行分词。
4.根据权利要求1所述基于电力专业术语的语义分析方法,其特征在于:中文标注具体步骤包括中文文本在文字预处理中通常以序列的形式存在,在对文本序列进行词性等的标注时选择HMM、CRF等能够胜任序列标注的统计概率模型,标注过程中以中文语句为输入,输出类包含汉字、标点、标注符等字符的序列标注结果。
5.根据权利要求1所述基于电力专业术语的语义分析方法,其特征在于:专业术语语音库具体步骤包括后台服务器端提供配置专业术语与移动终端操作流程之间功能函数映射关系,配置完成后移动终端通...
【专利技术属性】
技术研发人员:魏洪昌,陈宏达,郝武俊,孙志宇,
申请(专利权)人:国网山东省电力公司临沂供电公司,国家电网有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。