一种基于语音识别的建筑运维工单自动填写系统及方法技术方案

技术编号:32130604 阅读:20 留言:0更新日期:2022-01-29 19:29
本发明专利技术公开了一种基于语音识别的建筑运维工单自动填写方法及系统,所述方法包括:预先构建各类工单中每个表单项与目标关键词类型之间的映射关系,获取语音数据,并将所述语音数据转换为文本数据;对所述文本数据进行关键词识别,并确定关键词类型;根据相应工单的表单映射模型,将识别的关键词与表单项进行匹配,并进行数据校验,若匹配成功且校验通过,则进行自动填写。本发明专利技术首先将用户的报修语音描述转化成大段文本,通过构建各类工单中每个表单项与目标关键词类型之间的映射关系,结合语义分析,能够从整段故障描述中提取出上述关键字段信息,并自动进行结构化表单填写,形成结构化工单数据,利于后续数据归集整理和分析。利于后续数据归集整理和分析。利于后续数据归集整理和分析。

【技术实现步骤摘要】
一种基于语音识别的建筑运维工单自动填写系统及方法


[0001]本专利技术属于人工智能
,尤其涉及一种基于语音识别的建筑运维工单自动填写方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。
[0003]在建筑运维领域,普通用户在发起工单时,需要通过电脑或手机等终端,在工单系统中手动填写至少以下字段:故障设备名称、位置及故障状态描述,效率较低。为增强用户体验,提高工单填报效率,目前已有工单系统提供了语音填报功能,但是,这些系统大多不含听写转义功能,这种填报方式智能化程度低,往往需要专门的岗位,人工将用户报修的语音文本转换为结构化表单数据,增加了人力成本和调度时间成本。虽然极少部分产品具有语音报修并自动转化成文本方式来描述报修故障,并上传语音附件,但对于维修管理人员来说,仅作为报修故障信息复核所用。
[0004]对于医院这样的特殊行业,医护人员在报修过程中往往没有时间或在有菌环境中详细填写复杂的工单表单中的不同字段,因此对工单填报的效率和准确性具有很高的要求。尽管目前已经提出了基于语音识别的工单自动生成方法,但是,现有的此类方法多是提出了一种解决思路,例如通过命名实体识别方法进行工单内容的识别,但没有结合具体应用场景,如医院建筑运维这一复杂领域的工单内容识别,医院建筑运维领域存在运维对象数量多、种类多、描述方式多样等特点;工单内容识别的精确度也有待提高。

技术实现思路

[0005]为克服上述现有技术的不足,本专利技术提供了一种基于语音识别的建筑运维工单自动填写方法及系统。将用户的报修语音描述转化成大段文本,通过构建各类工单中每个表单项与目标关键词类型之间的映射关系,结合语义分析,能够从整段故障描述中提取出上述关键字段信息,并自动进行结构化表单填写,形成结构化工单数据,利于后续数据归集整理和分析。
[0006]为实现上述目的,本专利技术的一个或多个实施例提供了如下技术方案:
[0007]一种基于语音识别的建筑运维工单自动填写方法,预先构建各类工单中每个表单项与目标关键词类型之间的映射关系,所述方法包括以下步骤:
[0008]获取语音数据,并将所述语音数据转换为文本数据;
[0009]对所述文本数据进行关键词识别,并确定关键词类型;
[0010]根据相应工单的表单映射模型,将识别的关键词与表单项进行匹配,并进行数据校验,若匹配成功且校验通过,则进行自动填写。
[0011]进一步地,对所述文本数据进行关键词识别,并确定关键词类型包括:
[0012]对所述文本数据进行分词,得到分词集合;
[0013]基于预构建的建筑运维专业词库进行关键词识别,得到待维修对象和报修描述关键词;
[0014]对剩余分词进行语义分析,确定属于指定目标类型的关键词,所述指定目标类型即表单项中所需类型。
[0015]进一步地,若存在不能识别的分词,通过语义分析或人工确定其所属类型,并扩充至建筑运维专业词库。
[0016]进一步地,若存在表单项没有匹配到关键词,则根据所述表单项的字符类型和所需关键词类型,对所述文本数据进行二次匹配。
[0017]进一步地,所述建筑运维专业词库生成方法包括:
[0018]基于预构建的建筑运维基础词库,对语料进行分词处理,得到分词集合;
[0019]对分词进行语义及词性分析,判断是否属于建筑运维领域词汇,将新识别的词汇加入建筑运维基础词库,生成建筑运维专业词库。
[0020]一个或多个实施例提供了一种基于语音识别的建筑运维工单自动填写系统,包括:
[0021]表单映射模型管理模块,用于管理各类工单中每个表单项与目标关键词类型之间的映射关系;
[0022]语音识别模块,用于获取语音数据,并将所述语音数据转换为文本数据;
[0023]关键词识别模块,用于对所述文本数据进行关键词识别,并确定关键词类型;根据相应工单的表单映射模型,将识别的关键词与表单项进行匹配,并进行数据校验,若匹配成功且校验通过,则进行自动填写。
[0024]进一步地,还包括:工单表单项管理模块,用于管理各类工单的表单项结构。
[0025]进一步地,还包括:
[0026]语料采集模块,用于获取历史工单填报信息;
[0027]词库构建模块,用于根据语料进行分词和分类处理,生成建筑运维专业词库。
[0028]进一步地,还包括:数据库管理模块,用于管理分词表、日志记录表、分词分类表和消息存储表。
[0029]进一步地,还包括:词库扩充模块,用于获取关键词识别模块不能识别的分词,通过语义分析或人工确定其所属类型,并扩充至建筑运维专业词库。
[0030]以上一个或多个技术方案存在以下有益效果:
[0031]通过识别关键词类别,以及构建各类工单中每个表单项与目标关键词类型之间的映射关系,能够实现工单的快速填写;
[0032]在进行关键词识别和类型识别过程中,首先通过对文本数据语义分析匹配目标类型,然后根据目标类型再对文本数据二次匹配,通过双向匹配,保证了关键词识别的准确性,且不易发生遗漏,节省了后续人工的工作量;
[0033]通过本申请的工单内容识别方法,能够收集大量设备故障信息,为后续对故障设备类型、设备位置、设备故障、维修手段等数据进行大数据分析,提供了数据基础。
附图说明
[0034]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示
意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0035]图1为本专利技术一个或多个实施例中基于语音识别的建筑运维工单自动填写方法流程图;
[0036]图2为本专利技术一个或多个实施例中基于语音识别的建筑运维工单自动填写系统框架图。
具体实施方式
[0037]应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0038]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0039]在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0040]实施例一
[0041]本实施例公开了一种基于语音识别的建筑运维工单自动填写系统,包括:
[0042]语料采集模块,用于获取历史工单填报信息,具体地,在每次接收到填报的工单时,均将填报信息存储至队列。
[0043]词库构建模块,用于根据语料进行分词和分类处理,生成建筑运维专业词库。具体地,所述建筑运维分词提取包括以下步骤:
...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的建筑运维工单自动填写方法,其特征在于,预先构建各类工单中每个表单项与目标关键词类型之间的映射关系,所述方法包括以下步骤:获取语音数据,并将所述语音数据转换为文本数据;对所述文本数据进行关键词识别,并确定关键词类型;根据相应工单的表单映射模型,将识别的关键词与表单项进行匹配,并进行数据校验,若匹配成功且校验通过,则进行自动填写。2.如权利要求1所述的基于语音识别的建筑运维工单自动填写方法,其特征在于,对所述文本数据进行关键词识别,并确定关键词类型包括:对所述文本数据进行分词,得到分词集合;基于预构建的建筑运维专业词库进行关键词识别,得到待维修对象和报修描述关键词;对剩余分词进行语义分析,确定属于指定目标类型的关键词,所述指定目标类型即表单项中所需类型。3.如权利要求2所述的基于语音识别的建筑运维工单自动填写方法,其特征在于,若存在不能识别的分词,通过语义分析或人工确定其所属类型,并扩充至建筑运维专业词库。4.如权利要求2所述的基于语音识别的建筑运维工单自动填写方法,其特征在于,若存在表单项没有匹配到关键词,则根据所述表单项的字符类型和所需关键词类型,对所述文本数据进行二次匹配。5.如权利要求1所述的基于语音识别的建筑运维工单自动填写方法,其特征在于,所述建筑运维专业词库生成方法包括:基于预构建的建筑运维基础词库,对语料进行分词处理,得到分词集合;对分词进行语义及词...

【专利技术属性】
技术研发人员:刘鹏飞曲志刚何晓张玉彬李彦饶冬东
申请(专利权)人:山东同圆数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1