【技术实现步骤摘要】
一种基于服务拓展数据经营场景的表格问答系统应用
[0001]本专利技术属于自然语言处理领域,具体来说是涉及一种表格数据链路搭建的、针对表格字段的解析和问答的技术应用。
技术介绍
[0002]随着保险服务拓展业务的迅速发展,业务上聚集了大量的表格数据,包括人力、价值、保费等结构化表格信息。末来的人机交互数据将越来越多涉及此类业务上的表格信息,不断更新的业务表格信息数据仓库。这些信息数据量大,但是形式较为松散。服拓业务员对表格数据的查询速度要求越来越高,此应用不仅可以统一归置表格内容,还可以为各类业务的分析、研究和决策提供支撑。面向管理层提供经营决策的数据分析能力;面向代理人提供保险专业知识的解答能力;因此,准确的表格数据排版和识别成为了表格问答服务的重要问题。
[0003]本申请方案提供一种基于服务拓展数据经营场景的表格问答系统应用,在企微服拓驾驶舱模块嵌入语音文本问答功能,通过构建智能机器人平台提供完善的语义解析实现siri功能,在传统关键词匹配的基础上,进一步引入语义搜索技术,将精华问答库的问题映射为多维向量,进行 ...
【技术保护点】
【技术特征摘要】
1.一种基于服务拓展数据经营场景的表格问答系统应用,其特征在于:运用NL2SQL模型和规则优化的format算法对表格进行处理,进行表格字段的划分以及要素的识别,是一种面向松散形式的表格提取与问答方法,包括以下步骤:一、确定前端展示字段;二、业务问答范围确认;三、通用传输表格设计与同步;四、问答表格设计;五、表格问答选型、定时任务流程设计;六、接口开发与对接;在步骤一中,业务初版需求提供的excel,和前端讨论下会展示哪些表格,展示的字段及形式。2.在步骤二中,确认业务问答范围包括问答表格确认、问题类型确认;在步骤三和四中,数据收集阶段包括表格数据同步方案整理、沟通,表格数据同步开发;在步骤五中,使用NL2SQL方法自动提取并识别表格要素字段标签,再通过greedy decoding的方式,部分较长SQL查询采用Top
‑
p Sampling或BeamSearch Decoding,一方面,降低选择提取字段的工作量;另一方面,保证字问答的准确率和覆盖率;在步骤六中,和后端确认接口字段,通过微服务形式进行表格问答调用。3.如权利要求1所述的一种基于服务拓展数据经营场景的表格问答系统应用,其特征在于:步骤一和二中,问答范围确认;由根据业务指标页面去倒推有哪些问题作为表格问答的标准问;具体问题分为几类:(1)直接查询:直接通过org+date+field字段名确认数值;(2)最值查询:通过date+field+最值特征词top1 or topk
‑
>推导出二级机构;(3)统计查询:通过(org, san)*>1, date,field,(var)得到统计值;(4)比较查询:通过同级机构之间确定数值差额,实体公式为date, (org)*2, field;上诉问题都在拆分阶段中相应处理,为后面的工作提供了质量可靠的数据。4.如权利要求2所述的一种基于服务拓展数据经营场景的表格问答系统应用,其特征在于:步骤三:通用传输表格设计与同步;根据提问对象和定时更新的频率不同设计两张主要的同步表:机构和个人表,这两张表是“加密”传输的信息,传输过来后用约定的方式“解密”,设计好“加密解密”的逻辑,把“加密”方式给到对方,对方按照提供的方式对所有用到的字段进行“加密”组装,然后拿到后进行“解密”,解密的过程主要是为了验证对方传输过来的数据格式、数值、类型等都是准确无误的,相当于一个校验过程,校验通过后就能按照设计的思路进行后续的操作。5.如权利要求3所述的一种基于服务拓展数据经营场景的表格问答系统应用,其特征在于:步骤四:问答表格设计;表格设计需要从问句抽象推导过来,具体来说:机构约束...
【专利技术属性】
技术研发人员:周彬,段凯,陈绍媛,吴予豪,
申请(专利权)人:太平人寿保险有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。