文档讲解方法、装置、计算机装置及计算机可读存储介质制造方法及图纸

技术编号:21432196 阅读:30 留言:0更新日期:2019-06-22 11:55
本发明专利技术提供一种文档讲解方法、装置、计算机装置及计算机可读存储介质。所述的文档讲解方法通过获取用户上传的文档,并提取所述文档中的文本信息;根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及若是,则中断讲解,并提取所述问题中的关键词;搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。本发明专利技术涉及音频转换领域,以实现节省人力且减少失误的目的。

【技术实现步骤摘要】
文档讲解方法、装置、计算机装置及计算机可读存储介质
本专利技术涉及数据处理领域,尤其涉及一种文档讲解方法、装置、计算机装置及计算机可读存储介质。
技术介绍
本部分旨在为权利要求书及具体实施方式中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。目前,会议分享一般采用PPT人工讲解的方式进行。一般地,在讲解在开始之前,需要分享者做好充足地准备,以达到较好的分享效果。然而,这种讲解方式耗费人力,且讲解过程易出现失误。
技术实现思路
鉴于上述,本专利技术提供一种文档讲解方法、装置、计算机装置及计算机可读存储介质,以实现节省人力且减少失误的目的。本申请一实施方式提供一种文档讲解方法,所述方法包括:获取用户上传的文档,并提取所述文档中的文本信息;根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及若是,则中断讲解,并提取所述问题中的关键词;搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。在其中一个实施例中,所述获取用户上传的文档,并提取所述文档中的文本信息的步骤包括:对所述文档中的多个文本块进行初步聚类,得到多个聚类,其中,所述多个聚类中的每一聚类为包含一个或多个所述文本块;计算标识每一所述聚类位置信息的特征值;根据每一所述类的特征值,确定所述文档的方向;所述文档的方向确定后,对文档中的多个文本块进行精细聚类,得到多个精细聚类;及将每一所述精细聚类作为一个文本行进行输出,以得到所述文本行对应的文本信息。在其中一个实施例中,所述讲解点为文档标题、段落关键词及文档内容。在其中一个实施例中,所述根据所述文本信息划分所述文档的讲解点的步骤包括:扫描所述文档,并提取文档中的讲解点,其中所述讲解点为所述文档的一级标题、二级标题、三级标题及文档内容;以所述一级标题、所述二级进行、所述三级标题及文档内容为节点生成树形结构;及以所述一级标题为所述树形结构的根节点,所述二级标题、所述文档内容为所述树形结构的子节点,以划分所述文档的讲解点。在其中一个实施例中,所述根据所述讲解点将所述文本信息进行语音合成并转化为语音信息的步骤包括:构建预设词条语音库;在所述文档中切分出与预设词库匹配的多组词;对多组词中的每一组词进行评分并排序,选出评分排序为第一名的一组词作为所述文档的分词结果;及在所述词条语音库中查找与所述分词结果对应的语音信息。在其中一个实施例中,所述搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音的步骤包括:通过预设关键词库或者预设浏览器搜索所述关键词对应的关键词释义;提取所述关键词释义对应的文本信息;及将所述关键词释义对应的文本信息转化成语音并输出。在其中一个实施例中,所述文本信息为所述文档中的文字、文字字号及文字行数。一种文档讲解装置,所述装置包括:获取模块,用于获取用户上传的文档,并提取所述文档中的文本信息;转化模块,用于根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测模块,用于检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及提取模块,用于中断讲解,并提取所述问题中的关键词;输出模块,用于搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。本申请一实施方式提供一种计算机装置,所述计算机装置包括处理器及存储器,所述存储器上存储有若干计算机程序,所述处理器用于执行存储器中存储的计算机程序时实现如前面所述的文档讲解方法的步骤。本申请一实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前面所述的文档讲解方法的步骤。上述文档讲解方法、装置、计算机装置及计算机可读存储介质,通过获取用户上传的文档,并提取所述文档中的文本信息;根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及若是,则中断讲解,并提取所述问题中的关键词;搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。从而,以实现节省人力且减少失误的目的。附图说明为了更清楚地说明本专利技术实施方式的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的文档讲解方法的流程图。图2是本专利技术实施例二提供的文档讲解装置较佳实施例中的功能模块图。图3是本专利技术实施例三提供的计算机装置的示意图。如下具体实施方式将结合上述附图进一步说明本专利技术。具体实施方式为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施方式对本专利技术进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施方式及实施方式中的特征可以相互组合。在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,所描述的实施方式仅仅是本专利技术一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本专利技术。优选地,本专利技术的文档讲解方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、可编程门阵列(Field-ProgrammableGateArray,FPGA)、数字处理器(DigitalSignalProcessor,DSP)、嵌入式设备等。所述计算机装置可以是桌上型计算机、笔记本电脑、平板电脑、服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。实施例一:图1是本专利技术文档讲解方法较佳实施例的步骤流程图。根据不同的需求,所述流程图中步骤的顺序可以改变,某些步骤可以省略。参阅图1所示,所述文档讲解方法具体包括以下步骤。步骤S1、获取用户上传的文档,并提取所述文档中的文本信息。本实施例中,所述文档的类型不限,只要所述文档中含有文本信息即可。所述文档可选择为PPT档、WORD档、PDF档等。所述文本信息为所述文档中的文字、文字字号、文字行数等信息。扫描所述文档,即可读取所述文档中的文字。在一个实施例中,读取文档中的文字可通过提取文档中的文本行的方法进行。其中,“文本行”是指在文档中由文本文字所构成的行,此处所述的“行”并不涉及方向,既可以表示横向的“行”,也可以表示纵向的“行”。所述步骤具体包括:对所述文档中的多个文本块进行初步聚类,得到多个聚类,其中,所述多个聚类中的每一聚类为包含一个或多个所述文本块;计算标识每一所述聚类位置信息的本文档来自技高网
...

【技术保护点】
1.一种文档讲解方法,其特征在于,所述方法包括:获取用户上传的文档,并提取所述文档中的文本信息;根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及若是,则中断讲解,并提取所述问题中的关键词;搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。

【技术特征摘要】
1.一种文档讲解方法,其特征在于,所述方法包括:获取用户上传的文档,并提取所述文档中的文本信息;根据所述文本信息划分所述文档的讲解点,并根据所述讲解点将所述文本信息转化为语音信息;检测播放所述语音信息中的语音的过程中是否接收到用户输入的针对所述文档提出的问题;及若是,则中断讲解,并提取所述问题中的关键词;搜索所述关键词对应释义,输出并播放所述关键词对应释义的语音。2.如权利要求1所述的文档讲解方法,其特征在于,所述获取用户上传的文档,并提取所述文档中的文本信息的步骤包括:对所述文档中的多个文本块进行初步聚类,得到多个聚类,其中,所述多个聚类中的每一聚类为包含一个或多个所述文本块;计算标识每一所述聚类位置信息的特征值;根据每一所述类的特征值,确定所述文档的方向;所述文档的方向确定后,对文档中的多个文本块进行精细聚类,得到多个精细聚类;及将每一所述精细聚类作为一个文本行进行输出,以得到所述文本行对应的文本信息。3.如权利要求1所述的文档讲解方法,其特征在于,所述讲解点为文档标题、段落关键词及文档内容。4.如权利要求1所述的文档讲解方法,其特征在于,所述根据所述文本信息划分所述文档的讲解点的步骤包括:扫描所述文档,并提取文档中的讲解点,其中所述讲解点为所述文档的一级标题、二级标题、三级标题及文档内容;以所述一级标题、所述二级进行、所述三级标题及文档内容为节点生成树形结构;及以所述一级标题为所述树形结构的根节点,所述二级标题、所述文档内容为所述树形结构的子节点,以划分所述文档的讲解点。5.如权利要求1所述的文档讲解方法,其特征在于,所述根据所述讲解点将所...

【专利技术属性】
技术研发人员:付伟
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1