识别文本展示方法及装置制造方法及图纸

技术编号:18940459 阅读:30 留言:0更新日期:2018-09-15 11:03
本发明专利技术实施例提供一种识别文本展示方法及装置,属于语音识别和自然语言处理技术领域。方法包括:获取识别文本中每一分词的分类特征;将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况;根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对识别文本中每一分词进行展示。由于在展示识别文本中文本内容的同时,还可以通过展示方式来体现分词在识别文本中的重要程度和/或在识别文本中的异常情况,从而承载发言人发言时的情感色彩和/或发言时的语义。因此,满足了发言人个性化展示其发言的需求。

Identification text display method and device

The embodiment of the invention provides a text display method and a device for recognition, belonging to the technical field of speech recognition and natural language processing. The methods include: acquiring the classification features of each word in the recognition text; inputting the classification features of each word into the classification model, outputting the classification markers of each word, which are used to indicate the importance of the segmentation in the recognition text and/or the abnormal situation in the recognition text; and according to the classification markers of each word, Determine how each participle is displayed and display each participle in the recognized text based on the presentation of each participle. The importance of word segmentation in text recognition and/or the abnormal situation in text recognition can be reflected by the way of display while the text content in the text is displayed, so as to carry the emotional color and/or the semantic meaning when the speaker speaks. Therefore, it meets the needs of speakers to personalize their speeches.

【技术实现步骤摘要】
识别文本展示方法及装置
本专利技术实施例涉及语音识别和自然语言处理
,更具体地,涉及一种识别文本展示方法及装置。
技术介绍
近年来,随着语音技术的飞速发展,语音识别技术凭借其智能、高效和人性化的优势,被广泛应用于生产、生活的各个领域,越来越受到大众的欢迎。目前的语音识别技术,其目标是将语音数据转换为文本进行展示,一般通篇采用同一种格式,形式显得单一刻板。通过现有技术获取的识别文本,仅通过固定的展现形式,无法直观地为用户展现语音数据的关键信息,缺乏针对语音数据的个性化展示形式。因此,如何对识别文本进行个性化展示,仍是目前业界亟待解决的课题。
技术实现思路
为了解决上述问题,本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的一种识别文本展示方法及装置。根据本专利技术实施例的第一方面,提供了一种识别文本展示方法,该方法包括:获取识别文本中每一分词的分类特征,识别文本是对语音数据进行语音识别后得到的;将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况;根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对识别文本中每一分词进行展示。本专利技术实施例提供的方法,通过获取识别文本中每一分词的分类特征,将每一分词的分类特征输入至分类模型,输出每一分词的分类标记。根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对识别文本中每一分词进行展示。由于在展示识别文本中文本内容的同时,还可以通过展示方式来体现分词在识别文本中的重要程度和/或在识别文本中的异常情况,从而承载发言人发言时的情感色彩和/或发言时的语义。因此,满足了发言人个性化展示其发言的需求。根据本专利技术实施例的第二方面,提供了一种识别文本展示装置,该装置包括:特征获取单元,用于获取识别文本中每一分词的分类特征,识别文本是对语音数据进行语音识别后得到的;分类获取单元,用于将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况;展示单元,用于根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对识别文本中每一分词进行展示。根据本专利技术实施例的第三方面,提供了一种识别文本展示设备,包括:至少一个处理器;以及与处理器通信连接的至少一个存储器,其中:存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的识别文本展示方法。根据本专利技术的第四方面,提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的识别文本展示方法。应当理解的是,以上的一般描述和后文的细节描述是示例性和解释性的,并不能限制本专利技术实施例。附图说明图1为本专利技术实施例的一种识别文本展示方法的流程示意图;图2为本专利技术实施例的一种识别文本展示装置的框图;图3为本专利技术实施例的一种识别文本展示设备的框图。具体实施方式下面结合附图和实施例,对本专利技术实施例的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术实施例,但不用来限制本专利技术实施例的范围。目前在对语音识别结果进行展示时,通常是对语音数据进行语音识别,再采用固定的形式直接对识别文本进行展示。由于采用固定的形式对识别文本进行展示,从而导致展示形式较为单一。而人在发言时,除了发言的内容之外,发言的声音可能会带有情感色彩,发言的内容中可能会有一些特定语义。因此,目前存在基于上述因素,对识别文本进行个性化展示的需求。基于该需求,本专利技术实施例提供了一种识别文本展示方法,该方法可以用于语音识别场景,也可以用于需要用到语音识别的其它场景,如直播时的字幕显示,本专利技术实施例对此不作具体限定。参见图1,该方法包括:101,获取识别文本中每一分词的分类特征,识别文本是对语音数据进行语音识别后得到的。在执行步骤101之前,可先获取语音数据,如通过会议录音、采访录音获取语音数据。在获取到语音数据后,可对语音数据进行识别得到识别文本。由于获取到的语音数据可能是包含多位发言人的发言,从而在执行步骤101之前,可先对语音数据进行端点检测,分别确定多个语音段的起始点和结束点。根据每一语音段的起始点和结束点,即可得到多个语音段。其中,每一语音段即对应一位发言人的一次发言,后续可将每一语音段作为语音识别的处理对象。为了便于说明,以语音数据不包含多位发言人的发言,而是包含一位发言人的一次发言为例,可先对该语音数据进行特征提取,如提取MFCC(MelFrequencyCepstrumCoefficient,MFCC)特征;再利用提到的特征及预先训练的声学模型和语言模型进行解码操作;最后根据解码结果得到该语音数据对应的识别文本。在上述步骤101中,分类特征可以用于表征识别文本中分词在语音上的感情色彩和/或文本内容上的语义。例如,对于任一分词,若分类特征用于表征语音的感情色彩,则该分词的分类特征可以包括语音数据的强度等信息;若分类特征用于表征文本内容的语义,则该分词的分类特征可包括该分词的词性等信息。基于上述内容,在获取识别文本中分词的分类特征时,可通过语音数据分析和/或分词语义解析的方式获取,本专利技术实施例对此不作具体限定。在获取识别文本中分词的分类特征时,可以是以识别文本中分词的前后文语义作为依据,也可以是以分词在语音数据中对应的语音段的音高、音强、音长或音色等语音要素作为依据,还可以是两种依据相互结合,本专利技术实施例对此不作具体限定。102,将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况。在步骤102中,分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况。对于任一分词,关于该分词对应的分类标记的类型及数量,本专利技术实施例对此不作具体限定。例如,该分词可以只具有表示分词在识别文本中重要程度的分类标记,或者只具有表示分词在识别文本中异常情况的分类标记,又或者两者同时具有。另外,分类标记可通过字符串表示,如中文词语,也可以为单个字符表示,如数字,本专利技术实施例对此也不作具体限定。以分类标记通过字符串表示为例,若分类标记用于表示分词在识别文本中的重要程度,则分类标记可分别为“普通”、“强调”或“特别强调”等。其中,“普通”表示分词在识别文本中的重要程度最低;“强调”表示分词在识别文本中的重要程度较高;“特别强调”表示分词在识别文本中的重要程度最高。若分类标记用于表示分词在识别文本中的异常情况,则分类标记可分别为“正常”、“异常”或“严重异常”等。其中,“正常”表示分词本身无误且与符合识别文本中的语境;“异常”表示分词本身有可能存在错误或不符合识别文本中的语境;“严重异常”表示分词本身可能存在错误或不符合识别文本中的语境,且这种可能性较高。需要说明的是,由上述内容可知,本专利技术实施例不对识别文本中的任一分词其分类标记的类型及数量作具体限定。结合上述内容,该分词的分类标记可以仅为“普通”,或者仅为“异常”,或者同时具有“普通”、“正常”本文档来自技高网...

【技术保护点】
1.一种识别文本展示方法,其特征在于,包括:获取识别文本中每一分词的分类特征,所述识别文本是对语音数据进行语音识别后得到的;将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,所述分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况;根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对所述识别文本中每一分词进行展示。

【技术特征摘要】
1.一种识别文本展示方法,其特征在于,包括:获取识别文本中每一分词的分类特征,所述识别文本是对语音数据进行语音识别后得到的;将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,所述分类标记用于表示分词在识别文本中的重要程度和/或在识别文本中的异常情况;根据每一分词的分类标记,确定每一分词的展示方式,并基于每一分词的展示方式对所述识别文本中每一分词进行展示。2.根据权利要求1所述的方法,其特征在于,所述分类特征包括声学分类特征和/或语义分类特征。3.根据权利要求2所述的方法,其特征在于,对于所述识别文本中的任一分词,所述任一分词的声学分类特征至少包括以下四种信息中的任意一种,所述四种信息分别为所述任一分词在所述语音数据中对应的语音段能量、所述任一分词在所述语音数据中对应的语音段时长、所述任一分词在语音数据中对应的语音段与所述任一分词的前一个分词在语音数据中对应的语音段之间的时间间隔,以及所述任一分词在语音数据中对应的语音段与所述任一分词的后一个分词在语音数据中对应的语音段之间的时间间隔;所述任一分词的语义分类特征至少包括以下八种信息中的任意一种,所述八种信息分别为所述任一分词的词向量、所述任一分词的情感极性、所述任一分词的词性、所述任一分词在所述识别文本中出现的频率、所述任一分词的关键词标识、所述任一分词在文档分页对应的文本中出现的频率、所述任一分词在所述文档分页中的显示字体大小,以及所述任一分词的特殊符号标识;其中,所述文档分页对应的文本包含所述识别文本对应的文本内容。4.根据权利要求1所述的方法,其特征在于,所述将每一分词的分类特征输入至分类模型,输出每一分词的分类标记,包括:对于所述识别文本中的任一分词,将所述任一分词的分类特征输入至所述分类模型,输出所述任一分词的分类标记;或者,将所述任一分词的分类特征、所述任一分词的前一个分词对应的分类特征和所述任一分词的后一个分词对应的分类特征同时输入至所述分类模型,输出所述任一分词的分类标记。5.根据权利要求1所述的方法,其特征在于,所述基于每一分词的展示方式对所述识别文本中每一分词进行展示之前,还包括:基于预设表达规则,对所述识别文本中分词的表达形式进行规...

【专利技术属性】
技术研发人员:胡尹
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1