The invention relates to the field of text processing technology. The invention provides a method for text entry point positioning. The method comprises the steps of converting the text content into multiple sequences; calculating the each sequence based on a preset neural network model, obtaining the output values corresponding to each of the sequence columns, respectively; according to the output, the output value of the sequence is obtained. The value determines the entry point position. The technical scheme provided by the present invention can obtain the position of the entry point in the text with the aid of a pre trained neural network model, and can determine whether the input value is included in the sequence according to the output value, and the type of input information included in the sequence by setting the identification information. The method can be set according to actual needs, so the location of entry points can be determined by adjusting the content of the text and adjusting the actual demand. One
【技术实现步骤摘要】
一种文本录入点定位方法及计算机可读存储介质
本专利技术关于文本处理
,尤其涉及一种文本录入点定位方法及计算机可读存储介质。
技术介绍
书面语言是指人们在书写和阅读文章时所使用的语言,它是在口语的基础上发展来的,是在文字产生之后才出现的,通过文字及书面语言的表现形式可对所需表达或者记录的信息进行记录保存。文本,是指书面语言的表现形式,从文学角度说,通常是具有完整、系统含义的一个句子或多个句子的组合。一个文本可以是一个句子、一个段落或者一个篇章。广义“文本”:任何由书写所固定下来的任何话语。狭义“文本”:由语言文字组成的文学实体,代指“作品”,相对于作者、世界构成一个独立、自足的系统。简单来说,人们日常工作生活中使用到的使用文字记载的文献、文书等都属于文本。传统的文本一般是以纸张作为载体进行保存。文本也是计算机的一种文档类型,该类文档主要用于记载和储存文字信息,而不是图像、声音和格式化数据。常见的文本文档的扩展名有.txt、.doc.、.docx、.wps等。随着计算机技术的应用范围越来越广泛和深入,电子文本的应用也越来越广泛,各类文本类型都可以在网络上获取得到。尤其是一些具备固定格式要求的文书,例如各种合同、协议、证明文件等,都可以从网络上获取到同类型的范本,再根据实际应用情况进行调整,用户便可进行使用。随着大数据时代的到来,数据的处理和分析都需依赖于历史文本数据,对于上述有固定格式要求的文书来说,不仅需要提取出同类型文本的结构化特征,以整体梳理相关的信息,还需针对用户自行填写或者补充的信息进行获取和识别,才能清晰识别每一份文本的特征。面临这种复杂的处 ...
【技术保护点】
1.一种文本录入点定位方法,其特征在于,所述方法包含步骤:
【技术特征摘要】
1.一种文本录入点定位方法,其特征在于,所述方法包含步骤:将文本内容转换成多个序列;基于预设神经网络模型对所述各个序列进行计算,分别获得各个所述序列对应的输出值;根据所述输出值确定录入点位置。2.如权利要求1所述的文本录入点定位方法,其特征在于,所述将文本内容转换成多个序列的方法包含按照句式结构对所述文本内容进行转换。3.如权利要求1所述的文本录入点定位方法,其特征在于,所述将文本内容转换成多个序列的方法包含按照内容特征对所述文本内容进行转换。4.如权利要求1所述的文本录入点定位方法,其特征在于,获得所述预设神经网络模型的训练方法包含步骤:准备训练样本文本;从所述样本中提取输入值,并设定每个输入值对应的输出值;选取神经网络算法;基于所述训练样本,对所述神经网络算法进行训练,获得所述预设神经网络模型。5.如权利要求4所述的文本...
【专利技术属性】
技术研发人员:朱敬华,肖龙源,蔡振华,李稀敏,刘晓葳,谭玉坤,
申请(专利权)人:厦门快商通信息技术有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。