This application provides a method of long short message simplification, including: using word segmentation algorithm to segment long messages to get the corresponding feature word list and feature word space; using the feature word table and feature word space to get the corresponding feature vector; training the feature vector into BP neural network to get the output vector; using the output vector to simplify the feature word library, and so on. Value short words replace the target feature words in the feature vocabulary to form the target feature vocabulary. The inverse algorithm corresponding to the word segmentation algorithm is used to process the target feature vocabulary and get the target long message. It can be seen that the method replaces the feature words in the long short message with the shortened equivalent short words in the feature lexicon, simplifies the long short message, reduces the number of splitted ordinary short messages, and consequently saves the cost. The application also provides a long short message streamlining system, equipment and computer readable storage medium, all of which have the above beneficial effects.
【技术实现步骤摘要】
一种长短信精简方法及系统
本申请涉及IT信息通讯
,特别涉及一种长短信精简方法、系统、设备及计算机可读存储介质。
技术介绍
短信平台负责发送日常办公短信和业务服务短信,如停电通知,扣电费通知,台风预警等。每日的短信发送量较大,随着业务的发展,短信发送数量也在逐渐上升。但是,标准短信协议规定每条短信发送的最大长度是140个字节,即最多允许包含70个汉字。而在实际使用中,发送的短信一般都含有数百个字节,有的短信长度甚至长达数千甚至上万个字节。因此,在进行短信发送时,需要将长短信先拆成普通短信进行发送。用户手机在收到短信后,按长短信组装规则进行短信合并,最终获得一条完整的长短信。短信服务由运营商提供的一种收费服务,是按条进行计费的,企业发送短信一般按5分/条的费用进行结算,企业发送的短信量越多,需要支付的短信结算费用越高。因此,如何对长短信进行精简,减少拆成的普通短信的条数,进而节约成本是本领域技术人员需要解决的技术问题。
技术实现思路
本申请的目的是提供一种长短信精简方法、系统、设备及计算机可读存储介质,能够对长短信进行精简,减少拆成的普通短信的条数,进而节约成本。为解决上述技术问题,本申请提供一种长短信精简方法,包括:利用分词算法对长短信进行分词处理得到对应的特征词表及特征词空间;利用所述特征词表和所述特征词空间得到对应的特征向量;将所述特征向量代入BP神经网络进行训练,得到输出向量;根据所述输出向量,利用特征词库中的精简等价短词对所述特征词表中的目标特征词进行替换,形成目标特征词表;利用所述分词算法对应的逆算法对所述目标特征词表进行处理,得到目标长短信。 ...
【技术保护点】
1.一种长短信精简方法,其特征在于,包括:利用分词算法对长短信进行分词处理得到对应的特征词表及特征词空间;利用所述特征词表和所述特征词空间得到对应的特征向量;将所述特征向量代入BP神经网络进行训练,得到输出向量;根据所述输出向量,利用特征词库中的精简等价短词对所述特征词表中的目标特征词进行替换,形成目标特征词表;利用所述分词算法对应的逆算法对所述目标特征词表进行处理,得到目标长短信。
【技术特征摘要】
1.一种长短信精简方法,其特征在于,包括:利用分词算法对长短信进行分词处理得到对应的特征词表及特征词空间;利用所述特征词表和所述特征词空间得到对应的特征向量;将所述特征向量代入BP神经网络进行训练,得到输出向量;根据所述输出向量,利用特征词库中的精简等价短词对所述特征词表中的目标特征词进行替换,形成目标特征词表;利用所述分词算法对应的逆算法对所述目标特征词表进行处理,得到目标长短信。2.根据权利要求1所述的长短信精简方法,其特征在于,所述利用分词算法对长短信进行分词处理得到对应的特征词表及特征词空间,包括:利用所述分词算法对所述长短信进行分词处理得到各个特征词及对应的特征词空间、各个停用词及对应的停用词空间;根据停用词库过滤各个所述停用词及对应的停用词空间,得到所述特征词表及所述特征词空间。3.根据权利要求1所述的长短信精简方法,其特征在于,将所述特征向量代入BP神经网络进行训练之后,还包括:利用所述BP神经网络将所述特征向量对应的特征词表保存至所述特征词库中。4.根据权利要求1所述的长短信精简方法,其特征在于,所述利用特征词库中的精简等价短词对所述特征词表中的目标特征词进行替换,包括:在所述特征词库中建立所述精简等价短词与所述目标特征词之间的映射关系;利用所述精简等价短词对所述目标特征词进行替换。5.一种长短信精简系统,其特征在于,包括:分词处理模块,用于利用分词算法对长短信进行分词处理得到对应的特征词表及特征词空间;特征向量获取模块,用于利用所述特征词表和所述特征词空间得到对应的特征向量;B...
【专利技术属性】
技术研发人员:黄晓波,黄巨涛,林强,唐亮亮,陈守明,肖建毅,臧笑宇,王飞鸣,吴丽琼,
申请(专利权)人:广东电网有限责任公司,广东电网有限责任公司信息中心,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。