【技术实现步骤摘要】
一种基于电话热线的舆情分析方法
[0001]本专利技术涉及大数据分析
,具体涉及一种基于电话热线的舆情分析方法。
技术介绍
[0002]电话热线,也称12345政务服务便民热线、12345热线等,指各地市人民政府设立的由电话12345、市长信箱、手机短信、手机客户端、微博、微信等方式组成的专门受理热线事项的公共服务平台,提供“7
×
24小时”全天候人工服务。通过设立电话热线,能够较为直接地获取到市民反应的相关意见和建议,进而为行政机关的决策提供有效依据。
[0003]现有技术中,针对电话热线的接收,主要依靠自然语义识别(NLP)等技术,将电话语音内容转换成文本内容,随后对文本内容的词频进行统计,并设置相应的阈值进行筛选,从而判断出某项电话语音所反应的事件主题,进而在整体上对市民所反应的问题进行统计、汇总。
[0004]但是,在实施过程中,专利技术人发现,由于不同市民的表述习惯和角度不同,针对同一个事件容易存在有不同的表述方法,进而使得上述依照语义识别,随后进行词频统计的方法难以辨别出多 ...
【技术保护点】
【技术特征摘要】
1.一种基于电话热线的舆情分析方法,其特征在于,预先通过所述电话热线采集有多条语音数据,所述舆情分析方法包括:步骤S1:对所述语音数据进行预处理得到预处理数据;步骤S2:对所述预处理数据进行特征预测,得到对应于所述预处理数据的地点特征和个人特征;步骤S3:获取当前的业务分析需求,依照所述业务分析需求、所述地点特征和所述个人特征对所述预处理数据进行组装得到业务数据;步骤S4:对所述业务数据进行语义匹配得到统计事件组;步骤S5:根据所述统计事件组生成用于表征舆情的事件主题并输出。2.根据权利要求1所述的舆情分析方法,其特征在于,所述步骤S1包括:步骤S11:将所述语音数据进行转写得到文本数据;步骤S12:对所述文本数据中的文本描述数据和人员信息进行清洗以得到清洗数据;步骤S13:对所述清洗数据的经纬度进行处理从而得到所述预处理数据。3.根据权利要求2所述的舆情分析方法,其特征在于,所述步骤S13包括:步骤S131:自所述清洗数据中预测地址实体;步骤S132:对所述地址实体获取所述经纬度;步骤S133:对所述经纬度进行归一化处理并添加至所述预处理数据中。4.根据权利要求3所述的舆情分析方法,其特征在于,于执行所述步骤S2之前,还包括一预测模型训练过程,所述预测模型训练过程包括:步骤A1:自对应于所述预处理数据的历史数据中抽取地址文本;步骤A2:将所述地址文本转换成经纬度坐标,并对所述经纬度坐标进行归一化处理得到归一化坐标;步骤A3:通过对所述归一化坐标进行聚类以构建预测模型。5.根据权利要求1所述的舆情分析方法,其特征在于,所述步骤S2包括个人特征抽取过程,所述个人特征抽取过程包括:步骤B1:对每一条所述预处理数据中是否存在有数据缺失的部分进行判别;若是,则转向步骤B2;若否,则转向步骤B3;...
【专利技术属性】
技术研发人员:程栋,吴颖健,谭锐,潘希尧,高扬,王晔,
申请(专利权)人:上海市大数据股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。