一种快速的城市信息检索系统技术方案

技术编号:16216582 阅读:67 留言:0更新日期:2017-09-15 22:47
本发明专利技术提供了一种快速的城市信息检索系统,包括移动终端和城市数据中心,所述移动终端用于向城市数据中心发送领域信息请求,所述城市数据中心用于根据信息请求进行相应领域信息检索并反馈给移动终端。本发明专利技术的有益效果为:实现了城市信息的快速检索。

A fast urban information retrieval system

The present invention provides a rapid city information retrieval system, including the mobile terminal and the city data center, the mobile terminal to request to the city center to send data field information, the city data center for the corresponding field of information retrieval and feedback to the mobile terminal according to the information request. The invention has the advantages that the urban information can be quickly searched.

【技术实现步骤摘要】
一种快速的城市信息检索系统
本专利技术涉及信息检索
,具体涉及一种快速的城市信息检索系统。
技术介绍
人们去一个城市旅游时,希望清楚当地的各种资讯,如何从海量信息中快速检索出想要了解的信息成为摆在人们的面前难题。
技术实现思路
针对上述问题,本专利技术旨在提供一种快速的城市信息检索系统。本专利技术的目的采用以下技术方案来实现:提供了一种快速的城市信息检索系统,包括移动终端和城市数据中心,所述移动终端用于向城市数据中心发送领域信息请求,所述城市数据中心用于根据信息请求进行相应领域信息检索并反馈给移动终端。本专利技术的有益效果为:实现了城市信息的快速检索。附图说明利用附图对本专利技术作进一步说明,但附图中的实施例不构成对本专利技术的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。图1是本专利技术的结构示意图;附图标记:移动终端1、城市数据中心2。具体实施方式结合以下实施例对本专利技术作进一步描述。参见图1,本实施例的一种快速的城市信息检索系统,包括移动终端1和城市数据中心2,所述移动终端1用于向城市数据中心2发送领域信息请求,所述城市数据中心2用于根据信息请求进行相应领域信息检索并反馈给移动终端1。本实施例实现了城市信息的快速检索。优选的,所述移动终端1包括手机和平板电脑。本优选实施例提供了多种信息检索终端。优选的,所述移动终端1包括GPS定位模块。本优选实施例为用户提供了定位功能。优选的,所述城市数据中心2包括信息输入子系统、领域概念获取子系统和信息检索子系统,所述信息输入子系统用于输入用户发送的领域信息请求,所述领域概念获取子系统用于从语料库中获取相应的领域概念,所述信息检索子系统用于根据领域概念进行相应的信息检索。所述信息输入子系统包括语音输入模块和文本输入模块,所述语音输入模块用于识别输入的语音信息,所述文本输入模块用于识别输入的文本信息,所述语音输入模块包括语音信息采集单元、语音信息存储单元、语音信息传输单元、声音文本转换单元和文本识别单元,所述语音信息采集单元用于采集语音信息,所述语音信息存储单元用于存储采集到的语音信息,所述语音信息传输单元用于将存储的语音信息传输至声音文本转换单元,所述声音文本转换单元用于将声音信息转化为文本信息,所述文本识别单元用于对文本信息进行识别;所述文本输入模块包括文本信息输入单元、文本信息存储单元、文本信息阅读单元、通信单元和文本信息识别单元,所述文本信息输入单元用于手动书写文本信息,所述文本信息存储单元用于存储写入的文本信息,所述文本信息阅读单元用于阅读存储的文本信息,所述通信单元用于将阅读出的文本信息传输至文本信息识别单元,所述文本信息识别单元用于对接收的文本信息进行识别。本优选实施例实现了信息的语音输入和手写输入。优选的,所述领域概念获取子系统包括第一集合生成模块和第二概念获取模块,所述第一集合生成模块用于根据语料库生成词语集合,所述第二概念获取模块用于根据词语集合获取领域概念;所述生成词语集合采用以下步骤进行:步骤1、以句为单位对语料库进行分词,首先去除停用词,生成词语集合W,然后从词语集合W中提取多元词组,得到候选词集合WL;步骤2、若WL不为空,则取字符串w,若w满足复合词语判定条件,则将w作为复合词语加入复合词语集合CW=CW∪w,其中,w∈WL,;步骤3、输出词语集合W=W∪CW。采用以下步骤确定所述复合词语判定条件:步骤1、设字符串w=s1s2…sn,s1,s2,…,sn为对其分词后得到的词语,用YW表示s1,s2,…,sn的互信息指数:上述式子中,P(s1)为词语s1出现的概率,P(s2)为词语s2出现的概率,…,P(sn)为词语sn出现的概率,P(s1,s2,…,sn)为词语s1,s2,…,sn在语料库中共同出现的概率,其中,其中,F(s1)为包含词语s1的句子的数量,F(s2)为包含词语s2的句子的数量,…,F(sn)为包含词语sn的句子的数量,F(s1,s2,…,sn)为包含词语s1,s2,…,sn在的句子的数量,F表示句子总数;步骤2、若满足YW(s1,s2,…,sn)>YW1,则确定w是复合词语,其中,YW1为给定的阈值。本优选实施例城市信息检索系统在获取领域概念前,对语料库中的复合词语进行提取,克服了以往领域概念获取过程中没有考虑复合词语的缺陷,能够防止在后续选取候选概念过程中将复合词语的领域概念筛选掉,具体操作时,提出了全新的复合词语判定条件,获取了准确的复合词语集合,从而城市信息检索系统能够检索到更为全面的领域信息。优选的,获取所述领域概念采用以下步骤进行:步骤1、预先从领域知识库中选取领域概念作为初始领域概念集合DC;步骤2、对于词语集合W中的词语s,采用余弦相似度计算其语义相似度CS(s,DC),若满足CS(s,DC)>CS1,其中,CS1为给定阈值,则将s加入领域概念集合中,得到一次更新的领域概念集合,并将s从W集合中移除,得到更新的词语集合;步骤3、从更新的词语集合中逐一选取词语s,若满足候选概念判定条件,则将s加入候选概念集合CC中;步骤4、对候选概念集合CC中的每个候选概念s进行评价,获取每个候选概念s评价值ZC,选取评价值最大的前EM个词语加入到一次更新的领域概念集合,得到最终的领域概念集合,其中EM∈[5,9]。采用以下步骤确定所述候选概念判定条件:步骤1、对语料库中包含词语s的句子数量进行计算,所述句子数量等于组成这个词语的各个词语的句子数量之和:上述式子中,n表示s包含的词语的个数,si表示s包含的第i个词语,F(s)表示语料库中包含词语s的句子数量;步骤2、计算语料库中词语s与初始领域概念集合中的任一领域概念共同出现的句子数量:上述式子中,dc表示初始领域概念集合中的任一领域概念,F(s,DC)表示词语s与初始领域概念集合中的任一领域概念共同出现的句子数量;步骤3、采用下式计算词语s的候选值FS:上述式子中,Fmax(s,DC)表示词语s与初始领域概念集合中某一领域概念共同出现的句子数量的最大值;若FS>FS1,其中,FS1为设定阈值,则词语s为候选概念。采用以下公式确定所述评价值ZC:本优选实施例城市信息检索系统在获取领域概念的过程中,考虑了领域概念的语义相似,避免了采用统计方法漏掉语义相似的领域概念,在具体确定领域概念的过程中,首先确定候选概念,然后确定领域概念,获取的领域概念更为符合领域特征,从而城市信息检索系统能够检索到更为准确的领域信息。采用本专利技术快速的城市信息检索系统进行信息检索,当EH取不同值时,对信息检索准确性和信息检索效率进行统计,同未采用本专利技术相比,产生的有益效果如下表所示:EM信息检索准确性提高信息检索效率提高532%31%627%24%725%20%820%16%918%15%最后应当说明的是,以上实施例仅用以说明本专利技术的技术方案,而非对本专利技术保护范围的限制,尽管参照较佳实施例对本专利技术作了详细地说明,本领域的普通技术人员应当理解,可以对本专利技术的技术方案进行修改或者等同替换,而不脱离本专利技术技术方案的实质和范围。本文档来自技高网...
一种快速的城市信息检索系统

【技术保护点】
一种快速的城市信息检索系统,其特征在于,包括移动终端和城市数据中心,所述移动终端用于向城市数据中心发送领域信息请求,所述城市数据中心用于根据信息请求进行相应领域信息检索并反馈给移动终端。

【技术特征摘要】
1.一种快速的城市信息检索系统,其特征在于,包括移动终端和城市数据中心,所述移动终端用于向城市数据中心发送领域信息请求,所述城市数据中心用于根据信息请求进行相应领域信息检索并反馈给移动终端。2.根据权利要求1所述的快速的城市信息检索系统,其特征在于,所述移动终端包括手机和平板电脑。3.根据权利要求2所述的快速的城市信息检索系统,其特征在于,所述移动终端包括GPS定位模块。4.根据权利要求3所述的快速的城市信息检索系统,其特征在于,所述城市数据中心包括信息输入子系统、领域概念获取子系统和信息检索子系统,所述信息输入子系统用于输入用户发送的领域信息请求,所述领域概念获取子系统用于从语料库中获取相应的领域概念,所述信息检索子系统用于根据领域概念进行相应的信息检索。5.根据权利要求4所述的快速的城市信息检索系统,其特征在于,所述信息输入子系统包括语音输入模块和文本输入模块,所述语音输入模块用于识别输入的语音信息,所述文本输入模块用于识别输入的文本信息,所述语音输入模块包括语音信息采集单元、语音信息存储单元、语音信息传输单元、声音文本转换单元和文本识别单元,所述语音信息采集单元用于采集语音信息,所述语音信息存储单元用于存储采集到的语音信息,所述语音信息传输单元用于将存储的语音信息传输至声音文本转换单元,所述声音文本转换单元用于将声音信息转化为文本信息,所述文本识别单元用于对文本信息进行识别;所述文本输入模块包括文本信息输入单元、文本信息存储单元、文本信息阅读单元、通信单元和文本信息识别单元,所述文本信息输入单元用于手动书写文本信息,所述文本信息存储单元用于存储写入的文本信息,所述文本信息阅读单元用于阅读存储的文本信息,所述通信单元用于将阅读出的文本信息传输至文本信息识别单元,所述文本信息识别单元用于对接收的文本信息进行识别。6.根据权利要求5所述的快速的城市信息检索系统,其特征在于,所述领域概念获取子系统包括第一集合生成模块和第二概念获取模块,所述第一集合生成模块用于根据语料库生成词语集合,所述第二概念获取模块用于根据词语集合获取领域概念;所述生成词语集合采用以下步骤进行:步骤1、以句为单位对语料库进行分词,首先去除停用词,生成词语集合W,然后从词语集合W中提取多元词组,得到候选词集合WL;步骤2、若WL不为空,则取字符串w,若w满足复合词语判定条件,则将w作为复合词语加入复合词语集合CW=CW∪w,其中,w∈WL,;步骤3、输出词语集合W=W∪CW;采用以下步骤确定所述复合词语判定条件:步骤1、设字符串w=s1s2…s...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:上海喆之信息科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1