System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种基于大数据的咨询管理方法及系统。
技术介绍
1、目前,在一些咨询系统中,用户通常需要输入大量的咨询信息,才能够得到准确的咨询结果。例如,用户需要在旅游规划的应用程序中选择出发地点、中转地点、目的地点、往返日期、随行人数等,才能够得到应用程序推送的旅游攻略。
2、显然,这样的咨询管理方法对用户而言具备较差的体验,目前需要一种更加高效和便捷的咨询管理方式。
技术实现思路
1、本专利技术提供一种基于大数据的咨询管理方法及系统,能够提高咨询管理的效率和便捷性。
2、本专利技术一方面提供一种基于大数据的咨询管理方法,所述方法包括:
3、接收目标用户输入的咨询信息,并识别所述目标用户的身份标识,以获取与所述身份标识相匹配的用户偏好数据;
4、获取所述目标用户当前所处的环境信息,并根据所述咨询信息和所述环境信息,生成咨询上下文;其中,所述环境信息至少用于表征所述目标用户所处的地理位置;
5、提取所述咨询上下文的语义信息,并查询包含所述语义信息的多篇目标文档;
6、识别各篇所述目标文档的主题风格,并根据主题风格与所述用户偏好数据之间的匹配程度,对所述目标文档进行排序,并向所述目标用户展示排序后的目标文档。
7、在一个实施方式中,根据所述咨询信息和所述环境信息,生成咨询上下文包括:
8、从所述咨询信息中识别所述目标用户的行程规划,并将所述行程规划中涉及的目标地点与所述环
9、根据比对结果,生成所述目标用户的活动路径;
10、从所述行程规划中识别活动时段,构建包含所述活动路径和所述活动时段的咨询上下文。
11、在一个实施方式中,查询包含所述语义信息的多篇目标文档包括:
12、从候选的文档库中获取各篇文档的结构化信息,所述结构化信息中按照预设格式记录文档的各项属性信息;
13、生成各项属性信息表征的属性语义,并根据各个属性语义构建结构化向量;
14、计算所述结构化向量与所述语义信息表征的语义向量之间的相似度;
15、将相似度满足预设条件的结构化向量对应的文档,作为查询到的包含所述语义信息的目标文档。
16、在一个实施方式中,在识别各篇所述目标文档的主题风格之后,所述方法还包括:
17、从所述主题风格中确定各篇目标文档的情绪关键词,并根据所述情绪关键词,筛选出表征正向情绪的候选文档;
18、从所述候选文档的主题风格中确定适用人群信息,并将所述适用人群信息与所述用户偏好数据进行匹配,以确定所述候选文档的主题风格与所述目标用户的用户偏好数据之间的匹配程度。
19、在一个实施方式中,向所述目标用户展示排序后的目标文档包括:
20、在展示的目标文档中,标注与所述咨询上下文相匹配的段落本文,所述段落文本被触发时,在当前展示页面中展示行程规划弹窗,以通过所述行程规划弹窗获取所述目标用户输入的行程规划信息。
21、本专利技术另一方面还提供一种基于大数据的咨询管理系统,所述系统包括:
22、数据获取单元,用于接收目标用户输入的咨询信息,并识别所述目标用户的身份标识,以获取与所述身份标识相匹配的用户偏好数据;
23、上下文生成单元,用于获取所述目标用户当前所处的环境信息,并根据所述咨询信息和所述环境信息,生成咨询上下文;其中,所述环境信息至少用于表征所述目标用户所处的地理位置;
24、查询单元,用于提取所述咨询上下文的语义信息,并查询包含所述语义信息的多篇目标文档;
25、展示单元,用于识别各篇所述目标文档的主题风格,并根据主题风格与所述用户偏好数据之间的匹配程度,对所述目标文档进行排序,并向所述目标用户展示排序后的目标文档。
26、在一个实施方式中,所述上下文生成单元具体用于,从所述咨询信息中识别所述目标用户的行程规划,并将所述行程规划中涉及的目标地点与所述环境信息表征的地理位置进行比对;根据比对结果,生成所述目标用户的活动路径;从所述行程规划中识别活动时段,构建包含所述活动路径和所述活动时段的咨询上下文。
27、在一个实施方式中,所述查询单元具体用于,从候选的文档库中获取各篇文档的结构化信息,所述结构化信息中按照预设格式记录文档的各项属性信息;生成各项属性信息表征的属性语义,并根据各个属性语义构建结构化向量;计算所述结构化向量与所述语义信息表征的语义向量之间的相似度;将相似度满足预设条件的结构化向量对应的文档,作为查询到的包含所述语义信息的目标文档。
28、在一个实施方式中,所述系统还包括:
29、筛选单元,用于从所述主题风格中确定各篇目标文档的情绪关键词,并根据所述情绪关键词,筛选出表征正向情绪的候选文档;
30、匹配单元,用于从所述候选文档的主题风格中确定适用人群信息,并将所述适用人群信息与所述用户偏好数据进行匹配,以确定所述候选文档的主题风格与所述目标用户的用户偏好数据之间的匹配程度。
31、在一个实施方式中,所述查询单元具体用于执行以下步骤:
32、步骤一:对用户所述语义信息s进行分词,设i为分词后获得的第i个不重复词语的编号,i为总的不重复词语的数量,i大于等于1且小于等于i,wi为编号为i的分词词语,wij为分词词语wi的第j个近义词,eij为分词词语wi的第j个父级标签词,fij为分词词语wi的第j个子级标签词,j为大于等于1且小于等于j的整数,j为词语延伸上限,一般取5,子级标签词和父级标签词为系统预设信息,根据词语变化而变化,文档d与词语wi的相关性x(wi,d)为:
33、
34、其中f(wi,d)、f(wij,d)、f(eij,d)、f(fij,d)分别为词语wi、wij、eij、fij在文档d中出现的频率,k为文档长度调节因子,取值范围为大于0小于1,ld为文档长度,avgld为文档库中所有文档的长度;
35、步骤二:设wi、wij、eij、fij在文档d中出现的频数分别为n(wi,d)、n(wij,d)、n(eij,d)、n(fij,d),则文档d与词语wi相似性评分y(wi,d)为:
36、
37、其中nd为文档d中词语的总数量;
38、步骤三:根据步骤一和步骤二中计算的结果,计算文档d与当前语义信息s的匹配度,计算公式如下:
39、
40、其中p(s,d)为文档d与当前语义信息s的匹配度,p(s,d)越大,说明其匹配度越高,展示位置越靠前。
41、本专利技术提供的技术方案,在接收到用户输入的简易的咨询信息后,可以通过对环境信息进行分析,生成该咨询信息对应的咨询上下文。该咨询上下文中可以包含比较丰富的内容,基于该咨询上下文可以得到更加全面的查询结果。在查询结果中,还可以按照用户偏好数据对目标本文档来自技高网...
【技术保护点】
1.一种基于大数据的咨询管理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,查询包含所述语义信息的多篇目标文档包括:
3.根据权利要求1所述的方法,其特征在于,在识别各篇所述目标文档的主题风格之后,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,向所述目标用户展示排序后的目标文档包括:
5.一种基于大数据的咨询管理系统,其特征在于,所述系统包括:
6.根据权利要求5所述的系统,其特征在于,所述上下文生成单元具体用于,从所述咨询信息中识别所述目标用户的行程规划,并将所述行程规划中涉及的目标地点与所述环境信息表征的地理位置进行比对;根据比对结果,生成所述目标用户的活动路径;从所述行程规划中识别活动时段,构建包含所述活动路径和所述活动时段的咨询上下文。
7.根据权利要求5所述的系统,其特征在于,所述查询单元具体用于,从候选的文档库中获取各篇文档的结构化信息,所述结构化信息中按照预设格式记录文档的各项属性信息;生成各项属性信息表征的属性语义,并根据各个属性语义构建结构化向量;计
8.根据权利要求5所述的系统,其特征在于,所述系统还包括:
9.根据权利要求5所述的系统,其特征在于,所述查询单元具体用于执行以下步骤:
10.一种语义信息的查询方法,其特征在于,具体包括以下步骤:
...【技术特征摘要】
1.一种基于大数据的咨询管理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,查询包含所述语义信息的多篇目标文档包括:
3.根据权利要求1所述的方法,其特征在于,在识别各篇所述目标文档的主题风格之后,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,向所述目标用户展示排序后的目标文档包括:
5.一种基于大数据的咨询管理系统,其特征在于,所述系统包括:
6.根据权利要求5所述的系统,其特征在于,所述上下文生成单元具体用于,从所述咨询信息中识别所述目标用户的行程规划,并将所述行程规划中涉及的目标地点与所述环境信息表征的地理位置进行比对;根据比对结果,生成所述目标用户的活动路径;从所述行程...
【专利技术属性】
技术研发人员:林瀚声,钟子超,黄华成,余雄,
申请(专利权)人:贵州聚原数技术开发有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。