一种基于信息抽取和多属性决策的房地产客户画像方法和系统技术方案

技术编号:34097644 阅读:23 留言:0更新日期:2022-07-11 22:41
一种基于信息抽取的多属性决策的房地产客户画像方法,包括:1)数据收集:综合考量多种数据来源,经过筛选提取后,得到实验所需的客户人群的基本信息和印象文本数据;2)信息提取:应用关键短语提取模型,以客户的印象文本的词嵌入矩阵及文本对应的POS语义标记嵌入矩阵为输入提取关键信息并整合到客户基本信息中;3)属性权重分配:根据房地产行业对各客户人群的特征描述,针对各人群为各属性权重分配对应的权重;4)客户画像标识:从教育重视、扎根意愿、投资倾向等6个方面对客户进行描绘,并挑选其中分值较高的方面作为客户的标签。本发明专利技术还包括基于信息抽取和多属性决策的房地产客户画像系统。户画像系统。户画像系统。

【技术实现步骤摘要】
一种基于信息抽取和多属性决策的房地产客户画像方法和系统


[0001]本专利技术涉及房地产客户画像方法和系统。

技术介绍

[0002]随着城镇化的不断发展与深入,大量涌入的人口极大提升了城市中各行各业 的生产效率,其中的经济效应和虹吸效应也为房地产行业带来了更多的从业者和 潜在客户。房地产行业是一个急需客户画像的领域。过去,房地产企业通常通过 大面积广告、问卷调查和电话采访等方式进行促销。但这些方法都存在投入大、 效果不明显等缺点。
[0003]近几年,随着信息技术革命的不断深入,信息化与数字化的浪潮席卷了各行 各业。大数据技术和自然语言处理技术的日益成熟,数据驱动的客户画像为解决 这一系列问题带来了可能。针对上述问题,客户画像通过收集海量用户信息来描 述用户的整体行为特征,可以帮助企业定位目标客户群,对有需求的客户进行个 性化精准营销。这样,企业和客户双方才能实现双赢。
[0004]客户画像基于用户在现实生活中的行为特征,从多个维度(如基本信息、特 征偏好、社交属性)抽象出标签,旨在尽可能全面地描述用户的整体行为特征。 简而言之本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于信息抽取和多属性决策的房地产客户画像方法,其特征在于:包括如下步骤:(1)从房地产领域各楼盘的客户数据中筛选包含客户基本信息的数据和对客户本人进行描述的数据;(2)以客户描述文本为输入,应用关键短语抽取模型提取文本语句中的关键短语;(3)联合步骤(2)中提取的短语,应用正则匹配模板匹配关键短语,进而提取关键信息作为基本信息的填补及扩充;(4)以行业内的专家知识为指导,以重教、扎根、聚巢等多个指标作为衡量客户的标签,并为这些指标分别分配对应的各客户属性的正负相关系数;(5)使用优化的熵值法,为客户的各属性计算权重;(6)使用步骤(4)和(5)运算得到的多个客户分析指标,确定客户的购买意愿。2.根据权利要求1所述的一种基于信息抽取和多属性决策的房地产客户画像方法,其特征在于:所述步骤(2)具体包括如下步骤:21).将文本数据中的句子进行分词、命名实体识别以及语义标注,得到一个形为d*s的单词矩阵M
w
和一个d*s的语义标注矩阵M
p
,其中d是文本总数目,s表示句子的最大长度。22).将词矩阵M
w
以及语义矩阵M
p
分别通过GloVe模型向量化后逐位拼接,得到一个d*s*e的向量化的文本表示矩阵X,其中e表示向量的维度,后续实验中该值设置为124。23).将关键短语提取任务看作序列标记任务,并使用“BIESOU”标记文本序列,其中B、I、E分别表示关键短语的开头、主体、结尾词,S表示构成关键短语的单个词,U表示处于关键短语内部的无用词,O表示其他词。24).使用深度学习的方法,训练一个双向长短期记忆网络(Bi

LSTM)+条件随机场(CRF)结构的神经网络作为关键短语提取的模型。25).将文本表示矩阵X输入神经网络模型中,模型输出得到d*s的序列标记矩阵L,最后通过解码算法提取出句子的若干关键短语。3.根据权利要求1所述的一种基于信息抽取和多属性决策的房地产客户画像方法,其特征在于:所述步骤(3)具体包括如下步骤:31).对每个需要填补的字段,构建一个v*p的正则匹配得分矩阵Q,其中v表示该字段的合法值的数目(包括空值),p表示为该字段设置的正则表达式的数目。32).对需要填补的字段,将p个正则表达式与步骤(2)中提取的关键短语匹配,得到一个p维的由0和1构成的匹配向量V
pt
。33).由正则匹配得分矩阵Q和匹配向量V
pt
得到该字段的最终的匹配值Value,随后将Value作为填补的候选值。具体计算公式如下:Value=Values[Argmax(V
pt
×
Q)]
ꢀꢀꢀꢀ
(1)其中,Values表示字段的合法值的列表,T表示矩阵转置操作。4.根据权利要求1所述的一种基于信息抽取和多属性决策的房地产客户画像方法,其特征在于:所述步骤(5)具体包括如下步骤:51).将客户信...

【专利技术属性】
技术研发人员:朱李楠徐翼飞许敏皓朱柘潮孔祥杰
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1