【技术实现步骤摘要】
【技术保护点】
基于文本语义挖掘的标准化自动建档方法, 其特征在于:将文本语义分析相关技术——信息抽取、关键词提取、自动摘要技术,应用到有一定的内容和格式要求的文本中,形成一种文档标准化自动建档的方法;所述信息抽取,主要是采用自然语言处理方法,首先人工抽取规则,然后对法律文本进行句法和语义分析,采用基于python的正则表达式的方法实现自动化抽取;所述关键词提取,主要是应用基于语义和统计相结合的方法,用基于HowNet的词语相似度计算词语相似度,筛选后形成关键词,并建立关键词索引;所述自动摘要,首先从文本中抽取包含摘要信息的句子,然后计算句子间的相似度,合并句子形成摘要信息。
【技术特征摘要】
【专利技术属性】
技术研发人员:程宏亮,梁栋,卢耀宗,强劲,张兵,刘华兴,张小平,
申请(专利权)人:西安美林数据技术股份有限公司,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。