The invention discloses a method to automatically relate the financial news to the stock, which includes the use of the annotated data and the data to be processed to deal with the original financial news information, and preprocess the original financial news information, including the data form that converts the original financial information data to the subsequent depth of learning. The multi-dimensional vector form and so on; using the multi label classification model, the financial news information after the pre processing is studied deeply; the new financial information information is processed with the trained model, and the relationship between the financial news information and the stock is automatically related; thus the realization can be realized with the way of combining the word segmentation and the deep learning party. It realizes the high accuracy of automatically linking the original financial news information to the related stocks, so that users can get the omnidirectional information of the concerned stocks.
【技术实现步骤摘要】
一种实现财经新闻自动关联到股票的方法
本专利技术涉及股票
,尤其涉及一种实现财经新闻自动关联到股票的方法。
技术介绍
个股新闻,指的是关联到具体股票的财经新闻。自动关联,指的是从数据提供商得到的原始新闻未关联到股票或未充分关联到所有应当关联的股票或关联到了错误的股票,用程序策略自动增加/修正这种关联关系的过程称为自动关联。现有的财经新闻自动关联到股票的方案,包括:方案一,人工关联:通过人工判断增加/修正文章与股票关联,缺点是人力成本巨大。方案二,基于关键词关联:每只股票预设固定的几个关键词,例如股票名称可做为关键词,如果文章标题或内容出现相应关键词则视为有关联,本方案二的缺点在于:1、关键词靠人工维护,往往不完整;2、因为只是机械匹配,错误率会较高,例如易将“易联众(300096.SZ)”公司的新闻关联到“联众(06899.HK)”下。
技术实现思路
本专利技术提供一种实现财经新闻自动关联到股票的方法,用以解决现有技术存在的关键词靠人工维护,往往不完整,因为只是机械匹配,错误率较高的技术问题。为解决上述技术问题,本专利技术提供一种实现财经新闻自动关联到股票的方法,其特征在于,包括:采用标注数据和待处理数据的方式,处理原始财经新闻信息;预处理所述原始财经新闻信息,包括将所述原始财经新闻信息数据转换为方便后续深度学习的数据形式包括多维向量形式;采用多标签分类模型的方式,深度学习所述经预处理后的财经新闻信息;应用训练好的模型,对新的财经新闻信息进行处理,自动关联财经新闻信息与股票的关系。其中,所述预处理所述原始财经新闻信息,包括将所述原始财经新闻信息数据转换为 ...
【技术保护点】
1.一种实现财经新闻自动关联到股票的方法,其特征在于,包括:采用标注数据和待处理数据的方式,处理原始财经新闻信息;预处理所述原始财经新闻信息,包括将所述原始财经新闻信息数据转换为方便后续深度学习的数据形式包括多维向量形式;采用多标签分类模型的方式,深度学习所述经预处理后的财经新闻信息;应用训练好的模型,对新的财经新闻信息进行处理,自动关联财经新闻信息与股票的关系。
【技术特征摘要】
1.一种实现财经新闻自动关联到股票的方法,其特征在于,包括:采用标注数据和待处理数据的方式,处理原始财经新闻信息;预处理所述原始财经新闻信息,包括将所述原始财经新闻信息数据转换为方便后续深度学习的数据形式包括多维向量形式;采用多标签分类模型的方式,深度学习所述经预处理后的财经新闻信息;应用训练好的模型,对新的财经新闻信息进行处理,自动关联财经新闻信息与股票的关系。2.如权利要求1所述的实现财经新闻自动关联到股票的方法,其特征在于,所述预处理所述原始财经新闻信息,包括将所述原始财经新闻信息数据转换为方便后续深度学习的数据形式包括多维向量形式,包括:针对原始财经新闻信息,移除html标签:原始财经新闻信息一般而言是html文档,html标签对后续模型训练及应用都没有作用,故需移除掉;针对原始财经新闻信息,分词与去除停用词:分词后方便制作词典,去除停用词以便降低后续运算量;针对原始财经新闻信息,制作词典;将所述原始财经新闻信息数据转换为方便后续深度学习的数据形式包括多维向量形式。3.如权利要求2所述的实现财经新闻自动关联到股票的方法,其特征在于,所述针对原始财经新闻信息,移除html标签,包括:针对原始财经新闻信息,采用ES的htmlstrip-charfilter方式,移除html标签。4.如权利要求2所述的实现财经新闻自动关联到股票的方法,其特征在于,所述针对原始财经新闻信息,分词与去除停用词,包括:针对原始财经新闻信息,采用ES的ik分词器的方式,分词与去除停用词。5.如权利要求2所述的实现财经新闻自动关联到股票的方法,其特征在于,所述针对原始财经新闻信息,制作词典,包括:针对原始财经新闻信息,粗粒度筛选关键词;根据所述粗粒度筛选出的关键词,生成词典。6.如权利要求5所述...
【专利技术属性】
技术研发人员:侯红君,陈文涛,
申请(专利权)人:深圳市富途网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。