当前位置: 首页 > 专利查询>达理专利>正文

一种基于人工智能的牙列畸形自动化分类和设计方法技术

技术编号:16403779 阅读:47 留言:0更新日期:2017-10-20 18:58
本发明专利技术提出一种基于人工智能的牙列畸形自动化分类和设计方法,通过自动识别并选取牙列特征点,确定实际牙弓,建立参照系统,比对参考牙弓确定单牙移动量和偏转量,动态拟合最佳牙列位置,采用马尔科夫决策结合深度学习、增强学习进行牙列设计,过程中不需要医生对牙弓进行设定,且对于错误或不精确进行自动修正,迭代保证错误提前被丢弃,实现不需要人工干预的牙列畸形自动化分类和设计。通过对特征点的分组,实现了咬合关系的对应,通过对牙齿宽度的计算,精确了牙齿间隙的计算。通过特征点信息的计算,使得牙齿的凸度,拥挤量得以精确计算。通过使用神经网络的深度学习,可以求解更优的设计方案。

【技术实现步骤摘要】
一种基于人工智能的牙列畸形自动化分类和设计方法
本专利技术涉及一种基于人工智能的牙列畸形自动化分类和设计方法。
技术介绍
现有的正畸设计软件,大多采取人工点选特征点,人工创建牙弓,以及医生参与设计病例治疗方案的方法对病例进行设计。本专利使用人工智能中深度学习和增强学习的方法对现行正畸设计技术实行更新。使用自动选取特征点,自动创建牙弓,以及自动设计治疗方案,并使用学习到的经验优化设计,减少了大量医生人为参与设计的时间和未来参与同类病例设计的时间。本专利通过帮助医生将病例的数据,参数化,设计的自动化,提升了生产力。
技术实现思路
本专利技术所解决的技术问题在于提供一种基于人工智能的牙列畸形自动化分类和设计方法,通过选取牙列特征点,确定实际牙弓,并比对参考牙弓确定单牙移动量和偏转量,采用马尔科夫决策结合深度学习进行牙列设计,实现不需要人工干预的牙列畸形自动化分类和设计。实现本专利技术目的的技术解决方案为:一种牙列特征点的选取方法,按照分类标准将28颗牙齿分别标记:1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,1-3,2-3,3-3,4-3,1-1,1-2,2-1,2-2,3-1,3-2,4-1,4-2;采取算法自动计算选取,将上下颌后槽牙分为组GroupA,包括1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,对于GroupA,使用环搜与局部最高点的算法选取GroupA尖点:(1)遍历单牙空间网格的点,找到离质心最近的点,记为点N;(2)对环绕点N边上的其他点进行递归运算,扩大环搜的边半径;(3)扩大边半径后,对最外层边上的点通过局部最大的算法寻找局部最高点,最高点即尖点;对于牙1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,各具有4个尖点,使用排序法选取外侧的2个尖点作为外侧组Ptbex,记为<下Ptbex1,上Ptbex2>,选取内侧的两个尖点作为内侧组Ptbin;对于1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,各具有2个尖点,使用排序法选取外侧的1个尖点作为外侧组Ptbex,记为Ptbex1;选取GroupA宽点:选取牙宽点,遍历单牙网格,选取两点,此两点与Ptbex及与Ptbin相距距离差最小,在距离差最小的组中选两点间距离最长的点组为宽点,宽点的坐标可以用来标定水平角度;将尖牙分为组GroupB,包括1-3,2-3,3-3,4-3,对于GroupB,使用四边之和最长以及最高点匹配算法选取GroupB尖点:(1)找到单牙空间网格的z轴最大点即为尖点,记为点Pt3h;遍历单牙空间网格上的点,迭代选取三个点形成一个集合,保留含有尖点Pt3h的集合;选取GroupB宽点:(2)迭代选取两个点,此两点与集合内尖点Pt3h的距离<d1,d2>,并计算与质心的距离<d3,d4>求距离和d1+d2+d3+d4;(3)对距离总和排序,选取距离比差的绝对值d1/d2-d3/d4最小,且距离和最大的那一对点,这一对点记为宽点;对于1-3,2-3,3-3,4-3,各具有1个尖点和2个宽点,牙尖点记为Pt3h;使用排序算法,确定2个宽点位置关系并分别记为上侧Ptb3up与下侧Ptb3down;将前牙分为组GroupC,包括1-1,1-2,2-1,2-2,3-1,3-2,4-1,4-2,对于GroupC,(1)遍历网格上的点,迭代选取2个点,计算这两个点与质心距离<d5,d6>及彼此之间的距离<d7>,求距离和d5+d6+d7;(2)排序选取距离比d5/d6最小且距离和d5+d6+d7最大的那一对点即为宽点;无尖点,GroupC宽点的选取分为单牙的左侧点和右侧点,使用排序法确定左侧点Ptbfl,右侧点Ptbfr。进一步的,本专利技术提出一种基于上述牙列特征点的牙弓确定方法,实际上牙弓为特征点:1-7(Ptbex1,Ptbex2),1-6(Ptbex1,Ptbex2),1-5(Ptbex1),1-4(Ptbex1),1-3(Ptb3down,Pt3h,Ptb3up),1-2(Ptbfl,Ptbfr),1-1(Ptbfl,Ptbfr),与2-1(Ptbfl,Ptbfr),2-2(Ptbfl,Ptbfr),2-3(Ptb3up,Pt3h,Ptb3down),2-4(Ptbex1),2-5(Ptbex1),2-6(Ptbex2,Ptbex1),2-7(Ptbex2,Ptbex1)的连线;实际下牙弓为特征点:4-7(Ptbex1,Ptbex2),4-6(Ptbex1,Ptbex2),4-5(Ptbex1),4(Ptbex1),4-3(Ptb3down,Pt3h,Ptb3up),4-2(Ptbfl,Ptbfr),4-1(Ptbfl,Ptbfr),与3-1(Ptbfl,Ptbfr),3-2(Ptbfl,Ptbfr),3-3(Ptb3up,Pt3h,Ptb3down),3-4(Ptbex1),3-5(Ptbex1),3-6(Ptbex2,Ptbex1),3-7(Ptbex2,Ptbex1)的连线。进一步的,本专利技术提出一种基于上述牙弓的牙齿矫正方法,对于实际上牙弓的特征点和实际下牙弓的特征点,均通过下式计算参考牙弓式中,y为Y轴坐标,x为X轴坐标,d为牙弓深度,w为牙弓宽度,d通过两前牙中间点平均坐标与左边牙7与右边牙7的质心点全局坐标中点的差进行求取,牙弓宽度w由左边牙7与右边牙7的质心点全局坐标差求得;在每颗牙齿的质心处,建立局部坐标系;将单牙绑定局部坐标系,获取并检测每颗牙的移动量与偏转量:(1)在水平方向,计算各特征点与参考牙弓的对应点的角度,计算顺时针方向或逆时针方向的旋转角度,旋转角度数值除以2,得到偏转周期一;(2)在水平方向,计算特征点组与绝对水平位置的角度,计算根唇向旋转角度,旋转角度数值除以2,得到偏转周期二;(3)在水平方向,计算特征点组与参考牙弓的对应点的舍颊向距离,得到舌颊向移动量,用移动量数值除以0.2,得到移动周期一;(4)在水平方向,计算特征点组与参考牙弓的对应点的近远中向距离,得到近远中向移动量,用移动量数值除以0.2,得到移动周期二;(5)在垂直方向,计算每颗牙的质心坐标,求取平均,计算每颗牙的拉伸/下压移动量,用移动量数值除以0.2,得到移动周期三;(6)在垂直方向,计算特征点组的两个点中点与垂直于平面的角度,计算冠轴旋转角度,用旋转角度数值除以2,得到偏转周期三;(7)获取理想咬合的偏移量:上颌质心点与下颌外侧点对齐,上颌内侧点与下颌质心点对齐;最后按照理想移动量和偏转量对单牙进行矫正设计。进一步的,本专利技术的牙齿矫正方法,通过对模型不断迭代,更新特征点的位置,求得理想位置,并将整个迭代过程记录下的操作进行比对处理,去除相反操作,获得最优策略。进一步的,本专利技术的牙齿矫正方法,参考牙弓的计算是通过式(1)的反复迭代得出。进一步的,本专利技术的牙齿矫正方法,完成所有矫正操作后,重新更新特征点并建立新的实际牙弓和参考牙弓,判断新的实际牙弓与通过式(1)求得新的参考牙弓是本文档来自技高网...
一种基于人工智能的牙列畸形自动化分类和设计方法

【技术保护点】
一种牙列特征点的选取方法,按照分类标准将28颗牙齿分别标记:1‑4,2‑4,3‑4,4‑4,1‑5,2‑5,3‑5,4‑5,1‑6,2‑6,3‑6,4‑6,1‑7,2‑7,3‑7,4‑7,1‑3,2‑3,3‑3,4‑3,1‑1,1‑2,2‑1,2‑2,3‑1,3‑2,4‑1,4‑2;其特征在于采取算法自动计算选取,将上下颌后槽牙分为组GroupA,包括1‑4,2‑4,3‑4,4‑4,1‑5,2‑5,3‑5,4‑5,1‑6,2‑6,3‑6,4‑6,1‑7,2‑7,3‑7,4‑7,对于GroupA,使用环搜与局部最高点的算法选取GroupA尖点:(1)遍历单牙空间网格的点,找到离质心最近的点,记为点N;(2)对环绕点N边上的其他点进行递归运算,扩大环搜的边半径;(3)扩大边半径后,对最外层边上的点通过局部最大的算法寻找局部最高点,最高点即尖点;对于牙1‑6,2‑6,3‑6,4‑6,1‑7,2‑7,3‑7,4‑7,各具有4个尖点,使用排序法选取外侧的2个尖点作为外侧组Ptbex,记为<下Ptbex1,上Ptbex2>,选取内侧的两个尖点作为内侧组Ptbin;对于1‑4,2‑4,3‑4,4‑4,1‑5,2‑5,3‑5,4‑5,各具有2个尖点,使用排序法选取外侧的1个尖点作为外侧组Ptbex,记为Ptbex1;选取GroupA宽点:选取牙宽点,遍历单牙网格,选取两点,此两点与Ptbex及与Ptbin相距距离差最小,在距离差最小的组中选两点间距离最长的点组为宽点,宽点的坐标可以用来标定水平角度;将尖牙分为组GroupB,包括1‑3,2‑3,3‑3,4‑3,对于GroupB,使用四边之和最长以及最高点匹配算法选取GroupB尖点:(1)找到单牙空间网格的z轴最大点即为尖点,记为点Pt3h;遍历单牙空间网格上的点,迭代选取三个点形成一个集合,保留含有尖点Pt3h的集合;选取GroupB宽点:(2)迭代选取两个点,此两点与集合内尖点Pt3h的距离<d1,d2>,并计算与质心的距离<d3,d4>求距离和d1+d2+d3+d4;(3)对距离总和排序,选取距离比差的绝对值d1/d2‑d3/d4最小,且距离和最大的那一对点,这一对点记为宽点;对于1‑3,2‑3,3‑3,4‑3,各具有1个尖点和2个宽点,牙尖点记为Pt3h;使用排序算法,确定2个宽点位置关系并分别记为上侧Ptb3up与下侧Ptb3down;将前牙分为组GroupC,包括1‑1,1‑2,2‑1,2‑2,3‑1,3‑2,4‑1,4‑2,对于GroupC,(1)遍历网格上的点,迭代选取2个点,计算这两个点与质心距离<d5,d6>及彼此之间的距离<d7>,求距离和d5+d6+d7;(2)排序选取距离比d5/d6最小且距离和d5+d6+d7最大的那一对点即为宽点;无尖点,GroupC宽点的选取分为单牙的左侧点和右侧点,使用排序法确定左侧点Ptbfl,右侧点Ptbfr。...

【技术特征摘要】
1.一种牙列特征点的选取方法,按照分类标准将28颗牙齿分别标记:1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,1-3,2-3,3-3,4-3,1-1,1-2,2-1,2-2,3-1,3-2,4-1,4-2;其特征在于采取算法自动计算选取,将上下颌后槽牙分为组GroupA,包括1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,对于GroupA,使用环搜与局部最高点的算法选取GroupA尖点:(1)遍历单牙空间网格的点,找到离质心最近的点,记为点N;(2)对环绕点N边上的其他点进行递归运算,扩大环搜的边半径;(3)扩大边半径后,对最外层边上的点通过局部最大的算法寻找局部最高点,最高点即尖点;对于牙1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,各具有4个尖点,使用排序法选取外侧的2个尖点作为外侧组Ptbex,记为<下Ptbex1,上Ptbex2>,选取内侧的两个尖点作为内侧组Ptbin;对于1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,各具有2个尖点,使用排序法选取外侧的1个尖点作为外侧组Ptbex,记为Ptbex1;选取GroupA宽点:选取牙宽点,遍历单牙网格,选取两点,此两点与Ptbex及与Ptbin相距距离差最小,在距离差最小的组中选两点间距离最长的点组为宽点,宽点的坐标可以用来标定水平角度;将尖牙分为组GroupB,包括1-3,2-3,3-3,4-3,对于GroupB,使用四边之和最长以及最高点匹配算法选取GroupB尖点:(1)找到单牙空间网格的z轴最大点即为尖点,记为点Pt3h;遍历单牙空间网格上的点,迭代选取三个点形成一个集合,保留含有尖点Pt3h的集合;选取GroupB宽点:(2)迭代选取两个点,此两点与集合内尖点Pt3h的距离<d1,d2>,并计算与质心的距离<d3,d4>求距离和d1+d2+d3+d4;(3)对距离总和排序,选取距离比差的绝对值d1/d2-d3/d4最小,且距离和最大的那一对点,这一对点记为宽点;对于1-3,2-3,3-3,4-3,各具有1个尖点和2个宽点,牙尖点记为Pt3h;使用排序算法,确定2个宽点位置关系并分别记为上侧Ptb3up与下侧Ptb3down;将前牙分为组GroupC,包括1-1,1-2,2-1,2-2,3-1,3-2,4-1,4-2,对于GroupC,(1)遍历网格上的点,迭代选取2个点,计算这两个点与质心距离<d5,d6>及彼此之间的距离<d7>,求距离和d5+d6+d7;(2)排序选取距离比d5/d6最小且距离和d5+d6+d7最大的那一对点即为宽点;无尖点,GroupC宽点的选取分为单牙的左侧点和右侧点,使用排序法确定左侧点Ptbfl,右侧点Ptbfr。2.一种基于权利要求1所述牙列特征点的牙弓确定方法,其特征在于实际上牙弓为特征点:1-7(Ptbex1,Ptbex2),1-6(Ptbex1,Ptbex2),1-5(Ptbex1),1-4(Ptbex1),1-3(Ptb3down,Pt3h,Ptb3up),1-2(Ptbfl,Ptbfr),1-1(Ptbfl,Ptbfr),与2-1(Ptbfl,Ptbfr),2-2(Ptbfl,Ptbfr),2-3(Ptb3up,Pt3h,Ptb3down),2-4(Ptbex1),2-5(Ptbex1),2-6(Ptbex2,Ptbex1),2-7(Ptbex2,Ptbex1)的连线;实际下牙弓为特征点:4-7(Ptbex1,Ptbex2),4-6(Ptbex1,Ptbex2),4-5(Ptbex1),4(Ptbex1),4-3(Ptb3down,Pt3h,Ptb3up),4-2(Ptbfl,Ptbfr),4-1(Ptbfl,Ptbfr),与3-1(Ptbfl,Ptbfr),3-2(Ptbfl,Ptbfr),3-3(Ptb3up,Pt3h,Ptb3down),3-4(Ptbex1),3-5(Ptbex1),3-6(Ptbex2,Ptbex1),3-7(Ptbex2,Ptbex1)的连线。3.一种基于权利要求2所述牙弓的牙齿矫正方法,其特征在于对于实际上牙弓的特征点和实际下牙弓的特征点,均通过下式计算参考牙弓式中,y为Y轴坐标,x为X轴坐标,d为牙弓深度,w为牙弓宽度,d通过两前牙中间点平均坐标与左边牙7与右边牙7的质心点全局坐标中点的差进行求取,牙弓宽度w由左边牙7与右边牙7的质心点全局坐标差求得;在每颗牙齿的质心处,建立局部坐标系;将单牙绑定局部坐标系,获取并检测每颗牙的移动量与偏转量:(1)在水平方向,计算各特征点与参考牙弓的对应点的角度,计算顺时针方向或逆时针方向的旋转角度,旋转角度数值除以2,得到偏转周期一;(2)在水平方向,计算特征点组与绝对水平位置的角度,计算根唇向旋转角度,旋转角度数值除以2,得到偏转周期二;(3)在水平方向,计算特征点组与参考牙弓的对应点的舍颊向距离,得到舌颊向移动量,用移动量数值除以0.2,得到移动周期一;(4)在水平方向,计算特征点组与参考牙弓的对应点的近远中向距离,得到近远中向移动量,用移动量数值除以0.2,得到移动周期二;(5)在垂直方向,计算每颗牙的质心坐标,求取平均,计算每颗牙的拉伸/下压移动量,用移动量数值除以0.2,得到移动周期三;(6)在垂直方向,计算特征点组的两个点中点与垂直于平面的角度,计算冠轴旋转角度,用旋转角度数值除以2,得到偏转周期三;(7)获取理想咬合的偏移量:上颌质心点与下颌外侧点对齐,上颌内侧点与下颌质心点对齐;最后按照理想移动量和偏转量对单牙进行矫正设计。4.根据权利要求3所述的牙齿矫正方法,其特征在于通过对模型不断迭代,更新特征点的位置,求得理想位置,并将整个迭代过程记录下的操作进行比对处理,去除相反操作,获得最优策略。5.根据权利要求3所述的牙齿矫正方法,其特征在于参考牙弓的计算是通过式(1)的反复迭代得出。6.根据权利要求3所述的牙齿矫正方法,其特征在于完成所有矫正操作后,重新更新特征点并建立新的实际牙弓和参考牙弓,判断新的实际牙弓与通过式(1)求得新的参考牙弓是否重合:若重合则退出;若不重合,基于新的参考牙弓获取并检测每颗牙的偏转量与偏转量;以上步骤循环迭代直至退出。7.根据权利要求3所述的牙齿矫正方法,其特征在于自动粘贴附件,对每颗牙的空间网格,在质心处垂直牙弓线的方向上与牙体的网格求取交点,此交点为附件或矫治器的位置。8.一种基于权利要求3所述牙齿矫正的牙列分类方法,其特征在于根据凸度和拥挤量进行减数或非减数分类:根据双尖牙区实际宽度总和与参考牙弓对应弧度值差计算拥挤量;将双尖牙区每颗牙的质心与两侧中点连线,根据上下对应前牙连线的夹角计算凸度;根据上下对应双尖牙区的质心间距线与水平方向的角度确定咬合角度;对凸度小于115度且拥挤量小于6mm的单牙采取减数设计,对凸度大于115度小于120度且拥挤量小于3mm的单牙采取非减数设计,或对凸度大于115度小于120度且拥挤量小于2mm的单牙采取减径设计;在不发生碰撞的前提下,根据偏移量和旋转量进行分解操作:(1)将实际牙弓线上的单牙初始位置PosStart设为初始状态,参考牙弓线上的对应位置PosFine设为最终位置;(2)对移动的先后顺序,根据减数或非减数治疗的方式更新单牙各方向的移动量和旋转量;(3)根据移动量和旋转量将单牙的特征点向参考牙弓进行移动或旋转操作:每个单牙的移动操作包括舌颊向内外移动、前后移动、压伸移动,每个单牙的旋转操作包括根唇向内外旋转、冠轴向左右旋转和水平方向顺逆旋转;(4)更新局部坐标系,再向PosFine进行移动和旋转,直到所有的移动和旋转完成;(5)计算新的实际牙弓,若新实际牙弓与按照式(1)计算的新参考牙弓重合,则设计结束;否则回到(3)。9.一种基于权利要求8所述牙列分类的牙列设计方法,其特征在于采用马尔科夫决策,将每颗单牙视为一个Agent,向最佳位置移动的每一步为一个新的位置状态State,记为S,经过以下操作向参考牙弓进行移动或旋转:每个单牙的移动操作包括舌颊向内外移动、前后移动、压伸移动,每个单牙的旋转操作包括根唇向内外旋转、冠轴向左右旋转、水平方向顺逆旋转;每个操作为一个Action,记为A,每一个Action都会有一个奖励Reward,记为R,移动到最佳位置的操作序列为策略Policy,对于每一个Agent,经过Action达到不同的状态,学习过程如下:U(S)+=a(R(S)+γmaxQ(A',S')-Q(A,S))其中,U代表经验值总和,Q代表经验值,γ代表衰减率,a代表学习效率;然后进行不使用神经网络的增强学习设计,或进行使用神经网络的深度增强学习设计,或通过其他的病例学习到的经验进行设计:其中,不使用神经网络的机器学习的步骤一个循环包括:(1)根据单牙的偏移信息及具体操作信息,创建一个操作表,包含每个单牙的移动和偏转对应操作,并设置初始参数,Rd为奖励的衰减率,Rd∈[1,0.1],EG为贪心率,EG∈[0,1],LR为学习率,LR∈[0,1],Reward的值取-1或0或1,其中1为单牙操作完成,-1为碰撞,0为完成当前操作;(2)创建一个经验表用于记录状态信息、操作和操作奖励的经验值;创建一个循环,读入每个牙齿的位置信息,全局坐标记为初始状态;(3)对需要移动的单牙在可选Action序列中选择一个Action,随机选取EG的值,若小于EG设定值,则在经验表中选取评估值最大的操作动作,若大于EG设定值,则在Action中随机选取一个操作动作,记录当前状态S和完成该操作动作的状态S’;(4)执行牙齿移动的操作,使用碰撞检测,确定Reward值;(5)学习这个操作,从经验表中取出当前状态S这个操作的经验值作为预测值,并更新目标值,若还有操作未完成,则目标值为Reward加上衰减值Rd乘以该操作对应状态的最大经验值;若操作已经完成,则目标值等于奖励Reward,更新经验表中状态对应的预测值为当前的预测值加上学习效率乘以误差,所述误差为目标值减去预测值;更新下一状态为当前状态加上上述操作;(6)返回步骤(3)循环操作至所有单牙操作完成;经过多次循环后,将得分最高、碰撞最少的操作序列选取为最优的策略;使用神经网络的机器学习的步骤包括:(1)根据单牙的偏移信息及具体操作信息,创建一个操作表,包含每个单牙的移动和偏转对应操作,并设置初始参数,Rd为奖励的衰减率,Rd∈[1,0.1],EG为贪心率,EG∈[0,1],LR为学习率,LR∈[0,1],Reward的值取-1或0或1,其中1为单牙操作完成,-1为碰撞,0为完成当前操作;(2)创建结构相同的评估网络和目标网络,每个网络均包括L1层和L2层,评估网络用于训练且有反向传递,目标网络用于保存训练的结果但没有反向传递,评估网络能及时更新参数,其输入参数为当前状态S和状态的现实值,其中状态的现实值由目标网络训练得到,通过对当前状态的训练,得到一个状态的预测值,预测值与现实值的差异为误差,将误差反向传递到评估网络,提升评估网络的参数;目标网络不及时更新参数,其输入参数为下一个状态S’,其结构与评估网络一致,当评估网络运行到一定的次数,则将结果保存至目标网络;(3)创建一个循环,读入每个牙齿的位置信息,全局坐标记为初始状态;(4)对需要移动的单牙在可选Action序列中选择一个Action,随机选取EG的值,若小于EG设定值,则在经验表中选取评估值最大的操作动作,若大于EG设定值,则在Action中随机选取一个操作动作,记录当前状态S和完成该操作动作的状态S’;(5)执行牙齿移动的操作,使用碰撞检测,确定Reward值;保存当前状态、下一个状态、动作及奖励至内存模块;(6)从内存模块中抽取参数,使用评价网络进行学习训练:首先将目标网络的参数更新成最新的估计参数,从内存中随机抽取样本,从评价网络中获取新的经验值,从目标网络中获取老的经验值,将两经验值相减并反向传递给评估网络进行梯度下降的训练;(7)返回步骤(4)循环操作至所有单牙操作完成;经过多次循环后,将得分最高、碰撞最少的操作序列选取为最优的策略;通过机器学习进行经验设计:(1)根据单牙的分类信息及具体操作信息,创建一个操作表,包含每个单牙的移动和偏转对应操作,并设置初始参数,Rd为奖励的衰减率,Rd∈[1,0.1],EG为贪心率,EG∈[0,1],LR为学习率,LR∈[0,1],Reward的值取-1或0或1,其中1为单牙操作完成,-1为碰撞,0为完成当前操作;(2)创建一个经验表用于记录状态信息、操作和操作奖励的经验值;创建一个循环,读入每个牙齿的位置信息,全局坐标记为初始状态;(3)对所有需要移动的单牙,获取每个单牙所需的操作指令,形成操作指令表,从经验表或神经网络中选取经验值最大且属于当前病例操作指令表的操作;对于操作表中有但经验表或神经网络中没有的操作,在可选的Action序列中选择一个Action,随机选取EG的值,若小于EG设定值,则在经验表中选取评估值最大的操作动作,若大于EG设定值,则在Action中随机选取一个操作动作,记录当前状态S和完成该操作动作的状态S’;(4)执行牙齿移动的操作,使用碰撞检测,确定Reward值;(5)学习这个操作,从经验表或神经网络中取出当前状态S这个操作的经验值作为预测值,并更新目标值,若还有操作未完成,则目标值为Reward加上衰减值Rd乘以该操作对应状态的最大经验值;若操作已经完成,则目标值等于奖励Reward,更新经验表或神经网络中状态对应的预测值为当前的预测值加上学习效率乘以误差,所述误差为目标值减去预测值;...

【专利技术属性】
技术研发人员:达理达式金
申请(专利权)人:达理
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1