【技术实现步骤摘要】
本专利技术属于感知导盲,具体涉及一种兼顾自定位和目标导向的多模态感知导盲系统。
技术介绍
1、面向盲人环境感知的辅助技术研究中,主要涵盖两个关键环节。其一为环境信息的获取,随着当下机器视觉技术的蓬勃发展,为这一环节提供了多样化的解决方案,从目标检测到场景解析,各类先进的算法不断涌现,实现了对复杂环境的精准感知。其二则是将获取的信息有效传输给用户,目前存在着多种模态策略可供选择,涵盖语音、音频、振动以及电刺激等不同形式。其中,语音模态因其天然依附于文字,这使得信息的表达具备更高的密度与准确性。加之近年来视觉语言大模型取得了长足发展。虽然定制个性化模型需要大量的训练(daniel fried,ronghang hu,volkan cirik,anna rohrbach,jacob andreas,louis-philippe morency,taylor berg-kirkpatrick,kate saenko,dan klein,andtrevor darrell.(2018)speaker-follower models forvisi
...【技术保护点】
1.一种兼顾自定位和目标导向的多模态感知导盲系统,其特征在于,所述系统包括多模态交互模块、空间映射模块、规划引导模块和轨迹跟踪模块,其中:
2.根据权利要求1所述的一种兼顾自定位和目标导向的多模态感知导盲系统,其特征在于,所述多模态交互模块的硬件部分包括集成了麦克风的耳机以及相机。
3.根据权利要求2所述的一种兼顾自定位和目标导向的多模态感知导盲系统,其特征在于,所述空间映射模块的软件部分包括大语言模型和Yolact深度学习模型;
4.根据权利要求3所述的一种兼顾自定位和目标导向的多模态感知导盲系统,其特征在于,所述规划引导模块的工
<...【技术特征摘要】
1.一种兼顾自定位和目标导向的多模态感知导盲系统,其特征在于,所述系统包括多模态交互模块、空间映射模块、规划引导模块和轨迹跟踪模块,其中:
2.根据权利要求1所述的一种兼顾自定位和目标导向的多模态感知导盲系统,其特征在于,所述多模态交互模块的硬件部分包括集成了麦克风的耳机以及相机。
3.根据权利要求2所述的一种兼顾自定位和目标导向的多模态感知导盲系统,其特征在于,所述空间映射模块的软件部分包括大语言模型和yolact深度学习模型;
4.根据权利要求3所述的一种兼顾自定位和目标导向的多模态感知导盲系统,其特征在于,所述规划引导模块的工作过...
【专利技术属性】
技术研发人员:姜力,李宇慧,李正辰,程明,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。