IMU与RGB-D融合技术在建筑实时三维建模中的应用 IMU与RGB-D融合技术在建筑实时三维建模中的应用
本技术公开了一种IMU与RGB‑D融合驱动的建构筑物实时三维建模方法与系统,属于三维重建领域,解决现有技术采用固定采样率的问题。本发明基于室外场景实时采集RGB‑D相机的数据,包括IMU传感器采集的IMU数据、相机采集的深度图像、彩色图像和相机位姿;基于IMU数据的自适应采样率调整算法动态调整RGB‑D相机的采样率后,RGB‑D相机扫描建构筑物获取RGB‑D相机的数据;基于上述结果和动态特征感知位姿解算优化算法识别并剔除动态特征点,得到RGB‑D相机的静态特征位姿;基于RGB‑D相机的静态特征位姿和点云综合精度评估对深度图像和彩色图像对应的点云进行渐进式点云替换,并结合结构特征约束进行真实纹理的室外场景渐进式三维建模。本发明用于建构筑物实时三维建模。
基于先验知识增强的医学图像分类技术 基于先验知识增强的医学图像分类技术
本技术属于计算机视觉技术领域,具体涉及一种基于先验知识增强掩码与对齐建模的医学图像分类方法;包括:获取图像文本对数据集并对其进行预处理,得到预处理好的图像文本对数据集;根据预处理好的图像文本对数据集对视觉编码器和文本编码器进行初步训练,得到初步训练好的视觉编码器和文本编码器;结合文本编码器对视觉编码器进行第二次训练,得到训练好的视觉编码器;采用训练好的视觉编码器实现对医学图像的分类;本发明提出的模型能够更好地泛化到各种下游医学图像识别任务上,提高下游医学图像识别任务的准确度。
肝脏肿瘤精准分割技术:SCAF-TransUNet应用 肝脏肿瘤精准分割技术:SCAF-TransUNet应用
本技术公开了一种基于SCAF‑TransUNet的肝脏肿瘤分割方法,首先,SLIC超像素预处理通过将肝脏图像分割为语义相关的超像素区域,使模型能够更准确地聚焦于肿瘤等关键区域,减少计算冗余,提升特征提取的效率和精度。其次,在跳跃连接中引入的CECA模块通过一维卷积替代传统全连接层,简化了通道间的注意力机制,增强了通道依赖关系的捕捉,同时保持了特征提取的精度。最后,在解码器中加入FPN,进一步增强了多尺度特征的融合能力。FPN通过逐层融合不同分辨率的特征图,使得模型在上采样前就能有效结合全局语义信息和局部细节特征,提升对复杂肝脏边界和细小肿瘤的处理能力。最终,这些改进显著提高了肝脏肿瘤分割任务的准确性和稳健性。
神经辐射场与语义分割技术在路面裂缝检测中的应用 神经辐射场与语义分割技术在路面裂缝检测中的应用
本技术公开了一种基于神经辐射场和语义分割网络的路面裂缝提取方法,具体涉及道路工程技术领域,通过无人机获取研究区域路面图像数据并进行预处理形成所需的图像数据集,通过运动恢复结构多视图立体视觉算法和神经辐射场算法结合对预处理后的图像数据集进行三维重建得到路面点云模型以及点云数据集,通过构建语义分割网络并训练点云数据集,根据语义分割结果完成路面裂缝信息的提取与计算,与现有技术相比,降低了检测成本,满足了实时检测需求,还明显改进了现有点云处理自动化、表达性差及应用不足等现状,此外还能够直观、准确地表征存在裂缝的道路场景,从而为路面信息数字化表示提供底层平台与数据支撑。
轻量级高精度人体姿态估计技术:Mamba架构革新 轻量级高精度人体姿态估计技术:Mamba架构革新
本技术公开了一种基于Mamba架构的轻量级高精度人体姿态估计方法,属于人体姿态估计技术领域,本发明通过设计轻量级神经网络架构来降低计算成本,同时实现了高精度的人体姿态估计。本发明方法首先构建Mamba架构的人体姿态估计网络,利用轻量化特征提取模块在保证实时性的同时增强关键点检测能力;训练阶段,使用多样化人体姿态数据集对网络进行训练,保证其对各种姿态和场景的适应性;测试阶段,通过轻量化的网络模型实现实时人体姿态估计,与传统方法相比,该发明的网络模型设计简洁,极大地减少了网络的参数量和浮点运算数,在增强模型实时性的同时,显著提升了姿态估计的精度,适用于资源受限的设备或实时应用场景。
深度学习驱动的耳镜图像分析系统开发 深度学习驱动的耳镜图像分析系统开发
本技术提供了基于深度学习建立数据库模型分析的耳镜图像处理系统,涉及图像处理技术领域,包括采集层、处理层、提取层、建模层和分析层,所述采集层用于连接采集设备采集患者耳部图像,所述处理层采用AI扩图算法对采集的图像进行融合拼接,以及消除干扰处理,所述提取层采用混合特征提取法,提取处理层处理后图像的颜色、纹理、形状特征,并引入MPEG‑7描述符对上述特征进行表示;本发明收集患者耳镜图像,提取图像的特征和特征值,通过深度学习建模构建病灶全局共享图像库,与患者耳镜图像对比训练,确定相应的病灶,由此,通过学习和分析大量的耳部图像数据,能够自动识别和诊断不同的耳部疾病,为医生提供更为准确和及时的诊断信息。
动态场景下基于图像差分和粒子滤波的RGB-D SLAM技术 动态场景下基于图像差分和粒子滤波的RGB-D SLAM技术
本技术涉及自主导航下的视觉SLAM技术领域,且公开了一种基于图像差分和粒子滤波的动态场景RGB‑D SLAM方法,首先,基于FAST特征和BRIEF描述子的视觉SLAM匹配特征点,引入PROSAC算法进行匹配优化。其次,基于优化的匹配点集计算基础矩阵,将前一帧RGB图像重投影到当前图像,通过差分两张图像来粗略检测物体运动。再次,基于粒子滤波跟踪以增强物体运动检测,具体的,将差分图像信息用作粒子滤波的测量信息,更新粒子的权重,从而优化移动对象位置估计。在每次迭代中,计算移动对象位置的MAP估计。进而,通过矢量量化深度图来进一步优化检测结果,以精确地分割移动对象。最后,通过移除位于分割区域中的特征,为实现相机精确自运动估计,以及有效建图提供基础。
YOLOv8驱动的煤矿工作面状态监测技术 YOLOv8驱动的煤矿工作面状态监测技术
本技术公开了一种基于YOLOv8的采煤工作面工作状态检测方法,所述方法包括如下步骤:步骤1:获取采煤工作面所有工作状态的数据集;步骤2:构建YOLOv8‑EST网络;步骤3:将采煤工作面工作状态数据集输入改进的YOLOv8模型中进行训练,得到采煤工作面工作状态检测模型;步骤4:将待识别采煤工作面状态图片输入采煤工作面工作状态检测模型中,得到待识别采煤工作面工作状态的检测结果。本发明通过采用YOLOv8目标检测算法,融合改进的Swin Transformer模块,并融入EMA注意力机制,构建出改进的YOLOv8目标检测算法,实现对采煤工作面工作状态的实时、高效、准确的检测,提高生产安全性和效率。
计算机视觉技术在智能结构位移检测中的应用 计算机视觉技术在智能结构位移检测中的应用
本技术公开了一种基于计算机视觉的智能非接触式结构位移检测方法,属于深度学习领域,该方法包括:获取含有位移标靶的第一图像,基于YOLOv7算法建立第一识别模型,使用第一识别模型对第一图像进行处理,获得位移标靶的识别结果;基于DeepSORT算法构建位移标靶的跟踪网络,将识别结果输入跟踪网络,形成位移标靶的运动轨迹;基于IPM‑ED方法构建结构位移解析网络,结构位移解析网络对运动轨迹进行解析,生成位移标靶的实际结构位移;基于实际结构位移形成位移标靶的第一时程曲线,对比第一时程曲线和第一测量曲线,获得结构位移检测效果。通过本发明提升了非接触式位移检测的精度。
创新无源双基地雷达系统与检测技术 创新无源双基地雷达系统与检测技术
本技术涉及一种无源双基地雷达微弱目标检测系统及方法,属于目标检测技术领域。为了解决现有技术中无源双基地雷达系统检测概率低的问题,该目标检测系统,包括获取模块,用于获取无源双基地雷达微弱目标PPI图像数据集;预处理模块,用于对获取模块获得的数据集中的数据进行数据加载与预处理;改进的YOLOv8网络模型,用于对预处理模块处理后的数据进行检测。使用该系统的检测方法能更有效地区分微弱信号和背景噪声,提高了检测的精确度。
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工