FPGA故障检测加速器的设计与实现
2025-02-14 12:43
No.1339940196074135552
技术概要
PDF全文
本技术涉及人工智能技术,提供了一种结合移位模块和AXI交叉矩阵的FPGA故障检测加速器设计。该设计采用GHOSTNETV2作为核心网络架构,其第一层主要负责卷积运算,以提高故障检测效率和准确性。
背景技术
深度学习的进步推动了包括故障诊断在内的各个跨学科领域的快速发展,这一进展不仅推高了GPU制造商的股价,还引发了新的讨论。尽管GPU具有诸多优点,但其高昂的成本和电力消耗导致它们并未得到广泛应用,因此在大多数实际工业环境中并不适用。因此,为了寻求更有效的部署方案,近几个月来,许多研究人员都在寻找替代方案。 人们普遍认为,迫切需要一种更高效、低功耗的加速器。然而,确定能够实现这一目标的硬件仍然是一个关键问题。一些公司已经直接开始了芯片制造过程(如谷歌的TPU、亚马逊的Inferentia和微软新发布的Maia),但漫长的芯片制造周期以及难以跟上快速演变的模型环境(如Maia的内存带宽受限)等挑战,构成了巨大的障碍。在通用处理器(CPU/GPU)和专用加速器(ASIC)之间,还存在另一种硬件选择:现场可编程门阵列(FPGA)。FPGA在可编程性和性能之间取得了优于通用处理器的平衡。然而,用FPGA支持前所未有的规模带来了巨大挑战,特别是在计算和内存资源方面。同时,设计能够实现低延迟和高能效的硬件加速器也至关重要,为FPGA确定合适的应用场景至关重要。为了充分发挥FPGA的潜力,必须考虑其可重构性。以往的研究曾尝试在FPGA上构建指令集体系结构(或覆盖层),但实际上,这种方法滥用了FPGA。一旦将特定的指令集实现为专用电路,将其转换为ASIC往往比使用FPGA更高效,这使得FPGA仅仅成为了一个实验原型,无法充分利用其可重构特性。CPU中使用的指令集体系结构等通常会因指令解码和多级内存访问而产生显著的性能和能耗开销。消除这些额外的开销可以大大提高硬件效率。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
董鑫  彭俊  罗志勇  董亮  孙立博
技术所属: 重庆邮电大学
相关技术
一种服务开发方法、装置、设备及存储介质 一种服务开发方法、装置、设备及存储介质
一种高精度双层优化方法的神经网络搜索架构构建方法 一种高精度双层优化方法的神经网络搜索架构构建方法
跨总线域的设备对宿主机空间DMA访问方法及相关设备 跨总线域的设备对宿主机空间DMA访问方法及相关设备
一种客户信息定期维护方法及系统 一种客户信息定期维护方法及系统
代码发布方法、装置、计算机设备和可读存储介质 代码发布方法、装置、计算机设备和可读存储介质
一种基于统一管理平台的子应用数据获取方法及装置 一种基于统一管理平台的子应用数据获取方法及装置
利用深度学习的BIM模型错误自动检测系统 利用深度学习的BIM模型错误自动检测系统
一种基于智能反射面的室内T型走廊场景路径损耗的分析方法 一种基于智能反射面的室内T型走廊场景路径损耗的分析方法
模型评估任务处理方法及装置 模型评估任务处理方法及装置
基于大数据的异常信号智能识别方法 基于大数据的异常信号智能识别方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利