一种基于高频特征增强的神经表示视频编码方法

123技术园

首页 / 技术内容

2025-02-25 12:15

No.1343919213005512704

技术概要

PDF全文

本技术公开了一种基于高频特征增强的神经表示视频编码方法，属于深度学习和视频编码领域。该方法对视频帧预处理，构建数据集并输入基于高频特征增强的神经网络。编码过程中，通过内容编码器和小波高频编码器下采样视频帧，提取嵌入特征。小波高频编码器利用哈尔小波分解块分离高频信息，生成独立的高频特征。在解码阶段，通过高频特征调制层融合高频信息，并利用谐波块上采样生成重建视频帧，增强高频细节。方法在空间和频率域的重建损失上进行端到端优化，满足预设轮次后保存训练好的网络权重和特征嵌入。本发明通过引入高频信息指导解码器上采样，显著提升了重建视频的质量和压缩效率。

背景技术

视频压缩是人们长期研究的一项基础性工作。现如今，随着互联网的发展，视频内容已成为互联网流量的最重要的组成部分。在过去，视频压缩通常是通过传统的编解码器实现的，例如H.264、H.265。尽管这些技术由于实现了可接受的折衷而被广泛使用，但这些编码方法中的手工算法限制了编码效率。近年来，随着深度学习的快速发展，许多方法使用神经网络替换传统编解码器中的某些模块取得了较为先进的率失真性能。然而，这些方法由于网络结构复杂，计算量巨大，导致解码效率较低，此外，这些方法还存在域泛化问题，适用性较差，因此没有得到大规模实际应用，因此积极探索新的编码方法很有必要。隐式神经表示是一种新颖的方法，通过训练神经网络去学习一个连续的函数实现对输入坐标到相应值的映射。由于其高效性和紧凑性，已被用于表示和压缩视频内容，与先前基于学习的方法相比取得了较高的解码速度。在这种范式下，不是训练一个通过编解码网络来实现对视频帧的编解码，而是为每一个视频训练一个单独的网络，训练完成后视频内容就被保存到网络权重中。视频的编码过程是训练网络过拟合的过程，解码过程是神经网络的前向过程，因此，当训练完成后就可以使用神经网络压缩技术进行压缩以得到视频的比特流。 Dupont等人提出了图像隐式神经表示COIN（Dupont E, Goliński A, AlizadehM, et al. Coin: Compression with implicit neural representations[J]. arXivpreprint arXiv:2103.03123, 2021.），其中采用简单的MLP将空间坐标映射到颜色信息，并使用超参数搜索和权重量化技术对网络进行压缩作为图像的码流。Chen提出基于图像级的基于隐式神经表示的视频压缩方法NeRV（Chen H, He B, Wang H, et al. Nerv:Neural representations for videos[J]. Advances in Neural InformationProcessing Systems, 2021, 34: 21557-21568.），通过使用卷积神经网络学习帧坐标到整帧图像的映射函数，大大提高了视频的重建质量和网络的训练速度。NeRV成功证明了图像级隐式神经表示能够实现与传统编解码器可比的压缩性能。后续，HNeRv（Chen H,Gwilliam M, Lim S N, et al. Hnerv: A hybrid neural representation for videos[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and PatternRecognition. 2023: 10270-10279.）提出了混合神经编码的方案，通过编码内容相关的微小嵌入取代时间坐标t作为网络输入以提供视觉先验，进一步提高了模型的重建质量和收敛速度。DNeRv（Zhao Q, Asif M S, Ma Z. Dnerv: Modeling inherent dynamics viadifference neural representation for videos[C]//Proceedings of the IEEE/CVFConference on Computer Vision and Pattern Recognition. 2023: 2031-2040.）针对HNeRv建模复杂运动场景能力差的问题，提出引入差分流增强网络拟合动态场景的能力。由于神经网络的频谱偏差性质会导致网络对于高频信息的重建能力不足，此外过去方法大多使用空间域损失，忽略了频率对改善图像质量的重要性。这就导致现有方案重建的视频帧过度平滑，缺乏高频细节，对于人类感知不友好。

实现思路

阅读余下40%

技术概要为部分技术内容，查看PDF获取完整资料

该技术已申请专利，如用于商业用途，请联系技术所有人！

技术研发人员：

李智慧于莉

技术所属：南京信息工程大学

相关技术

一种双频双模孔径共享共形超宽带天线及其应用  一种双频双模孔径共享共形超宽带天线及其应用 
 本申请涉及一种双频双模孔径共享共形超宽带天线及其应用，属于天线技术领域。天线包括依次层叠设置的基底层、辐射体层及接地层，基底层、辐射体层及接地层均由导电织物制成；辐射体层设置有辐射贴片，辐射贴片用于在单极模式下谐振；辐射贴片开设有双锥形槽，双锥形槽用于在维瓦尔第模式下谐振。该天线通过不同的激励口在两种辐射模式之间灵活切换，可以在两个频段实现具有不同波束特性的超宽带辐射，受人体影响小，且具有柔性与低轮廓特征，易于应用在衣物或其他人体可穿戴电子设备中。
一种纤维素基嵌入式电路的制备方法  一种纤维素基嵌入式电路的制备方法 
 本发明涉及一种纤维素基嵌入式电路的制备方法，包括:S1、纤维素前驱体溶液的配制；S2、导电墨水的制备；S3、嵌入式电路的打印；S4、纤维素基嵌入式电路的成型。本发明通过纤维素溶解再生特性制备出纤维素基嵌入式电路，扩展了嵌入式打印的方法，不仅能打印二维电路也能打印三维电路，与传统的嵌入式打印相比降低了对基质和油墨的需求，使其打印更加简便，在柔性电子的领域内具有广阔的应用前景。
一种基于加载电容贴片的双层基片集成波导谐振器  一种基于加载电容贴片的双层基片集成波导谐振器 
 本申请涉及毫米波通信系统的波导技术和微带线技术领域，尤其涉及一种基于加载电容贴片的双层基片集成波导谐振器，从上至下依次包括上表面金属覆铜、上层介质板、中间金属覆铜、下层介质板以及下表面金属覆铜；所述中间金属覆铜包括加载电容贴片，所述加载电容贴片两侧分别连接有微带线馈电部分，所述微带线馈电部分设置于所述加载电容贴片的中心线上；所述上层介质板和所述下层介质板上均开设有两组周期排布的金属通孔，所述加载电容贴片中心开设有矩形槽。本申请能够控制谐振器的本征谐振频率，实现对谐振模式和传输零点的可控，从而实现可控的中心频率和带宽。
基于多模通信的配用电网络校时方法、装置、系统及芯片  基于多模通信的配用电网络校时方法、装置、系统及芯片 
 本公开涉及配用电和通信技术领域，具体涉及一种基于多模通信的配用电网络校时方法、装置、系统及芯片，所述校时方法包括:校时节点和被校时节点分别处于同层、相邻层或跨层，通过获取第一校时信息和第二校时信息，之后基于第一校时信息和第二校时信息对被校时节点进行校时；本公开引入了基准节点的概念，以校时节点和被校时节点同时接收到基准节点所发送的基准信标为基准时刻，使用在基准时刻各自记录的以本地时钟计时的时间值分别作为第一校时信息和第二校时信息，或者将位置相对稳定且可预测、重复度高并易于检测的指定过零时刻作为基准时刻，有效地提高了配用电网络节点在时钟同步时的校时精度，提升了整个配用电网络的可靠性和稳定性。
一种非接触式IC载板表面处理系统及方法  一种非接触式IC载板表面处理系统及方法 
 本发明提供一种非接触式IC载板表面处理系统及方法，属于印制电路板领域，本发明包括:表面处理机体和表面处理工控机；表面处理机体上表面安装有水平移动装置；表面处理机体的第一端为进料端，进料端设置有与水平移动装置相适配的搬送载具；待加工处理的IC载板放置到搬送载具上，并在水平移动装置上水平移动；表面处理机体的第二端为出料端，从表面处理机体第一端至第二端依次安装有表面处理装置、表面粘尘装置、预加热装置以及表面贴膜装置；本发明利用各种化学药液对加工过程中IC载板表面进行除油、铜面粗化、酸洗、水洗、烘干等处理。由磁力搬送提供零摩擦的搬送力，避免摩擦产生粉尘异物。满足生产效率需求，提升处理效率。
一种气溶胶打印制备高稳定界面电路的方法  一种气溶胶打印制备高稳定界面电路的方法 
 本发明涉及一种气溶胶打印制备高稳定界面电路的方法，包括:S1、配制柔性基底；S2、配制导电墨水；S3、打印电路。本发明的导电材料与柔性基底无缝接触，其良好的粘附性和共形性能够满足柔性电子在弯折、拉伸、刮擦应用过程中导电材料不脱落、保持持久良好的导电性能；可同时获得图案化及具有高稳定界面的电路，可用于精密电子线路、天线工艺、敏感元器件及其它电子元器件等电子信息产品，具有较高的实际应用价值。
一种支持群智感知的端边云紧凑视频编码方法及系统  一种支持群智感知的端边云紧凑视频编码方法及系统 
 本发明公开了一种支持群智感知的端边云紧凑视频编码方法及系统，在云边端系统中，对单摄像头和跨摄像头语义目标图片进行优选，基于目标跟踪和图片优先，选取包含语义信息最大的语义图片框，对语义目标对象在其时域轨迹上的图片框序列进行特征提取，并将得到的紧凑特征用于语义目标对象的重构，实现视频群智语义目标紧凑编码，采集用于反馈控制的控制参量，聚焦感兴趣或语义感知相对重要的区域，用于指导多个摄像头之间协同码率分配及量化控制优化，实现视频群智多摄像头端边云协同优化编码。在针对海量摄像头视频数据进行以图搜图业务中，本发明对海量摄像头视频数据进行高效编码，支持端边云高效存储传输和分析。
一种高阶双频带的带通频率选择表面  一种高阶双频带的带通频率选择表面 
 本申请涉及电磁场与微波技术领域，尤其涉及一种高阶双频带的带通频率选择表面，包括上层金属层、介质基板和下层金属层，所述介质基板设置于所述上层金属层和所述下层金属层之间；所述上层金属层和所述下层金属层均在金属层上蚀刻一个大矩形环缝隙和四个小矩形环缝隙，四个小矩形环缝隙位于大矩形环缝隙的四条边上，蚀刻后采用四个小矩形金属贴片、一个大矩形金属贴片和不规则的外围金属贴片。本申请能够增强频率选择性表面的整体性能，使得频率选择性表面在多频带应用中表现出更优异的选择性和稳定性。
一种方便调换的变频器及其使用方法  一种方便调换的变频器及其使用方法 
 本发明公开了一种方便调换的变频器及其使用方法，本发明涉及变频器技术领域，包括器体、控制器和调换组件，所述器体的外壁安装有控制器，所述器体的内壁设置有调换组件，调换组件用于方便变频器的调换，器体的内壁安装有调控组件，调控组件用于调控变频器的状态。本发明通过安装有压定板移动使激发头与连接处接触，使激发头移动带动带动拉回弹簧移动，拉回弹簧移动使激发头与触动传感器接触，触动传感器通过处理器控制电磁块启动，使其产生磁力将变频器快速吸附固定，调换变频器时反转转把使激发头移开触动传感器，此时由处理器控制电磁块关闭使其快速卸下，实现了变频器快速调换加大调换效率的功能。
血压连续测量预测方法、装置、设备及存储介质  血压连续测量预测方法、装置、设备及存储介质 
 本申请涉及深度学习技术领域，公开了一种血压连续测量预测方法、装置、设备及存储介质。方法包括:通过血压测量系统根据多个第一血压测量部位分别对目标用户进行血压监测并进行时空关联节点判别和节点筛选，得到多个第二血压测量部位；构建变结构动态贝叶斯网络模型并进行血压状态预测，得到第一血压状态预测策略；进行节点先验概率密度估计和影响权重调整，得到第二血压状态预测策略；进行血压状态预测策略融合，生成目标血压状态预测策略；通过初始Volterra泛函级数模型进行血压异常检测，得到目标血压异常检测结果；进行模型优化和连续血压异常检测，输出连续血压异常检测结果，本申请提高了血压连续测量预测的准确率。

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工