本技术属于视频信号压缩技术领域,详细描述了一种基于关键帧预测的面部视频压缩技术及其系统。该技术包括面部视频质量分析、关键帧提取、视频压缩以及压缩视频的面部信息处理等步骤,旨在提高压缩效率和保持视频质量。
背景技术
当前,随着远程办公和在线教育的普及,视频会议、远程教育及直播平台的使用需求迅速增长,为支持高质量远程互动,高清视频传输成为主流,远程教育等应用每小时的数据使用量可达10GB以上,而4K视频技术的采用进一步加剧了数据传输的压力,在此背景下,“人脸视频”(Talking Face Video)技术,因其能真实捕捉面部动态表情,逐渐成为远程互动中传递非语言交流信息的关键。
例如,公开号为CN114885178A的发明专利,公开了一种针对人脸视频的双向帧预测方法,包括:在时域上采样人脸视频的三帧图像;获得所述三帧图像各自对应的关键点热力图;结合所述三帧图像和所述关键点热力图,重建出中间帧图像,还公开了基于上述方法的一种极低码率的人脸视频混合压缩方法。
例如,公告号为CN112019861B的发明专利,公告了一种基于关键帧指导超分辨率的视频压缩方法及装置,其中,方法包括:将输入视频以帧序列的形式输入到关键帧选取网络,得到输入视频的高分辨率关键帧;将输入视频以帧序列进行下采样得到输入视频的低分辨率帧序列;将高分辨率关键帧和低分辨率帧序列输入到生成器中,生成超分辨率视频。
但本申请在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
在现有的视频压缩方法中,通常都是直接通过获取的视频数据进行压缩处理的,会存在由于视频数据质量的影响,而导致关键帧的选取会变得不准确,并无法准确地识别出具有代表性或重要性的关键帧,直接影响后续帧的预测和压缩效果,进而影响整个视频压缩的效率和质量。
实现思路