本技术涉及一种基于多维特征和差分萤火虫算法的JPEG大数据可逆数据隐藏方法和系统。所述方法包括:结合DCT系数块的纹理、系数分布和空间特性,构建多维特征相似性评估模型;通过差分萤火虫算法确定最适合参与AC系数分布模型构建的DCT块数量k;利用相似性评估模型选取最相似的k个DCT块,用于系数分布模型的构建;通过拉普拉斯分布拟合,估算每个AC系数的失真值,并优先选择失真较小的系数进行数据嵌入;构建二维直方图,根据系数对的统计特性,选择最优二维直方图映射;根据最优二维映射关系嵌入秘密数据,最终得到标记的JPEG图像。采用该方法,显著提升了嵌入效率,并满足了在大数据存储、分发和信息化处理环境中对图像数据传输的安全性和完整性需求。
背景技术
随着计算机技术和互联网的快速发展,数字图像数量呈指数级增长,成为大数据信息化进程中的重要信息载体,广泛应用于社交网络、电子设备等场景。伴随图像在各平台的广泛传播,如何在大数据的存储、分发和信息化处理环境中确保图像的安全性、完整性及版权保护,已成为信息化环境中的关键安全需求。因此,可逆数据隐藏技术应运而生。该技术不仅支持嵌入数据的提取,还能无损恢复图像的原始内容,满足军事通信、法律取证和医学影像等对数据完整性有严格要求的高度敏感应用。
JPEG作为一种广泛应用的压缩图像格式,凭借高压缩比和良好的视觉质量,已成为大数据环境下社交媒体和电子设备中图像存储与传输的主流格式。然而,JPEG的有损压缩特性为可逆数据隐藏带来了显著挑战。在JPEG压缩过程中,图像通过离散余弦变换(DCT)转换为频域表示,并去除冗余信息以减小文件体积。这一过程极大地限制了DCT系数的可修改空间。直接修改这些系数不仅容易导致文件大小显著膨胀,增加大数据场景下的存储与传输成本,还可能引入视觉失真,影响图像质量。此外,JPEG图像的分块处理和复杂的编码结构要求在嵌入数据时特别谨慎,以避免破坏文件格式,导致解码错误或不可预期的视觉效果。
因此,如何在不破坏文件格式的前提下,在嵌入容量、图像失真和文件扩展之间取得良好平衡,已成为JPEG图像可逆数据隐藏技术研究中的关键问题。
实现思路