本技术公开了一种边缘计算环境下任务卸载策略的抗推理攻击差分隐私保护方法,属于边缘计算与隐私保护领域。所述方法包括构建移动边缘计算场景下的基于马尔可夫决策过程(MDP)的卸载决策模型框架,包括;系统模型、传输模型、计算模型及用户任务模型;针对推理攻击构建隐私模型,通过系统状态推测设备的卸载策略并评估隐私损失;在此基础上,计算阶段性平滑敏感度,结合隐私损失采用指数机制的差分隐私方法对卸载策略进行扰动;根据整体迭代周期的隐私损失与平滑敏感度动态调整噪声强度,直至模型收敛。本发明降低了任务卸载策略泄露的风险,适用于深度强化学习的任务卸载策略,可有效保护边缘计算环境中的任务卸载策略安全。
背景技术
随着移动通信和物联网技术的快速发展,移动设备和物联网设备数量激增,计算密集且低延迟的应用(如人脸识别、自动驾驶等)逐渐普及。为了满足用户对服务质量的高需求,边缘计算(MEC)被提出,通过靠近用户的边缘服务器提供计算和存储支持,以低延迟、低能耗和更强的隐私安全性为用户提供灵活的计算扩展服务。任务卸载是边缘计算中的关键过程,本质上是一个优化问题,通常以时延、能耗和成本为优化目标,一般被建模为混合整数非线性规划(MINLP)、马尔可夫决策过程(MDP)或博弈论等模型。深度强化学习(DRL)因其自学习能力和适应性,成为任务卸载策略的主流方法。
然而,DRL模型在学习用户任务卸载策略时,也会“记住”用户的偏好和卸载目标,导致隐私泄露风险。在高动态性和开放性的边缘计算环境中,恶意攻击者能够通过逆强化学习(IRL)等算法推断用户的卸载策略及偏好,进而利用这些信息实施恶意行为,如诱导用户卸载任务到不可信服务器,威胁用户隐私和任务安全。现有研究主要集中在卸载数据的隐私保护上,例如采用安全多方计算、同态加密和差分隐私等技术,防止攻击者直接获取卸载数据。然而,对于卸载策略的隐私保护研究仍显不足,尤其在基于深度强化学习的任务卸载场景中,其模型特性使策略偏好更容易被攻击者推断和利用,成为边缘计算进一步发展的重要瓶颈。因此,需要一种高效的隐私保护机制,在保证任务卸载服务质量的同时,防止攻击者通过模型推断获取用户的卸载策略与偏好,从根本上提升用户隐私和任务卸载的安全性。
实现思路