本技术公开了一种基于大语言模型的物联网HTTP模糊测试方法,涉及物联网HTTP模糊测试技术领域。所述方法包括如下步骤:数据采集:采取数据采集策略,获取用于物联网HTTP模糊测试的数据;数据预处理:对采集到的数据进行预处理,为后续的模糊测试提供高质量的输入数据;LLM引导的HTTP协议结构感知:使用提示调整方法来利用LLM对请求数据中的模糊变量进行标注,理解协议数据结构,指导变异过程;LLM引导的种子模板扩展:通过丰富数据包和扩展字段值来扩展种子库;LLM引导的种子变异以及种子调度:通过智能选择和管理输入种子来优化测试结果。所述方法能够提高模糊测试的效率和准确性并增强漏洞检测能力。
背景技术
物联网(IoT)技术正在迅速发展,显著改变人们的生活和工作环境。到2024年,全球连接的IoT设备数量已达到170.2亿,预计到2030年将达到约300亿。这种快速增长带来了重要的安全挑战。尽管IoT设备通过Web界面提供便利,但也引入了许多安全风险,许多设备存在设计缺陷,潜藏严重漏洞,可能导致未授权访问、数据盗窃或远程代码执行等攻击。模糊测试作为有效的漏洞检测技术,在IoT设备的安全测试中发挥着关键作用。然而,由于HTTP协议的复杂性及IoT设备的独特特性,现有的模糊测试工具在实际应用中面临限制,尤其是在处理HTTP协议数据包时效率低下。
HTTP协议模糊测试是一种通过向目标应用程序发送大量随机或格式错误的数据来发现漏洞和安全问题的技术。进行HTTP协议模糊测试时,模糊测试工具在生成测试数据时必须严格遵守协议规范。对协议固定字段的变异可能会导致许多无法解析的无效数据包,从而降低模糊测试的效率。此外,如果初始种子的数量不足或与目标代码的预期字段不匹配,就很难测试服务中的更多功能和代码分支。许多测试工具依赖于手动创建的种子模板,降低了自动化程度,难以应对复杂的协议。此外,尽管一些先进工具试图通过有限的反馈来指导模糊测试,但在获取和优化初始种子上仍显不足。
实现思路