本申请提供了一种基于混合编码策略的高效DNA存储方法、系统,涉及DNA数据存储技术领域,旨在实现将数据稳定、高效地存储到DNA序列。方法包括:对待存储的原始数据进行统计分析,得到数据属性;根据数据属性和编码需求,确定混合编码器的编码算法和参数设置;将原始数据转换为二进制数据,并根据预设DNA序列长度、混合编码器的编码算法和参数设置,对二进制数据进行划分和分块编码,得到带有冗余的码字序列;根据二进制数据到四位碱基的映射关系,将带有冗余的码字序列进行转换,得到数据存储DNA序列;根据原始数据和所述混合编码器,为数据存储DNA序列添加引物和标记位,得到最终的数据存储DNA序列。
背景技术
随着信息技术的快速发展,数据的指数级增长与当前主流存储介质的有限容量之间的差距越来越明显。面对数据存储的压力,亟需开发更高效的存储介质,DNA存储被视为一种具有巨大潜力的新型数据存储介质。DNA数据存储通过合成技术将数据信息写入到DNA中,并通过测序技术将数据信息从DNA中读出,常规的DNA数据存储主要流程包括:编码、合成、存储、检索、测序和解码。
现有的DNA数据存储在合成、DNA储存、检索和测序过程中都可能会出现缺失、插入和替换等碱基错误,因而存在低效和不稳定的问题。当前DNA数据存储为了提高存储性能,往往针对某一特定目的进行设计,尽管在一定环境下实现了较高的性能,但在处理多类型复杂数据时限制了整体的性能。因此,如何将数据稳定、高效地存储到DNA序列中,是亟待解决的技术问题。
实现思路