中国科学院深圳先进技术研究院研究员姜青山、高级工程师黄小罗联合中国农业科学院深圳农业基因组研究所研究员戴俊彪等,设计出一种名为“EDS”的DNA存储方法。该方法通过改进编码模型、引入冗余核苷酸和设计索引技术,实现了医学磁共振成像(MRI)数据的可靠归档和检索。近日,相关研究成果发表于《小方法》。
利用DNA存储技术保存医学MRI数据将有助于人类健康管理。通过DNA存储,可以确保这些重要数据在数千年内安全保存并精确恢复,实现了这些重要数据的长期存储,为研究疾病进展和治疗效果提供了重要数据支撑。
研究团队通过3个关键组成部分实现了医学MRI数据的归档——首先,设计一种新颖的分块策略,解决旋转编码导致的数据丢失问题;其次,提出一种基于规则的四进制转码方法,满足生化约束条件并确保可靠的数据映射;最后,设计一种索引技术,克服DNA文件存储中高额外开销的障碍,旨在简化DNA文件存储的组织结构,实现灵活的随机搜索、访问和文件管理。
此外,研究人员利用多进程技术优化DNA存储编码流程,将编码任务分解成多个子任务,并分配多个CPU进行并行计算,提高了编码速率。研究团队共测试了72GB的人体磁共振成像数据,仅用9小时便完成了编码,编码效率提升明显。基于数据预测,1TB量级的数据可以在120小时完成。
验证结果发现,EDS方法在医学MRI数据存储方面表现出色,并且具有更好的生化约束控制和较短的计算时间,为医学MRI数据的DNA存储开辟了新途径。