Günümüzde modern arşivleme teknolojisi artan bilgi miktarına ayak uyduramamaktadır. Dolayısıyla bu konuda yeni teknolojilere ihtiyaç vardır ve doğa bu konuda bize yardımcı olabilir.
2011 yılında Avrupa Biyoenformatik Enstitüsü’nde (EBI) çalışan bir ekip, DNA hakkında bilgi depolamak için bir fikir geliştirdi. Bununla birlikte, DNA’yı depolamak, mikrosaniye zaman ölçeğinde yazmak ve okumak için silikon bellek yongalarından çok daha yavaş olacaktır. Sentezlenen DNA zincirindeki bilgileri kodlamak ve okumak saatler alacaktır. Ancak hücrenin içinde, tüm genom çıplak gözle görülemez. Ancak depolanan bilgilerin yoğunluğu açısından silikonun çok gerisinde kalacaktır. Bu nedenle DNA, uzun süreli arşivleme için çok faydalıdır.
DNA; Adenin, guanin, sitozin ve timin adı verilen dört nükleotitten oluşur ve bu dört farklı nükleotidin birleşimi farklı DNA dizilerini oluşturur. DNA sentezinde ve dizilişinde her 100 nükleotitte bir hata meydana gelebilir. Bu, yaygın olarak depolanan verileri güvenilmez hale getirir. DNA baz çiftleri, bitleri düzeltilip onarılabilecek şekilde kodlanabilir mi?
Avrupa Biyoinformatik Enstitüsü’nde çalışan bir ekip, DNA’daki beş dosyayı kodlayabildiklerini açıkladı. Bu dosyalar, Shakespeare’in şiirlerini ve Martin Luther King’in konuşmasından bazı bölümleri içeriyordu. 2016’da bu işaretlemenin boyutu 200 MB’a ulaştı.
Kalıcı arşiv depolaması için, eski moda manyetik kasetleri tercih etmez. Diğer yöntemlere göre daha fazla veri yoğunluğu depolayabilmesine rağmen okuması daha yavaştır. Ayrıca, 1 milyar gigabayt bantta depolandığında 1 milyar dolara mal olur ve oluşturulması 10 yıl sürer. Moleküler veri depolama, bu gereksinimleri azaltır. Veriler, Escherichia coli bakterisinin genomunda toplanırsa, dünyanın depolama ihtiyacı bir kilogram DNA ile karşılanabilir. Bu potansiyele ulaşmak kolay olmayacak. Çünkü geleneksel depolama araçlarının aksine DNA yaşayan bir araçtır. Bunun için verinin sadece DNA’da kodlanması ve verinin alınabilmesi için DNA dizisinin daha düşük maliyetle ve daha hızlı üretilmesi gerekmektedir.
uzun süreli hafıza
Dijital verilerdeki birleri ve sıfırları DNA’nın dört bazına ilk aktaran Joe Davis, 1988’de Harvard Üniversitesi’ndeki araştırmacılarla çalışıyordu. Escherichia coli şifreli bakteriye yerleştirdiği DNA dizisi sadece 35 bit uzunluğunda.
Davis, bugün Emirates Business Institute laboratuvarında bu konu üzerinde çalışıyor. Burada araştırmacılar, DNA sentezi ve dizileme maliyetini düşürmeyi hedefliyor. Aynı ekip, çok kısa DNA zincirlerini depolamak için 659 kb sağladı. Sıfır, ikili kodda adenin veya sitozin olarak kodlanır. Biri guanin veya timin olarak kodlanır. Bu, araştırmacıların, özellikle guanin ve sitozin nükleotitlerinin yoğunlaştığı bölgelerde okuma problemini ortadan kaldırarak diziyi tasarlamasına izin verdi. Bu ileti dizileri serileştirildiğinde 22 hata bulundu. Bu hatalar ayrıca verileri güvenilir bir şekilde depolamak için çok fazla değildir.
EBI araştırmacıları, video ses dosyaları ve Watson ve Crick’in DNA’nın çift sarmal yapısı hakkında açıkladığı makalenin PDF versiyonu da dahil olmak üzere 739 kilobaytlık veriyi depolamak için çok sayıda DNA dizisi kullandılar. Tekrarlanan kurallardan kaynaklanan hataları önlemek için ikili kod yerine 0, 1 ve 2’den oluşan üçlü kod kullanılır.Veri merkezlerindeki sabit diske üç yıldan fazla güvenilemezse de, veriler DNA’ya yazıldıktan sonra tekrar açılır. herhangi bir zamanda tekrar okuyabilir. Burada önemli olan nokta DNA’nın yoğunluğu ve kararlılığıdır.
Standart dizileme yöntemleri kullanılarak her DNA dizisi okunamaz, ancak verileri okumak için gereklidir. Araştırmacılar bu duruma bir çözüm bulabilmek için önce bilgileri çok küçük DNA parçalarında depoladılar. Daha sonra polimeraz zincir reaksiyonu (PCR) adı verilen bir yöntem kullanarak veri kodlayan DNA’nın birden fazla kopyasını yaptılar. Artan kopya sayısı, sıralamayı önceki yöntemlere göre daha hızlı, daha ucuz ve daha güvenilir hale getirdi.
Illinois Üniversitesi’nden bir araştırma grubu, kodlanmış dizileri yeniden yazmak için yeni bir yöntem geliştirdi. Bu yöntemde, veriler uzun DNA zincirlerinde depolanır. Spesifik dizileri tanımlamak, çoğaltmak ve yeniden yazmak için PCR veya CRISPR-Cas9 genom düzenleme yöntemleri de kullanılır.
DNA sarmalının katlanması ve sarmaldaki dizilerin üst üste binmesi, dizi okunurken sorunlara neden olabilir. Bunun üstesinden gelmek için ileri düzeyde matematiksel hesaplamalar gerekir.
Mevcut çalışmalarda DNA üzerinde 700 kilobayt bilgi depolanabilmektedir. Ama bu seviyeye 1000 defa çıkılsa bile sadece CD boyutu oluşturur. Bu nedenle, bu teknoloji henüz dünya çapında veri arşivlemek için yeterli değildir. Bu sınırlamanın nedeni, DNA sentezinin yeterince hızlı olmamasıdır. Her yeni nükleotidin DNA’ya eklenmesi 400 saniye sürer. Bu hız nedeniyle, büyük miktarda veriyi depolamak için milyarlarca DNA dizisinin aynı anda sentezlenmesi gerekir. Mevcut maksimum eşzamanlı üretim 10.000 seri ile sınırlıdır.
Yakın gelecekte silikon bazlı depolama yöntemleri dışında alternatiflere ihtiyaç duyulacağı beklenmektedir. Bu konuda yapılan çalışmalar incelendiğinde DNA üzerinde veri depolama umut verici bir seçenektir. Ancak bu teknolojinin geliştirilip kullanılabilmesi için depolama kapasitesinin 100.000 kat artırılması gerekiyor.
kaynak:
https://www.nature.com/news/how-dna-could-store-all-the-world-s-data-1.20496
yazar: Ayka Olkay
Diğer gönderilerimize göz at
[wpcin-random-posts]