
Karena volume data yang dihasilkan oleh aktivitas internet, perangkat digital, dan sensor IoT terus berkembang dengan kecepatan yang agresif, bisnis kehabisan waktu untuk menyelesaikan masalah kritis: di mana menyimpan semuanya.
Berdasarkan laporan IDC baru-baru ini (terbuka di tab baru)jumlah data yang dibuat dalam lima tahun ke depan akan lebih dari dua kali lipat jumlah yang dihasilkan sejak penyimpanan digital mulai digunakan.
Meskipun kurang dari 2% dari 64,2 ZB (68,9 miliar TB) yang dibuat tahun lalu disimpan untuk jangka panjang (sisanya ditimpa atau di-cache sementara), kebutuhan penyimpanan data global masih melebihi perluasan kapasitas total.
Ketika drive hard disk (terbuka di tab baru) (HDD) dan solid state drive (terbuka di tab baru) (SSD) melakukan pekerjaan yang sangat baik dalam menyimpan dan memasok jumlah data yang dibutuhkan perangkat sehari-hari kita untuk berfungsi, tidak ada yang cocok untuk menyimpan informasi secara massal dan untuk jangka waktu yang lama.
Ketika datang ke penyimpanan arsip, Linear Tape-Buka (LTO) (terbuka di tab baru) pita magnetik berkuasa, dengan biaya per kapasitas terendah dari teknologi apa pun. Kaset generasi saat ini, LTO-8, memiliki kapasitas bawaan sebesar 12 TB dan dapat dibeli hanya dengan $75 (atau $6,25/TB).
Namun, meski hemat biaya, tape juga memiliki kelemahan; data hanya dapat diakses secara serial, sehingga sulit untuk menemukan file tertentu, dan perusahaan juga perlu bermigrasi ke pita baru secara semi-reguler untuk menghindari Data hilang (terbuka di tab baru).
Untuk mencoba dan memecahkan krisis data yang membayangi, para peneliti mencari teknologi penyimpanan baru yang sangat padat dan sangat tahan lama. Beberapa kandidat berbeda telah muncul, tetapi satu konsep tampak sangat menjanjikan: asam deoksiribonukleat, lebih dikenal sebagai DNA (terbuka di tab baru).
Apa itu penyimpanan DNA dan bagaimana cara kerjanya?
DNA, bahan dasar organisme hidup, terdiri dari empat blok bangunan molekul: adenin (A), guanin (G), sitosin (C) dan timin (T). Senyawa ini terhubung berpasangan (AT & GC) untuk membentuk anak tangga dari tangga heliks ganda yang terkenal.
Struktur ini dapat digunakan sebagai bentuk penyimpanan data yang sangat padat dan tahan lama, dengan mengubah biner 1 dan 0 menjadi alfabet genetik empat huruf. Satu gram DNA telah ditemukan mampu menyimpan 215 PB (terbuka di tab baru) (220.000 TB) data.
“Penyimpanan data DNA adalah proses encoding dan decoding data biner ke dan dari untaian DNA yang disintesis,” jelas juru bicara Aliansi Penyimpanan Data DNA (DDSA), yang didirikan tahun lalu oleh Microsoft, Western Digital, Twist Bioscience, dan Ilumina.
“Untuk menyimpan data dalam DNA, data digital asli dikodekan, kemudian ditulis (disintesis menggunakan proses kimia/biologis) dan disimpan. Ketika data yang disimpan diperlukan lagi, molekul DNA diurutkan untuk mengungkapkan setiap individu A,C,G atau T secara berurutan dan dipetakan ulang dari basis DNA kembali ke 1s dan 0s.”
DNA mengungguli teknologi penyimpanan arsip saat ini di hampir setiap kategori. SEBUAH makalah terbaru (terbuka di tab baru) memperkirakan bahwa 9TB DNA yang disandikan dapat diperas ke dalam ruang hanya 1mm^3, yang berarti volume satu kaset LTO akan menampung 2 juta TB data, kira-kira 167.000 kali kapasitas pita LTO-8.
Dalam skenario dunia nyata, DNA dapat digunakan untuk menyimpan seluruh YouTube (yang dianggap sebagai host secara kasar 400.000 TB video baru (terbuka di tab baru) setiap tahun) di lemari es kecil, berbeda dengan pusat data berhektar-hektar.
Tidak seperti pita magnetik, yang perlu diganti setiap satu atau dua dekade tergantung penggunaan, DNA dapat bertahan selama ribuan tahun dalam kondisi yang tepat. Ini berarti total biaya kepemilikan (TCO) berpotensi menjadi sangat rendah.
DNA juga dapat terurai secara hayati dan mudah ditiru, serta hanya mengonsumsi sedikit daya di luar energi yang dibutuhkan untuk menghasilkan iklim yang diperlukan, menjadikannya sangat ramah lingkungan.
Namun, masih banyak alasan mengapa DNA belum membuat penyimpanan pita usang. Teknologi ini masih dalam masa pertumbuhan, dengan kekusutan yang harus diselesaikan di hampir setiap tahap proses, mulai dari penyandian hingga sintesis hingga pengurutan.
Menurut Turguy Goker, Director of Advance Development, LTO di perusahaan penyimpanan Quantum, masih terlalu dini untuk “memasang taruhan apa pun pada kuda ini”.
“Penyimpanan DNA sedang berenang di perairan berombak saat ini dan akan memakan waktu beberapa tahun sebelum dapat berlayar dengan aman menuju pantai komersial,” jelasnya.
Padat dan tahan lama, tetapi lambat dan mahal
Meskipun tanda-tanda awalnya menjanjikan, masih ada sejumlah rintangan yang harus dilewati sebelum DNA dapat mulai mengurangi masalah kapasitas penyimpanan dunia. Masalah utama menyangkut biaya dan kecepatan.
Untuk mencegah degradasi, DNA membutuhkan iklim yang sangat spesifik, yang sulit dan mahal untuk dipertahankan. Secara khusus, DNA perlu disimpan pada suhu yang sangat rendah atau terkena aliran udara yang dikontrol dengan hati-hati.
Dengan menggunakan teknik saat ini, proses penulisan data ke DNA juga sangat memakan waktu jika dibandingkan dengan teknologi yang sudah ada. Sampai ini dapat diperbaiki, penyimpanan DNA akan tetap tidak dapat digunakan dalam skala besar.
“Penulisan DNA adalah proses kimiawi dan secara inheren jauh lebih lambat daripada elektronik digital yang biasa kita gunakan saat ini,” jelas Goker. “Tanpa mengatasi penghalang ini, menulis ke penyimpanan berbasis DNA serupa dengan mengosongkan kolam renang menggunakan sedotan.”
Membaca data yang disimpan dalam DNA juga menimbulkan tantangan, dengan kemungkinan besar terjadinya kesalahan selama proses pengurutan. Untuk alasan ini, DDSA mengharapkan pengadopsi paling awal dari teknologi untuk menggunakannya untuk menulis sekali, tidak pernah membaca (WORN) atau menulis sekali, membaca jarang jika pernah (BURUK) kasus penggunaan (misalnya menyimpan tipe data tertentu untuk memenuhi persyaratan peraturan).
Selain masalah teknologi, kurangnya standar umum perlu ditangani, untuk memastikan teknologi penyimpanan DNA dapat dioperasikan baik satu sama lain maupun teknologi lama.
Namun, dengan penyimpanan DNA yang menarik perhatian dan investasi dari pemerintah, petahana penyimpanan dan raksasa teknologi, pekerjaan sedang dilakukan untuk menemukan solusi untuk masalah ini.
Misalnya, Kantor Direktur Intelijen Nasional AS meluncurkan Penyimpanan Informasi Molekuler (KABUT (terbuka di tab baru)) program tahun lalu, dengan tujuan yang dinyatakan untuk mengembangkan teknologi DNA yang mampu menulis 1TB dan membaca 10TB dalam waktu 24 jam, dengan biaya kurang dari $1.000.
Secara terpisah, Twist Bioscience telah mengembangkan metode meningkatkan hasil sintesis DNA dengan faktor 1.000 (terbuka di tab baru) dengan menggunakan platform silikon yang mengecilkan bahan kimia yang dibutuhkan.
Menurut DDSA, kekhawatiran tentang akurasi data akan dihilangkan oleh skrip yang mampu mengoreksi masalah pengurutan, dan organisasi juga yakin masih ada waktu untuk menetapkan spesifikasi yang akan mencegah fragmentasi di seluruh industri.
“Tidak seperti sintesis untuk perawatan kesehatan, yang harus sempurna, penyimpanan DNA dapat mentolerir kesalahan karena algoritme koreksi yang biasanya digunakan dalam penyimpanan saat ini. Pelopor penyimpanan DNA sudah bekerja pada pengkodean dan perbaikan algoritme koreksi kesalahan yang akan mengurangi risiko ini dan memulihkan data secara akurat, ”jelas seorang juru bicara.
“Karena metode dan alat untuk penyimpanan data DNA yang layak secara komersial menjadi lebih dipahami dan tersedia lebih luas, Aliansi akan mempertimbangkan pembuatan spesifikasi dan standar khusus (misalnya pengkodean, antarmuka fisik, retensi, sistem file) untuk mempromosikan munculnya DNA yang dapat dioperasikan. solusi berbasis penyimpanan data yang melengkapi hierarki penyimpanan yang ada.”
Apakah ini akhir dari rekaman?
Meskipun kedatangan penyimpanan DNA akan menimbulkan pertanyaan tentang kegunaan pita magnetik yang bertahan lama, ada orang yang percaya bahwa tulisan itu belum ada di dinding.
Misalnya, ditanya apakah rasanya DNA akan membuat produk penyimpanan kasetnya terancam, IBM memberi isyarat ke arah peningkatan kepadatan pita, yang juga dicoba dan benar dalam konteks komersial.
“Ketika volume data terus melonjak di seluruh dunia, teknologi tape tetap menjadi solusi pilihan untuk retensi data perusahaan, perlindungan dan ketahanan untuk lingkungan cloud on-premise dan hybrid,” kata Andy Walls, CTO dan Kepala Arsitek di divisi penyimpanan flash IBM.
“Ini juga merupakan teknologi penyimpanan paling ramah lingkungan yang tersedia, mengkonsumsi daya nol dan bertahan selama beberapa dekade. Dan karena kami terus meningkatkan kerapatan pita, saat ini satu kartrid dari IBM (yang lebih kecil dari kaset VHS) dapat menampung data terkompresi sebesar 60 TB yang luar biasa. Ini adalah beberapa kualitas yang menjadikan tape sebagai solusi utama bagi hyperscaler terbesar yang mengandalkannya untuk penyimpanan arsip yang murah dan andal.”
Pada akhir tahun lalu, IBM juga mengumumkannya memecahkan rekor dunia untuk kepadatan areal (terbuka di tab baru) pada pita prototipe yang terbuat dari strontium ferit (SrFe), yang dikembangkan oleh Fujifilm. Pasangan ini mencapai rekor 317 GB/in^2, yang diterjemahkan menjadi 580 TB per kartrid, menunjukkan bahwa pita memiliki cara untuk pergi sebelum mencapai kepadatan maksimumnya.
Meskipun atribut penyimpanan DNA paling sebanding dengan pita, Quantum percaya bahwa DNA lebih mungkin untuk dimasukkan ke dalam pengaturan yang ada daripada menggantikan teknologi yang ada sepenuhnya.
“Tape tidak menunjukkan tanda-tanda akan hilang dalam waktu dekat, terutama untuk tujuan pengarsipan jangka panjang di lokasi,” kata Goker kepada kami. “Ini adalah bentuk penyimpanan per megabita yang paling ekonomis, dapat menyimpan data dalam jumlah besar per kartrid, dan memerlukan biaya operasional yang sangat rendah. Ini juga merupakan salah satu media penyimpanan teraman di luar sana karena data disimpan secara offline dan juga dapat berperan sebagai arsip aktif, kunci dan fungsi penting untuk hyperscaler.”
“Alih-alih melihat kedua opsi penyimpanan sebagai persaingan, kita harus melihat sifat saling melengkapi saat bekerja bersama-sama. DNA akan melengkapi pita di masa depan dengan hidup berdampingan sebagai sistem berjenjang dalam pusat data hiperskala. DNA tidak mungkin menggantikan pita magnetik untuk beberapa tahun ke depan, tetapi akan menempati tingkat di bawahnya, untuk kasus tulis sekali baca jarang digunakan. Perpaduan sempurna untuk skenario pengarsipan data besar.”
Namun, sementara pita tidak mungkin dirampas dalam jangka pendek, karena berada di jantung sistem penyimpanan perusahaan, ada sedikit akal bahwa teknologi berusia puluhan tahun akan mampu menahan tsunami data di cakrawala, terlepas dari R&D.
Meskipun kapasitas tape cenderung hampir dua kali lipat pada setiap generasi LTO, mengungguli pertumbuhan kapasitas SSD dan HDD secara besar-besaran, bahkan tingkat ekspansi eksponensial ini tidak dapat melebihi volume data yang dihasilkan.
Perbatasan berikutnya untuk penyimpanan data
Jika para analis dapat dipercaya, krisis penyimpanan data akan memuncak dalam setengah dekade mendatang. Jika teknologi penyimpanan tidak mengejar waktu, konsekuensinya bisa berlipat ganda.
Misalnya, ketidakmampuan untuk menyimpan data dalam jumlah yang cukup berarti bisnis kurang siap untuk pulih dari gangguan, baik yang dipicu oleh serangan siber atau perubahan kondisi sosial ekonomi. Nilai penuh dari analitik (terbuka di tab baru) akan tetap belum dimanfaatkan (dan tidak diketahui), karena perusahaan harus bekerja dengan kumpulan data yang tidak lengkap.
Dari perspektif konsumen, mungkin saja platform media sosial, surel (terbuka di tab baru) perusahaan dan lainnya dapat mulai menghapus data dan postingan lama, untuk memberi ruang bagi sungai konten segar yang terus mengalir. Google, misalnya, baru-baru ini diumumkan (terbuka di tab baru) itu akan mulai menghapus data yang dilampirkan ke layanan Gmail, Drive, dan Foto dari akun yang tidak aktif selama dua tahun atau lebih.
Penyimpanan DNA bukan satu-satunya harapan; peneliti di Microsoft sedang memeriksa kemungkinan menggunakan laser untuk etch data ke dalam kaca kuarsa (terbuka di tab baru)atau menyimpan data dalam bentuk hologram (terbuka di tab baru) di dalam kristal.
Namun, dengan sifat dan karakteristiknya yang unik, DNA mungkin adalah penyelamat yang paling mungkin.
Menurut Luis Ceze, pakar penyimpanan DNA di University of Washington, diperlukan waktu antara delapan dan sepuluh tahun agar DNA dapat diadopsi dalam konteks komersial berskala besar. Spesialis lain yang kami konsultasikan setuju dengan penilaian ini.
Namun, Ceze juga memberi tahu kami bahwa tren penelitian “menguntungkan” dan bahwa “pasar butik untuk kebutuhan data yang lebih kecil sudah layak saat ini”. Maka, ada harapan bahwa perlombaan melawan waktu masih dapat dimenangkan dan bencana data dapat dihindari.