Microsoft、DNAベースのデータストレージシステムの自動化に成功
Microsoft とワシントン大学2016 年以来、デジタル データの保存に必要なスペースを実際に縮小できる、初の完全な DNA ベースのデータ ストレージ システムの開発に取り組んでいます。ストレージ システムには、実際のアプリケーションに必要なランダム アクセス可読性とエラー訂正プロトコルが備わっています。
マイクロソフトは木曜日、研究者チームが、製造された DNA にデータを保存および取得し、再度デジタル データに変換できる初の完全自動システムの実行に成功したとついに発表しました。
研究者らは、概念実証システムを次の論文で発表しました。新しい紙Nature Scientific Reports 誌に 3 月 21 日に掲載されました。
簡単な概念実証テストで、研究チームは、完全に自動化されたエンドツーエンド システムを使用して、捏造された DNA の断片に「こんにちは」という単語をエンコードし、それをデジタル データに変換し直すことに成功しました。研究者らは 5 バイトのデータを変換するのに 21 時間かかりました。
「私たちは、DNA 分子がデータストレージの有力な候補であると確信しています。しかし、私たちは本質的にはコンピューターアーキテクトです。私たちは、将来のコンピューターがどのようなものになるのかを本当に知りたいと思っています」と、カリフォルニア大学ポール G. アレン コンピューター サイエンス アンド エンジニアリング スクールの教授、ルイス セゼ氏は述べました。 「ここで私たちにとって興味深いのは、これが分子コンポーネントと電子コンポーネントを備えたコンピューター システムを示すための 1 つのステップであるということです。」
DNA データの保存方法は、細胞内の DNA が遺伝情報をコード化する方法と似ています。このエンコード システムは、DNA の 4 つの基本構成要素 (アデニン、グアニン、シトシン、チミン) を使用してデジタル ファイルを構成する 0 と 1 を変換するソフトウェアを使用します。 DNA コードの「文字」 (アデニン、チミン、シトシン、グアニン、つまり ATCG) は、デジタル マシンで読み取ることができるコンピューターのバイナリ コードの 1 と 0 の代わりでした。
たとえば、「Hello」は化学文字列 TCAACATGATGAGTA にコード化できます。これを行うために、デバイスはまずビット (1 と 0) を DNA シーケンス (A、C、T、G) にエンコードし、DNA を合成して、それを液体として保存しました。次に、保存された DNA が DNA シーケンサーによって読み取られ、最後に配列がデコード ソフトウェアによってビットに戻されました。
「私たちの最終的な目標は、エンドユーザーにとっては他のクラウド ストレージ サービスとよく似たシステムを運用環境に導入することです。ビットはデータセンターに送信されてそこに保存され、顧客が必要なときにだけ表示されます。」と同氏は述べています。主任研究員 Karin Strauss 氏、ポール G. アレン コンピューター サイエンス アンド エンジニアリング スクールの UW 提携准教授、マイクロソフトの上級研究員。 「そのためには、これが自動化の観点から実用的であることを証明する必要がありました。」
これまで、システムは DNA に 1 ギガバイトのデータを保存することに成功し、以前の世界記録は 200 MB。研究者らによると、保存されたデータには猫の写真、偉大な文学作品、ポップビデオのほか、DNAのアーカイブ記録も含まれており、これらはエラーなく取得されたという。
ただし、欠点は、高価で非常に遅いDNA にデータを書き込むには、DNA を書き込み、その後 DNA からそれを戻すには遅い化学反応が必要であり、これにはファイルの配列を決定してデコードして 0 と 1 に戻す必要があるためです。
「情報は人間や他の生物の DNA ではなく、研究室で作成された合成 DNA 分子に保存され、システムに送信される前に暗号化できます。シンセサイザーやシーケンサーなどの高度な機械はすでにプロセスの重要な部分を実行していますが、これまでの中間ステップの多くは研究室での手作業を必要としていました。しかし、それは商業的な環境では実現不可能だろうと、カリフォルニア大学の上級研究員であるクリス・タカハシ氏は述べた。ポール G. アレン コンピュータ サイエンス & エンジニアリング スクール。
「大勢の人がピペットを持ってデータセンターを走り回るようなことはできません。人的ミスが発生しやすく、コストがかかり、設置面積も大きくなりすぎます」と高橋氏は付け加えた。
Microsoft は、合成 DNA が簡単に長期データを保存できる次の大きな一歩となる可能性があると考えています。 「分子を使用してデータを保存し、制御と処理のために電子機器を使用する、新しい種類のコンピューター システムがここで誕生しているのを私たちは間違いなく目にしています。それらを組み合わせると、将来に向けて非常に興味深い可能性が秘められています」と Ceze 氏は言いました。
ソース:マイクロソフト