Cuprins:
- Un câmp avansat rapid
- Redundanță încorporată și necesitatea corectării erorilor
- Încasare - în orice zi acum
Video: Genomul întunecat (Noiembrie 2024)
Inginerii au împins cu succes mai mult spațiu de depozitare în spații mai mici de zeci de ani, dar asta nu poate continua. Următorul mare salt în stocarea datelor ar putea lua forma ADN-ului în toată materia organică: Oamenii de știință din laboratoarele din toată țara experimentează ADN-ul sintetic ca mediu de stocare.
„Dacă te uiți unde merge electronica, tehnologia siliciu, o mulțime de tehnologii de bază pe care le folosim pentru a construi computere astăzi, ne apropiem de limită în aproape toate”, spune Luis Henrique Ceze, profesor asociat de informatică și inginerie la Universitatea din Washington. „ADN-ul este foarte dens, este foarte durabil și necesită foarte puțină putere de întreținere, așa că există multe avantaje ale utilizării ADN-ului pentru stocarea datelor”.
Ceze a colaborat cu Karin Strauss, cercetător în arhitectură computerizată cu Microsoft Research, la o colaborare între cele două instituții - un proiect care puntează informatică și biologie. Pentru o echipă de aproximativ 20 de persoane, universitatea oferă biologilor moleculari, iar Microsoft oferă informaticienilor.
Pentru a înțelege modul în care ADN-ul ar putea fi utilizat pentru stocare, luați în considerare că toate datele computerului sunt binare sau de bază 2. ADN-ul este de bază 4, compus din adenină, citosină, guanină și timină (prescurtată ca A, C, G și T). Primul pas este transformarea informațiilor de bază 2 în baza 4, deci A corespunde la 00, C la 01, G la 10 și T la 11 (asta o simplifică puțin, dar trece peste idee).
Apoi, oamenii de știință folosesc o mașină numită sintetizator de ADN pentru a combina cele patru substanțe chimice în ordinea corectă. Rezultatul stochează informația de mai multe ori ca un cluster asemănător sării mai mic decât vârful unui creion. Citirea informațiilor înapoi necesită un secvențitor ADN.
În timp ce acest lucru poate părea fragil - cum ar fi ceva care s-ar putea arunca când o ușă se deschide brusc - ADN-ul este cel mai puternic mediu de stocare a datelor pe care l-am văzut. Oamenii de știință au citit cu succes ADN-ul care are sute de mii de ani.
Secvențializarea ADN-ului presupune eliminarea unui pic minuscul din materialul depozitat, iar procesul epuizează proba respectivă. În consecință, o înregistrare ADN poate fi citită de un număr finit de ori. Aceasta nu este o problemă, însă, din moment ce materialul stocat are atât de multe date redundante; acesta poate fi eșantionat repetat. Mediile de stocare de astăzi au, de asemenea, un număr limitat de cicluri de scriere și citire înainte de a eșua, deci nu este nimic nou.
După cum subliniază Ceze, ADN-ul nu va fi niciodată învechit. În timp ce mulți dintre noi avem dischete în spatele unui sertar pe care nu îl mai putem citi, aceasta nu va fi soarta ADN-ului. „Întotdeauna avem grijă de ADN pentru științele vieții și din motive de sănătate, așa că veți avea întotdeauna un mod de a citi informațiile stocate în ADN”, spune Ceze.
În iulie 2016, Microsoft și Universitatea din Washington au codat cu succes 200MB de date în formă ADN, cel mai bun record record de 22MB. Folosind ADN, Strauss spune, va fi posibil să stochezi 1 exabyte de date - adică 1 miliard GB - într-un cub de 1 inch.
„Am făcut o estimare a cât de multe date puteți pune într-un anumit volum”, spune Strauss. „Am încercat să estimăm care ar fi volumul dacă astăzi am fi decis să arhivăm întregul Internet accesibil, adică tot ceea ce nu se află în spatele unei parole sau a vreunui tip de perete electronic și am venit cu dimensiunea unei cutii mari de încălțăminte.”
Aceasta pare a fi o propunere îndepărtată, dar Ceze crede că vom vedea sisteme comerciale de stocare a ADN-ului pe piață într-un deceniu. Nu vor funcționa exact ca stocarea microprocesorului, deoarece ADN-ul necesită un mediu chimic umed pentru creare, dar vor oferi capacitate masivă și acces aleatoriu la aceleași viteze pe care le oferă acum sistemele cu bandă de întreprindere.
Un câmp avansat rapid
ADN-ul a fost în jur de miliarde de ani, dar demonstrațiile ADN-ului ca tehnologie de stocare utilizabilă au început în 1986, când cercetătorul MIT, Joe Davis, a codat o simplă imagine binară în 28 de perechi de baze de ADN.
Un alt pionier în acest domeniu este George Church, un profesor de genetică care lucrează la Harvard Medical School din 1977 și conduce propriul laborator din 1986. Biserica a fost interesată să reducă costurile cititului și scrierii ADN din anii '70, crezând că într-o zi s-ar uni pentru a crea stocarea practică a datelor. A devenit interesat să lucreze la cercetarea ADN în jurul anului 2000 și a efectuat teste de secvențare și sinteză critică în 2003 și 2004. Până în 2012, a fost capabil să pună ambele zone și să creeze un sistem de codificare a datelor. El a scris acea lucrare într-un influent articol din 2012 în Science .
"Înainte de 2003 și '04, secvențierea și sinteza au fost făcute în esență în capilare - sau tuburi mici - unde ați avea un tub pe secvență", explică Church. „A fost destul de manual și nu poate fi scalabil. Lecția pe care am învățat-o din industria semiconductorilor de microfabricare a fost necesară pentru a găsi un mod de a le pune în esență într-un plan bidimensional și apoi a reduce dimensiunea caracteristicii. Nici unul dintre acestea metodele bazate pe coloane erau compatibile cu asta, și astfel, în 2003, am arătat cum puteți distribui secvențe pe un plan bidimensional și apoi imaginați-le cu imagini fluorescente, care este acum modul dominant de secvențiere. Apoi, în 2004, am arătat că puteți fabrica ADN-ul pe un avion și apoi îl puteți aluneca, apoi ar putea fi și mai compact, astfel încât avionul a fost doar un loc temporar pentru a le sintetiza. Apoi, le puteți compacta într-un obiect tridimensional de milioane de ori mai compact decât stocarea datelor obișnuite.
„Acestea au fost o dovadă a exercițiilor de concept în 2003 și 2004. În 2012, noi și alții am perfecționat atât metodele de citire, cât și scrierea ADN-ului și le-am reunit într-un singur experiment în care am codificat o carte pe care tocmai am scris-o în ADN, inclusiv imagini, arătând că practic orice este digital ar putea fi codat cu ADN ".
Deși costurile reprezintă un obstacol semnificativ pentru stocarea ADN-ului, Church notează că prețul a scăzut brusc în scurt timp în care s-au făcut cercetările. Costul lecturii ADN-ului s-a îmbunătățit de aproximativ 3 milioane de ori, în timp ce costul scrisului s-a îmbunătățit de un miliard de ori. El îi poate vedea amândoi îmbunătățindu-se cu încă un milion de ori în chiar mai puțin timp. El subliniază, de asemenea, că costul copierii materialului ADN este aproape gratuit, la fel și costul stocării pe termen lung. Pentru stocarea arhivistică, costul citirii datelor nu este un mare obstacol, deoarece multe materiale arhivate nu sunt citite niciodată, iar unele elemente sunt citite selectiv. Uită-te la costurile întregului sistem, recomandă el. Metodele tradiționale de stocare se mișcă cu viteza Legii lui Moore și se vor plăcu în curând. Dar tehnologia de stocare a ADN-ului se mișcă mai repede decât legea lui Moore și nu arată semne de platou.
Arhivarea și stocarea în cloud este locul unde Biserica vede că stocarea datelor ADN este adoptată mai întâi. Companiile care includ IBM, Microsoft și Technicolor au propriile echipe de cercetare și dezvoltare care studiază zona, notează el. El a colaborat cu Technicolor în 2015 pentru a stoca O călătorie pe lună , un film clasic din 1902 cândva credea pierdut, la ADN. Acum, Technicolor are multe copii ADN care, combinate, nu sunt mai mari decât o pulbere de praf.
Biserica are un laborator de 93 de oameni care lucrează la stocarea ADN și se concentrează în prezent pe două obiective. Prima este îmbunătățirea radicală a vitezei pe ciclu. Informațiile sunt stocate în sute de straturi, fiecare la fel de gros ca o moleculă. În prezent, fiecare adăugare durează trei minute, dar Biserica consideră că poate fi redusă la mai puțin de o milisecundă. Acesta a observat că este de 200.000 de ori mai rapid și înseamnă o schimbare de la chimia organică la biochimie. De asemenea, el dorește să schimbe modul în care sunt fabricate instrumentele utilizate pentru citit și scris pentru a le face mult mai mici. În prezent, au dimensiunea frigiderelor mari. Vrea să se reducă.
Redundanță încorporată și necesitatea corectării erorilor
Un cercetător care a fost influențat de articolul științific al Bisericii din 2012 este profesorul Olgica Milenkovic de la Universitatea din Illinois, Urbana-Champaign. Articolul menționa nevoia de codificare, ceea ce a declanșat imediat interesul ei. Codificarea în cercetarea de stocare este o tehnică pentru adăugarea redundanței la date, redundanță care poate fi utilizată ulterior pentru a corecta erorile care apar în timpul procesului de citire și scriere. Pentru un exemplu de ce acest lucru este important, consultați cele două imagini Citizen Kane aici. Ambele au fost codificate în ADN de echipa lui Milenkovic și apoi citite. Ghiciți care a folosit redundanța.
Aveți dreptate: imaginea din stânga a fost codată cu redundanță, iar imaginea din dreapta nu.
Un mod simplu de adăugare a redundanței este repetarea fiecărui personaj de un număr stabilit de ori. Decat sa scrii un 0, scrie-l de patru ori. Aceasta este abordarea forței brute - simplă, dar extrem de ineficientă. Lucrarea lui Milenkovic vizează realizarea aceleiași corecții a erorilor într-un mod mai sofisticat. Ea implică tehnici numite verificări de paritate sau verificări liniare ale congruenței pentru a oferi modalități de verificare a datelor.
"Întregul câmp, este practic să vă ajute să corectați erorile dacă apar sau, chiar mai bine, să evitați erori pe care știți că sunt foarte susceptibile să apară", spune Milenkovic. "Introducem redundanța controlată pentru a scăpa de erori și că redundanța controlată nu este sub formă de repetare simplă, deoarece aceasta este foarte ineficientă."
Asta a adus-o pe Milenkovic în domeniu, însă cercetările ei acum sunt despre reducerea costului masiv al sintezei ADN-ului.
"Studentul meu, H. Tabatabae Yazdi, care a fost foarte activ pe acest subiect și am încercat foarte mult să găsesc o modalitate inteligentă de a evita sinteza ADN. Sintezarea ADN-ului este absolut un blocaj pentru această tehnologie din cauza costurilor mari ", Spune Milenkovic.
Deși Milenkovic nu dorește să dezvăluie prea multe despre cercetările nepublicate, soluția ei implică „abordări matematice vicleane” și se referă la sincronizare, în care mărimea intervalului dintre informații este semnificativă.
„Dacă nu te conformezi formalității pe care vrei să o folosești ATGC-urile pentru a codifica cu adevărat simbolurile binare într-o anumită locație, poți veni cu mijloace mult mai inteligente și mai eficiente de stocare a informațiilor, pentru că nu trebuie să sintetizezi șiruri de-a lungul timpului din nou ", explică Milenkovic. „Le puteți sintetiza o dată într-un anumit mod și apoi reutilizați ADN-ul acela sintetizat într-o manieră inteligentă combinatorie”.
Prin activitatea sa, Milenkovic speră să reducă costurile de sinteză a ADN-ului cu cel puțin trei ordine de mărime. Încă nu este suficient, observă ea, dar este un progres. De asemenea, contribuie la o linie de cercetare pe care o consideră fascinantă.
„Este foarte interesant, să fii sincer, să-l joci pe Dumnezeu și să-ți codifici propriile informații în ADN”, spune Milenkovic. "Oferă unei persoane un sentiment de entuziasm să știe că te joci cu o moleculă aleasă a naturii și o face să facă ceea ce vrei să stochezi și să codifici și să transmită informații către viitor."
Încasare - în orice zi acum
Nu este doar o cercetare academică praf uscată cu stocare ADN. Helixworks, o companie cu sediul în Irlanda, încearcă să câștige deja bani. Are un produs pe Amazon - un fel de.
„Am lansat pe Amazon, astfel încât să puteți obține 512KB de date digitale codificate în ADN”, explică Nimesh Pinnamaneni, cofondatorul companiei. "Este ceva foarte mic. Poate o poză sau poate un poem, ceva de genul acesta."
Este o achiziție neobișnuită, dar ar putea fi simbolul de dragoste perfect pentru persoana care are totul, mai ales dacă acea persoană este un om de știință:
"Îmi amintesc de un client care ne-a sunat. El a vrut să-și ofere soția - ambii sunt biotehnologi - a vrut să-și ofere soția la aniversarea nunții lor. El a vrut să pună un mesaj în ADN și să îi ofere un ADN", își amintește Pinnamaneni. "Ar trebui să ordoneze ADN-ul pentru a citi mesajul. Este un mod destul de complicat de a trimite un mesaj de dragoste, dar poate este drăguț pentru biotehnologi, știi?"
Însă Helixworks și-a dat un pic înainte de a-și posta produsul pe Amazon în august 2016, înainte de a fi gata să îndeplinească comenzile. Două persoane au achiziționat compania DNADrive de 199 de dolari a companiei - o capsulă de aur de 14 carate cu un grup de ADN în interior - înainte ca Helixworks să fie forțat să-și elimine produsul. DNADrive este încă pe Amazon, dar nu este achiziționabil.
Asta nu înseamnă că Helixworks s-a terminat, doar prea dornic. A venit prea departe pentru a mă opri acum. Compania a început la Universitatea Borås din Suedia, unde Pinnamaneni (foto sus, stânga) și Sachin Chalapati (dreapta), celălalt cofondator al companiei, obțineau master în biotehnologie. Ei au strâns fonduri pentru cercetarea stocării ADN, și-au continuat activitatea odată întoarsă acasă în Bangalore, India și au dezvoltat o dovadă a conceptului.
Obținerea de fonduri suplimentare i-a adus în programul de accelerare IndieBio, condus de SOSV, o firmă de capital de startup din San Francisco, California. Helixworks a fost selectat de program și a câștigat 50.000 de dolari în numerar și capacitatea de a lucra de la un laborator din County Cork, unde a fost în ultimele șase luni. Programul include consiliere pentru pitching-ul unui produs, pe care Helixworks îl va folosi la festivalul South by Southwest din acest an, unde va concura într-un eveniment pitch.
În timp ce eliminarea capsulelor de ADN de aur ar putea fi în cele din urmă un punct de vedere lucrativ, Pinnamaneni spune că viitorul companiei sale este în casele compacte și imprimantele ADN de birou pe care le dezvoltă acum. El vrea să facă stocarea ADN-ului destul de ușor și accesibil pentru oricine să o folosească.
„Ne-am dat seama că trebuie să aveți ceva care să funcționeze ca un cartuș într-o imprimantă”, explică Pinnamaneni. "Aveți doar patru culori, iar aceste patru culori se pot combina pentru a forma orice culoare posibilă, nu? Așa funcționează imprimanta dvs. de cerneală. Ne-am dat seama că trebuie să avem așa ceva în sistemul nostru. Am conceput un cartuș de 32 de reactivi care pot fi combinate pentru a forma orice secvență ADN posibilă."
În timp ce alte laboratoare plătesc în jur de 30.000 de dolari de fiecare dată când au nevoie să sintetizeze ADN-ul, operație care durează săptămâni întregi, Pinnamaneni spune că invenția sa poate reduce costurile și timpul în mod dramatic. Helixworks lucrează cu Opentrons, o companie care produce echipamente de laborator automatizate, pentru a crea imprimanta. Asta va juca la SXSW.
„Ceea ce vom demonstra pe podeaua expoziției este scrierea ADN chiar înaintea ochilor tăi”, spune Pinnamaneni.
Compania nu va lua încă comenzi. Și este bine, pentru că acel biotehnolog romantic își așteaptă încă cadoul aniversar.