Nel precedente articolo abbiamo visto come sia possibile archiviare l'informazione digitale (e quindi anche analogica digitalizzata) sotto forma di DNA e quali vantaggi offra (--> DNA come pendrive del futuro).
Rimaniamo sul tema parlando del progetto #MemoriesInDNA il cui fine, come dice il nome, è quello di archiviare le proprie foto (o qualunque immagine si ritiene debba essere conservata) nel DNA, a beneficio della scienza e delle generazioni future.
Se uno potesse scegliere quale immagine conservare per migliaia di anni, avrebbe l'imbarazzo della scelta. Potrebbe essere la foto della sua famiglia, un paesaggio a rischio, una istantanea fatta in un momento irripetibile o anche la pagina di un libro di poesie. Sarebbe come mettere l'informazione in una bottiglia di vetro immaginaria e lasciarla galleggiare nell'oceano del tempo fino al suo approdo in una spiaggia del futuro dove verrebbe rimirata dai nostri discendenti.
Ovviamente perché questo sia fattibile è fondamentale immaginare una discendenza tecnologicamente capace di analizzare il DNA e non regredita (come immaginato da HG Wells) in una umanità selvaggio-bucolica.
I ricercatori dell'Università di Washington (UW), in collaborazione con la Twist Bioscience, hanno cominciato a raccogliere 10 mila immagini originali da tutto il mondo con lo scopo di immagazzinarne l'informazione sotto forma di DNA sintetico.
I ricercatori hanno già codificato nel DNA immagini di documenti storici come "La dichiarazione universale dei diritti umani", i primi 100 libri del Project Gutenberg, brani del Montreux Jazz Festival e persino un video musicale degli OK Go.
Ma il progetto è aperto a tutti. Chiunque voglia inviare fotografie originali che ritiene meritevoli di essere tramandate (anche solo perché importanti per chi le ha scattate le può caricate sul sito del consorzio (http://memoriesindna.com/) oppure mediante Twitter usando l'hashtag #MemoriesInDNA.
Alcune delle immagini salvate
(all credit to: University of Washington)
Nota. Per essere inclusi nella raccolta di immagini DNA, le fotografie non possono essere protette da copyright e devono essere prive di contenuti violenti o inappropriati. Il set di dati dell'immagine sarà conservato nel DNA indefinitamente e condiviso con ricercatori di tutto il mondo. Per ulteriori informazioni vi rimando al sito #MemoriesInDNA Project.
Archiviare la massa di dati digitali come DNA è vista dai ricercatori come la soluzione per colmare il divario tra la quantità di dati digitali generati oggi - da qualsiasi cosa, dai video commerciali alle immagini spaziali alle cartelle cliniche - e la nostra capacità di archiviali in modo economico, efficiente e soprattutto duraturo.
A differenza dei data center, che richiedono molto spazio e risorse (sia come strutture che energetiche, circa il 2% del consumo totale di elettricità negli Stati Uniti) le molecole di DNA possono memorizzare le stesse informazioni con un risparmio di spazio di milioni di volte. Il processo di base è concettualmente semplice e si basa sulla conversione delle stringhe di "1" e "0" digitali nei quattro elementi costitutivi fondamentali delle sequenze di DNA (le basi adenina, guanina, citosina e timina). Il passaggio ovviamente deve bidirezionale, cioè è necessario che dal DNA sia possibile recuperare in modo univoco l'informazione digitale per ricostruire l'immagine.
I ricercatori della UW e della Twist Bioscience sono esperti in questo processo, non a caso detengono il record mondiale per la quantità di dati memorizzati nel DNA.
Con l'accumularsi delle immagini "stoccate" nel DNA la sfida che attende i ricercatori è quella di identificare facilmente una o più immagini "di interesse" sfruttando dei "tag" (etichette) identificative.
Ipotizziamo ad esempio che ci sia un trilione di immagini codificate nel DNA e che tu voglia recuperare solo quelle fotografie che mostrano una macchina rossa oppure se c'è il volto di una persona (e magari quale). Per poterlo fare è necessario che quelle informazioni siano contenute (e recuperabili) nel DNA come mini indici riassuntivi. Anche in questo caso "come farlo" non è difficile da immaginare una volta che si tiene presente che il DNA è costituito da una doppia elica complementare e antiparallela
In termini semplici la sequenza su una elica determina quella dell'altra per ragioni di complementarietà delle basi. La "A" si appaia con la "T" e la "C" con la "G"). Quindi nell'informazione digitale si introducono delle sequenze che definiscono "auto" e "rosso", sarà possibile produrre delle mini sequenze di DNA specifiche per queste due informazioni, con le quali andare a "catturare" solo le immagini idonee. Ancora una volta il modo per "catturare" il DNA utile non è complesso; se le sequenze "esca" a singola elica vengono associate a nanoparticelle magnetiche e queste vengono poi mischiate al DNA del "database", sarà sufficiente usare un magnete per estrarre il DNA bersaglio "utile" che si sarà "appaiato" al DNA esca, e quindi procedere all'analisi dell'informazione.
Questo è solo un esempio minimo di quello che i ricercatori vogliono fare. Algoritmi di intelligenza artificiale cercheranno di ricavare le informazioni per indicizzare tutte i dati presenti in una data fotografia, come i colori, la presenza di linee, curvature, oggetti, ... . Del resto si tratta di informazioni che sono già presenti nel file digitale e che di conseguenza sono presenti anche nel DNA sintetico. Diventerà così possibile capire subito dall'analisi di un petabyte di informazioni (meno di un grammo di DNA, che seccato equivale ad un piccolo deposito biancastro sul fondo di una provetta) se in quello stock di immagini ci sono (ad esempio) più macchine rosse o blu in una fotografia, se ci sono persone e se sono a piedi o in bicicletta, etc etc.
In termini semplici la sequenza su una elica determina quella dell'altra per ragioni di complementarietà delle basi. La "A" si appaia con la "T" e la "C" con la "G"). Quindi nell'informazione digitale si introducono delle sequenze che definiscono "auto" e "rosso", sarà possibile produrre delle mini sequenze di DNA specifiche per queste due informazioni, con le quali andare a "catturare" solo le immagini idonee. Ancora una volta il modo per "catturare" il DNA utile non è complesso; se le sequenze "esca" a singola elica vengono associate a nanoparticelle magnetiche e queste vengono poi mischiate al DNA del "database", sarà sufficiente usare un magnete per estrarre il DNA bersaglio "utile" che si sarà "appaiato" al DNA esca, e quindi procedere all'analisi dell'informazione.
Questo è solo un esempio minimo di quello che i ricercatori vogliono fare. Algoritmi di intelligenza artificiale cercheranno di ricavare le informazioni per indicizzare tutte i dati presenti in una data fotografia, come i colori, la presenza di linee, curvature, oggetti, ... . Del resto si tratta di informazioni che sono già presenti nel file digitale e che di conseguenza sono presenti anche nel DNA sintetico. Diventerà così possibile capire subito dall'analisi di un petabyte di informazioni (meno di un grammo di DNA, che seccato equivale ad un piccolo deposito biancastro sul fondo di una provetta) se in quello stock di immagini ci sono (ad esempio) più macchine rosse o blu in una fotografia, se ci sono persone e se sono a piedi o in bicicletta, etc etc.
L'interesse da parte di finanziatori e istituzioni non manca. La UW ha ricevuto recentemente circa 6,3 milioni di dollari di finanziamento per implementare il processo rendendolo sempre più veloce e soprattutto facilmente "leggibile".
Nessun commento:
Posta un commento