Dos españoles crean un 'software' pionero para convertir los genes en discos duros
El experto en ciberseguridad José Antonio Calles y la bioquímica Patricia Rada han desarrollado un programa que traduce el lenguaje binario al idioma del ADN
En 1982, el peculiar artista estadounidense Joe Davis entró en el Centro de Estudios Visuales Avanzados del MIT para pedir una beca de investigación. La secretaria llamó a la policía debido a sus malos modales, pero Davis acabó saliéndose con la suya: tres cuartos de hora después, tenía una cita para comenzar el programa que había solicitado, una colaboración que duró más de una década.
A este polémico pionero del bioarte se le metió en la cabeza que los genes eran un lienzo perfecto. Así que, en 1986, convenció al biólogo molecular Dan Boyd y su equipo de la Universidad de Harvard para codificar una imagen en material genético bacteriano. Davis se convirtió así en el primero en guardar información en el ADN de un ser vivo: diseñó una secuencia que codificaba un símbolo germánico para la vida y la feminidad. Bautizado como Microvenus, el mensaje fue introducido en la bacteria ‘E. coli’.
Gracias al desarrollo de las técnicas de edición genética, entre otros avances, la idea de almacenar datos en microorganismos no parece hoy tan alocada como en los 80. Lo pueden confirmar el experto en ciberseguridad Juan Antonio Calles y la bióloga Patricia Rada, creadores de una aplicación capaz de traducir al lenguaje del ADN cualquier tipo de archivo, de documentos a vídeos, para guardarlo en el material genético de bacterias vivas. Una herramienta que han presentado en la última edición de la conferencia sobre ciberseguridad RootedCON, celebrada en Madrid a principios de mes.
Su trabajo se basa en estudios previos cuyos autores han utilizado las tijeras moleculares CRISPR para engarzar las piezas que guardan la información en el ADN de los seres vivos. Uno de los últimos, publicado en la revista ‘Nature’, describía cómo es posible codificar varias imágenes y un GIF en el material genético de bacterias.
"Nos dimos cuenta de que bioquímicamente se está explorando al límite de los avances existentes, pero, desde el punto de vista informático, se habían cometido ciertos errores y había margen de mejorar, sobre todo a nivel de compactación y automatización", explica a Teknautas Calles, máximo responsable de la empresa de seguridad Zerolynx. "La mayoría de los que diseñan estas técnicas son químicos o biólogos, pero hay pocos informáticos".
A lo largo de este año, la pareja ha estudiado diferentes algoritmos, hasta encontrar el más eficiente, para desarrollar la aplicación Bacter10, una especie de traductor automático del idioma binario al lenguaje genético que "permite convertir cualquier archivo en secuencias de ADN".
Han utilizado las tijeras moleculares CRISPR para engarzar las piezas que guardan la información en el ADN de los seres vivos
"Hasta ahora, para codificar una imagen, los investigadores cogían el código binario y hacían una codificación simple en bases de ADN [las unidades que conforman la doble hélice]", detalla Calles. Este método, dice, hacía imposible que la información se compactara, de forma que "se perdía mucha eficiencia en el proceso". El algoritmo desarrollado por Calles y Rada, sin embargo, optimiza esta traducción.
"Inicialmente le pasamos el archivo que queremos codificar y, automáticamente, genera un fichero con los 'protospacers' o fragmentos de ADN", señala el experto en seguridad. Las cadenas a las que se refiere Calles, que en español se conocen como protoespaciadores, son trozos de ADN de virus que las bacterias incorporan a su material genético para combatir nuevas infecciones y que forman parte del sistema de defensa bacteriano CRISPR/Cas, en el que se basa la herramienta molecular homónima.
Así, la aplicación Bacter10 indica a los científicos las bases que codifican la imagen, el texto o el vídeo. Con esta información, sólo habría que fabricar esos fragmentos de ADN e introducirlos en la bacteria, que los reconocería y los añadiría a su material genético.
El proceso de lectura
Si se quiere extraer el archivo de la bacteria, las tijeras CRISPR sabrán por dónde cortar, pues los protoespacioadores actúan como línea de puntos: indican no solo la presencia del fragmento que guarda la información, sino también de qué archivo se trata exactamente, en caso de que se haya guardado más de uno. El ‘software’ es capaz de hacer la traducción a la inversa, de manera que puede convertir los fragmentos de ADN de nuevo a código binario para reproducir la foto, el vídeo o el texto que guardan.
"Hemos conseguido generar cinco bytes almacenables por bacteria, es bastante información teniendo cuenta su tamaño microscópico", dice Calle. Como máximo, se han logrado guardar unos 35 bytes en cada microorganismo. Por eso, cuando se trata de un archivo muy grande "hay que romperlo en trocitos" que se introducen en miles de bacterias acompañados por identificadores químicos.
Hemos conseguido generar 5 bytes almacenables por bacteria, es mucha información dado su tamaño microscópico
Uno de los principales problemas que entraña la fabricación de soportes de almacenamiento vivos es la mutabilidad del ADN, sobre todo del bacteriano. Si los genes se alteran, la información dejará de ser la que se guardó inicialmente. Otro es que debe haber una relación constante entre ciertos tipos de bases en los fragmentos generados. El algoritmo de Bacter10 está diseñado para resolver estos problemas informáticamente, aunque el tiempo continúa siendo un factor limitante. "Se tarda mucho en codificar un fragmento de ADN", dice el experto en seguridad.
¿Para qué sirve un disco duro biológico?
El torrente de información que la humanidad está generando (solo en los últimos años se ha creado un volumen mayor que en toda la historia precedente) no tardará mucho en superar la capacidad que tenemos para almacenarla con los medios actuales a nuestra disposición. Emplear técnicas que conviertan el ADN en un disco duro biológico atajaría ese problema de raíz.
Para Calles, aún hace falta investigación y un buen aporte económico para que podamos tener discos duros biológicos, pero llegarán. Según las estimaciones de la International Data Corporation, el volumen de datos de internet alcanzará los 40 zettabytes en el 2020, una cantidad que podría guardarse en unos 90 gramos de ADN. Si el cuerpo humano tiene alrededor de 200, “podríamos almacenar todo internet en el ADN humano”. O llevar el DNI escrito en nuestros genes.
No solo sería un soporte ultracompacto en el que almacenar datos (no se conoce otro capaz de almacenar una densidad ni remotamente comparable), sino que además tendría enormes ventajas desde el punto de vista de la conservación. A diferencia de otros medios físicos (como un viejo casete, un CD, un pendrive o un disco duro), el ADN no se queda obsoleto ni se degrada con el tiempo si las condiciones son propicias. Puede durar cientos, miles o hasta millones de años si se conserva protegido del agua y el oxígeno, en un lugar fresco y seco.
De esta forma, no solo sobreviviría a cualesquiera tecnologías que se vayan sucediendo, sino que podría perdurar más que las propias civilizaciones. La suma del conocimiento humano podría preservarse, de este modo, a prueba de cualquier fallo técnico, para la posteridad. La prueba es que el genoma de los extintos mamuts se ha podido secuenciar tras más de 60.000 años enterrado en el hielo siberiano. Y los restos humanos descubiertos en la Sima de los Huesos tenían ADN todavía más antiguo: de hace unos 400.000 años.
Además, escribir y leer datos de un disco duro biológico sería muy escalable, pues las tecnologías más modernas ya son capaces de editar grandes cantidades de ADN de una tacada. El inconveniente es que el proceso de guardar y recuperar información, al menos tal y como se realiza hoy en día, es demasiado lento. Lo que sí sería rápido y relativamente sencillo es copiarla tantas veces como se quisiera una vez codificada. Por ello, podría resultar idóneo para realizar funciones de archivo, pero aún estaría lejos de responder a la demanda de inmediatez de la Red.
La suma del conocimiento humano podría preservarse, de este modo, a prueba de cualquier fallo técnico, para la posteridad
No obstante, el principal obstáculo, como anticipaba Calles, es el elevado coste que aún entrañan las técnicas. Se estima que leer un solo megabyte de ADN cuesta unos 200 euros, una ganga al lado de los más de 10.000 euros que se necesitan para escribirlo. Sin embargo, estas cifras se están reduciendo con el tiempo (hace unos años las partidas eran millonarias), mientras que la necesidad de gigantescos ‘data centers’ se vuelve cada vez más inasumible desde el punto de vista económico.
Es de esperar que llegue el punto en que resulte más barato almacenar información en los genes que seguir construyendo estas instalaciones enormes a un ritmo cada vez mayor. Y quizá en ese momento los centros de datos de Google, Facebook y Amazon se vean reemplazados por unos cuantos camiones de ADN. Un futuro que seguro encantaría a Joe Davis.
En 1982, el peculiar artista estadounidense Joe Davis entró en el Centro de Estudios Visuales Avanzados del MIT para pedir una beca de investigación. La secretaria llamó a la policía debido a sus malos modales, pero Davis acabó saliéndose con la suya: tres cuartos de hora después, tenía una cita para comenzar el programa que había solicitado, una colaboración que duró más de una década.