La bioinformática que descifra el cáncer: así se traducen ceros y unos en futuras terapias
Ciencia de datos, IA, medicina... Mucho se habla de la investigación multidisciplinar para estudiar el cáncer pero, ¿entendemos cómo se hace y en qué punto está? En medio de las polémicas del CNIO, esta investigadora tiene las claves
Fátima Al-Shahrour, jefa de la unidad de bioinformática del Centro Nacional de Investigaciones Oncológicas. (CNIO/Laura M. Lombardía)
Cuando pensamos en estudiar el cáncer, seguramente nos viene a la cabeza un laboratorio con microscopios de última generación, secuenciadores de ADN y células tumorales en placas de Petri. Pero la ciencia del siglo XXI no se entiende sin algo que tenemos todos en casa: un ordenador. Iniciada en la década de los 60, en los últimos años la bioinformática ha transformado por completo la investigación oncológica y los laboratorios. Por eso, en el espacio de trabajo de una bioinformática no hay pipetas ni tubos de ensayo; sí computadores que ejecutan procesos informáticos complejos.
Es lo que se conoce como un laboratorio seco (dry lab) versus el laboratorio húmedo de toda la vida en el que se manipulan productos químicos y muestras biológicas. Para Fátima Al-Shahrour (Madrid, 1975) todo eso se cultiva detrás de la pantalla. Investigadora referente, es la jefa de la unidad de bioinformática del Centro Nacional de Investigaciones Oncológicas (CNIO), una institución que acumula muchas y variadas polémicas en los últimos años. De hecho, ella forma parte del nuevo equipo de dirección científica del centro, en el que el pasado viernes se nombró nueva gerente. Con el ruido mediático sobre sus cabezas, los investigadores intentan concentrarse en lo que les llevó a parar allí: comprender por qué se producen las mutaciones tumorales, cercenar su crecimiento, encontrar tratamientos eficaces.
Utilizar un ordenador para hacerlo no es un fruto del azar. Los datos de los que se disponen hoy en día son, por suerte, tantísimos, que la única forma de analizarlos es con programas informáticos, algoritmos y matemáticas. “Cuando un investigador quiere resolver un problema biológico o biomédico tiene que tener un conocimiento avanzado de todos esos campos. Por eso es un enfoque muy exigente: requiere conocer distintas áreas y estar actualizado”, explica la investigadora, que para mantenerse al día leer artículos científicos de ingeniería y matemáticas, no solo de medicina.
Con esos ingredientes, esta bioinformática se sienta delante de su ordenador y fija su objetivo: resolver cuestiones complejas en cáncer utilizando cosas que hayan funcionado en otras disciplinas. ¿Por dónde empezar? Como siempre en ciencia, por formular las preguntas adecuadas. “Tienes que definir qué quieres responder y analizar si dispones de datos suficientes y de herramientas adecuadas”, detalla Al-Shahrour. Hace un par de décadas, la respuesta era no. Su avance y una mayor capacidad computacional es lo que ha hecho que este área se catapulte como imprescindible. Eso es lo más fascinante, según la investigadora: encontrar cómo sacarle el máximo partido a los datos oncológicos y crear modelos que ayuden a curar el cáncer. Pero no es tan sencillo.
Más datos de cáncer hereditario y metástasis cerebral
La bioinformática forma parte de una cadena científica. “Generamos hipótesis y con informática, métodos estadísticos e inteligencia artificial, como deep learning (aprendizaje profundo), las validamos. También proponemos nuevas hipótesis”, indica Al-Shahrour. Pero para ello se necesitan datos genómicos, clínicos e imágenes; más y mejores.
“Un modelo puede ser muy bueno, pero si no tenemos datos reales con los que podamos validarlo, no vale para nada. Por ejemplo, los transformadores preentrenados generativos (GPT) han llegado a un límite; queremos explorar esos modelos de lenguaje con datos de salud”, añade. Para ello, menciona una de las grandes tareas sobre la mesa, el aprendizaje federado (federated learning), una técnica de IA que entrena algoritmos de forma descentralizada, directamente en dispositivos locales, sin necesidad de compartir datos sensibles. Algo crucial para hospitales y centros de investigación.
Conseguidos los datos, el siguiente reto es que los resultados no se queden en el ordenador. En su grupo de investigación en el CNIO quieren que sus modelos se puedan usar en sistemas de salud y apoyar de forma directa a la toma de decisiones clínicas. “Hemos desarrollado métodos que hemos validado en cohortes de pacientes y que son fáciles de usar en entornos web; no necesitas saber programar. Si no, se quedan estancos y solo las usan los científicos”, afirma Al-Shahrour, que también es codirectora del Máster de Bioinformática del CNIO, enfocado en medicina personalizada.
Las investigadoras e investigadores de la Unidad de Bioinformática del CNIO. (CNIO)
Uno de sus proyectos, IMPaCT_VUSCan , se enfoca en cáncer hereditario. Junto al Instituto de Investigación Biomédica de Bellvitge (IDIBELL) y otras instituciones reclutan familias que sospechan tener cáncer hereditario, se extraen muestras de los tumores, se secuencian y se obtienen los datos. “Los analizamos con un método basado en IA para detectar qué mutaciones propias de la familia podrían estar relacionadas con una predisposición a desarrollar un tumor”, indica. Con ese flujo de información se genera un informe que los médicos dan a los pacientes, para que sepan si son más predispuestos a sufrir cáncer. “Nada de esto sería posible si los pacientes y los ciudadanos no contribuyeran”, subraya Al-Shahrour.
Otro de sus proyectos, RENACER, estudia metástasis cerebrales, un tipo de cáncer con muy mal pronóstico. “Hacemos una caracterización genómica y aplicamos metodologías bioinformáticas para buscar nuevas terapias para metástasis cerebrales en las que no ha funcionado la cirugía o la radioterapia”, explica. De nuevo, la colaboración de los pacientes, asociaciones y hospitales es clave. Porque, más allá de la frialdad de un ordenador o lo plano de unos datos, Al-Shahrour insiste en que hay que tener en mente siempre a los pacientes.
"Nuestro objetivo es que en un corto tiempo podamos proponer una terapia que pueda ser validada en un ensayo clínico"
Pero los pacientes son muy distintos, igual que los cánceres que pueden sufrir y cómo reaccionan a los tratamientos. Aquí la información genómica, traducida a los ceros y unos de la informática, puede ser un santo grial. “Nosotros estudiamos la heterogeneidad tumoral, no solo la intrapaciente, también la intratumoral. Es decir, las características que pueden tener las distintas células tumorales”, especifica. Esto lo consiguen con nuevas tecnologías como las técnicas de secuenciación de células individuales (single-cell sequencing), que les permiten ir célula a célula. Para visualizarlo en números, hay que imaginarse una matriz numérica; en cada columna, la información de una célula.
Lo último que han creado es un atlas para entender esta heterogeneidad, ahora en revisión científica esperando para ser publicado. “Hemos cogido más de 30 tipos de cáncer, tenemos más de 2 millones de células secuenciadas, hemos integrado todas esas matrices de números sobre cómo se expresan los genes, y esto nos confirma que los tumores son muy heterogéneos”, detalla. Esto explica por qué algunos cánceres son tan difíciles de erradicar, pero también arroja luz sobre cómo las terapias y fármacos que funcionan para unos tipos podrían ser útiles para otros.
Al-Shahrour utiliza métodos informáticos para traducir analizar las mutaciones de las células tumorales. (Laura M. Lombardía / CNIO)
“Si computacionalmente podemos analizarlos todos, podemos ver lo que es diferente pero también lo común, y así proponer nuevas soluciones”, y estas podrían saltar directamente del ordenador a un ensayo clínico. Puede que, en el futuro, los oncólogos decidan qué fármacos suministrarán a sus pacientes después de pasar su genoma por un programa informático. De momento, hay que seguir investigando, ¿y qué falta? Como siempre, financiación.
Una carrera que ganan las 'big tech'
El cáncer es la enfermedad que recibe más financiación pública para investigación en España. En el caso de Al-Shahrour, su grupo se nutre de la que recibe el CNIO y las que ellos aplican en ayudas nacionales y proyectos europeos. Siempre hace falta más, pero la experta pone el foco en algo concreto: financiación en infraestructuras.
“Uno de los grandes cuellos de botella es no tener la infraestructura adecuada para poder testar y entrenar los modelos e integrar los datos oncológicos. Los centros nacionales de supercomputación sí la tienen”, especifica. Y no solo ellos, también las grandes empresas, que atraen talento y aprovechan lo construido. Al-Shahrour pone como ejemplo el Nobel de AlphaFold, la herramienta de Google DeepMind para predecir proteínas, que se pudo desarrollar gracias a la cantidad ingente de datos que laboratorios de todo el mundo habían generado.
"Hay que apostar por el desarrollo de infraestructuras para que no haya una exclusión tecnológica en centros de financiación pública"
“Que los que trabajen en esto formen parte de empresas como OpenAI o Google DeepMind está bien si son iniciativas colaborativas, pero partimos con desventaja. Las instituciones públicas no podemos competir con sus recursos de infraestructura ni recursos humanos”, expone. La investigadora explica con preocupación que los investigadores encuentran en este tipo de empresas mayores oportunidades económicas, y que esto hace perder la carrera a la investigación pública. Es un riesgo, porque “se están desarrollando métodos que pueden ser cajas negras y van a acabar en entornos de investigación”.
“Algo que hemos aprendido siempre en ciencia es que hay que mantener la prudencia, porque con enfermedades como el cáncer la gente es muy sensible y los resultados pueden necesitar 3, 5 o diez años en ser efectivos. Pero a la vez, hay que mostrar que un resultado puede ser prometedor y que la ciencia avanza, aunque requiera su tiempo. Lo único que la puede acelerar es la financiación”, insiste.
No es solo la polémica de Barbacid. Los escándalos tras la destitución de María Blasco y Juan Arroyo, el cierre de varias unidades científicas, el cese de trabajadores este arranque de año… La crisis reputacional que arrastra la institución genera un ambiente de tensión entre las paredes de un centro cuyo objetivo requiere, cuando menos, concentración. Al-Shahrour es una de las investigadoras que respaldaba un cambio, y dice que espera se aclare todo cuanto antes: “Como científicos continuamos, los proyectos siguen, luchamos para que la investigación no pare. Duele ver que pasan estas cosas, porque lo que hay que hacer es generar confianza para que se siga hablando de ciencia”.
Cuando pensamos en estudiar el cáncer, seguramente nos viene a la cabeza un laboratorio con microscopios de última generación, secuenciadores de ADN y células tumorales en placas de Petri. Pero la ciencia del siglo XXI no se entiende sin algo que tenemos todos en casa: un ordenador. Iniciada en la década de los 60, en los últimos años la bioinformática ha transformado por completo la investigación oncológica y los laboratorios. Por eso, en el espacio de trabajo de una bioinformática no hay pipetas ni tubos de ensayo; sí computadores que ejecutan procesos informáticos complejos.