Las computadoras ayudan a estudiar los virus de animales que podrían infectar a humanos
A Colin Carlson, un biólogo de la Universidad de Georgetown, comienza a preocuparle la viruela del ratón.
El virus que la provoca, descubierto en 1930, se propaga causándoles la muerte a los ratones con despiadada eficiencia. Pero los científicos nunca lo han considerado como una posible amenaza para los seres humanos. Ahora, Carlson, sus colegas y sus computadoras no están tan seguros de que eso sea así.
Mediante una técnica conocida como aprendizaje automático, los investigadores han pasado algunos años programando las computadoras para que estas se enseñen a sí mismas cuáles virus pueden infectar células humanas. Las computadoras han revisado enormes cantidades de información sobre la biología y la ecología de los animales que hospedan a esos virus, así como de los genomas y otras características de los virus. Con el paso del tiempo, las computadoras llegaron a reconocer algunos factores que podían predecir si un virus tiene la capacidad de pasar a los seres humanos.
Después de que las computadoras probaron su eficiencia con los virus que los científicos ya habían estudiado a profundidad, Carlson y sus colegas las utilizaron con los no conocidos y, al final, elaboraron una pequeña lista de virus que afectan a los animales y que tienen la capacidad de traspasar la barrera de las especies y ocasionar brotes en los seres humanos.
De manera inesperada, las últimas veces, los algoritmos colocaron al virus de la viruela del ratón en los primeros lugares de la lista de patógenos peligrosos.
“Todas las veces que usamos este modelo, este virus aparece muchísimo”, señaló Carlson.
Desconcertados, Carlson y sus colegas indagaron en la literatura científica y encontraron registros de un brote aparecido en 1987 en la zona rural de China al que durante mucho tiempo no se le prestó atención. Algunos niños de primaria contrajeron una infección que hacía que se les irritara la garganta y se les inflamaran las manos y los pies.
Años después, un equipo de científicos realizó pruebas en muestras de exudados faríngeos que se habían recopilado y almacenado durante el brote. En 2012, ese grupo informó que aquellas muestras contenían ADN del virus causante de la viruela del ratón. Pero este estudio no recibió mucha atención y, después de una década, todavía no se considera que la viruela del ratón sea una amenaza para los seres humanos.
Si la computadora programada por Carlson y sus colegas tiene razón, vale la pena volver a analizar este virus.
“Es absurdo que esto se haya perdido en el enorme cúmulo de cosas que se revisan en el área de la salud pública”, dijo. “En realidad, esto nos cambia la idea que tenemos acerca de este virus”.
Los científicos han identificado cerca de 250 enfermedades de los seres humanos que surgieron cuando el virus de algún animal traspasó la barrera de las especies. El VIH, por ejemplo, saltó del chimpancé, y el nuevo coronavirus salió del murciélago.
Lo ideal sería que los científicos identificaran el próximo virus que va brotar antes de que comience a infectar a la gente. Pero los virus que afectan a los animales son demasiados como para que los virólogos los estudien. Los investigadores han identificado más de 1000 virus en mamíferos, pero lo más probable es que esta sea una pequeñísima parte de la cifra real. Algunos científicos creen que los mamíferos portan decenas de miles de virus, mientras que otros hablan de cientos de miles.
Con el fin de identificar posibles contagios, los investigadores como Carlson usan computadoras para encontrar los patrones ocultos en la información científica. Las máquinas, por ejemplo, pueden enfocarse en virus capaces de provocar alguna enfermedad en los seres humanos y también pueden predecir qué animales tienen mayores probabilidades de hospedar virus peligrosos que aún no conocemos.
“Parece como si tuviéramos más ojos”, dijo Barbara Han, una ecóloga de las enfermedades que trabaja en el Instituto Cary de Estudios de Ecosistemas, en Millbrook, Nueva York, y que colabora con Carlson. “Solo que nosotros no podemos ver en tantas dimensiones como lo hace el modelo”.
Han se relacionó por primera vez con el aprendizaje automático en 2010. Durante décadas, los científicos informáticos habían desarrollado esa técnica y estaban comenzando a construir herramientas poderosas. En estos días, el aprendizaje automático permite que las computadoras detecten cargos de crédito fraudulentos y reconozcan los rostros de las personas.
Pero pocos investigadores habían aplicado el aprendizaje automático a las enfermedades. Han se preguntó si podría usarlo para responder preguntas abiertas, como por qué menos del 10 por ciento de las especies de roedores albergan patógenos que se sabe que infectan a los humanos.
Ella ingresó toda la información sobre varias especies de roedores, proveniente de una base de datos en línea, en una computadora: desde su edad al destete hasta su densidad de población. Luego, la computadora buscó las características de los roedores que se sabe que albergan un gran número de patógenos que saltan de especie.
Cuando la computadora creó un modelo, lo probó contra otro grupo de especies de roedores, para ver qué tan bien podía adivinar cuáles estaban cargados de agentes causantes de enfermedades. Eventualmente, el modelo de la computadora alcanzó una precisión del 90 por ciento.
Luego, Han recurrió a los roedores que aún no se han examinado en busca de patógenos indirectos y elaboró una lista de especies de alta prioridad. Han y sus colegas predijeron que especies como el campañol montano y el ratón saltamontes del norte serían particularmente propensos a portar patógenos preocupantes.
De todas las características que Han y sus colegas le proporcionaron a la computadora, la que más importaba era la duración de la vida de los roedores. Las especies que mueren jóvenes resultan ser portadoras de más patógenos, tal vez porque la evolución dedicó más recursos a la reproducción que a la construcción de un sistema inmunitario fuerte.
Estos resultados implicaron años de minuciosa investigación en los que Han y sus colegas revisaron bases de datos ecológicas y estudios científicos en busca de datos útiles. Recientemente, los investigadores han acelerado este trabajo mediante la creación de bases de datos expresamente diseñadas para enseñar a las computadoras sobre los virus y sus huéspedes.
En marzo, Carlson y sus colegas presentaron una base de datos de acceso abierto que sigue creciendo llamada VIRION, la cual contiene medio millón de datos sobre 9521 virus y sus 3692 huéspedes animales.
Ahora, las bases de datos como VIRION ofrecen la posibilidad de plantear preguntas más enfocadas acerca de nuevas pandemias. Cuando la pandemia de la covid impactó, pronto supimos que fue causada por un virus nuevo llamado SARS-CoV-2. Carlson, Han y sus colegas crearon programas para identificar a los animales que tenían más probabilidades de hospedar parientes del nuevo coronavirus.
El SARS-CoV-2 pertenece a un grupo de especies llamadas betacoronavirus, el cual también incluye a los virus causantes de las epidemias del SRAG (síndrome respiratorio agudo grave) y del SRME (síndrome respiratorio de Medio Oriente) en los seres humanos. En su mayoría, los betacoronavirus infectan a los murciélagos. Cuando se descubrió el SARS-CoV-2 en enero de 2020, se supo que 79 especies de murciélagos lo portaban.
Sin embargo, los científicos no han estudiado de manera sistemática a las 1447 especies de murciélagos en busca de betacoronavirus; además, se necesitarían años para concluir un proyecto de ese tipo.
Al introducir en su computadora información de índole biológica acerca de los diversos tipos de murciélagos (su dieta y la longitud de sus alas, por ejemplo), Carlson, Han y sus colegas crearon un modelo que podía hacer predicciones sobre cuáles murciélagos tenían mayores probabilidades de hospedar betacoronavirus, y descubrieron más de 300 especies que reunían los requisitos.
Desde que se hizo esa predicción en 2020, los investigadores han encontrado, de hecho, betacoronavirus en 47 especies de murciélagos, y todas estaban en las listas de predicciones de algunos de los modelos de computadora que se crearon para el estudio.
Daniel Becker, un ecólogo de enfermedades de la Universidad de Oklahoma que también trabajó en el estudio del betacoronavirus, dijo que era sorprendente la forma en que características simples como el tamaño del cuerpo podrían conducir a predicciones poderosas sobre los virus. “Mucho de esto es fruto de la biología comparativa”, dijo.
Becker está haciendo un seguimiento de la lista de posibles anfitriones de betacoronavirus. Resulta que se predice que algunos murciélagos en Oklahoma los albergarán.
Si Becker encuentra un betacoronavirus doméstico, no estará en posición de decir de inmediato que es una amenaza inminente para los humanos. Los científicos primero tendrían que llevar a cabo minuciosos experimentos para evaluar el riesgo.
Pranav Pandit, epidemiólogo de la Universidad de California en Davis, advierte que estos modelos son, en gran medida, un trabajo en progreso. Cuando se prueban en virus bien estudiados, funcionan sustancialmente mejor que el azar, pero podrían hacerlo mejor.
“No estamos en una etapa en la que podamos tomar esos resultados y crear una alerta para comenzar a decirle al mundo: ‘Este es un virus zoonótico’”, dijo.
Nardus Mollentze, un virólogo computacional de la Universidad de Glasgow, y sus colegas han creado un método que podría aumentar de manera notable la precisión de los modelos. En vez de buscar los huéspedes de un virus, sus modelos buscan sus genes. A una computadora se le puede enseñar a reconocer características sutiles que están presentes en los genes de los virus que pueden infectar a los seres humanos.
En su primer informe sobre esta técnica, Mollentze y sus colegas desarrollaron un modelo que podía reconocer correctamente a los virus que infectan a los seres humanos más del 70 por ciento de las veces. Mollentze todavía no sabe por qué funcionó su modelo basado en genes, pero tiene algunas ideas. Nuestras células pueden reconocer genes ajenos y enviar una alerta al sistema inmunitario. Es posible que los virus capaces de infectar nuestras células tengan la habilidad para imitar nuestro propio ADN como una especie de camuflaje viral.
Cuando aplicaron este modelo a los virus que afectan a los animales, obtuvieron una lista de 272 especies con muchas probabilidades de brotar. Son demasiadas para que los virólogos expertos puedan estudiarlas a profundidad.
“No se puede trabajar con tantos virus”, explicó Emmie de Wit, una viróloga de Rocky Mountain Laboratories, Montana, que supervisa las investigaciones relacionadas con nuevos coronavirus, el virus de la influenza y otros virus. “Por nuestra parte, en verdad tendríamos que limitar el alcance de nuestro trabajo”.
Mollentze reconoció que él y sus colegas tienen que encontrar alguna manera de identificar los peores virus que afectan a los animales. “Esto es solo el comienzo”, aseveró.
Para continuar con su estudio inicial, Mollentze está trabajando con Carlson y sus colegas con el fin de fusionar la información acerca de los genes de los virus con los datos relacionados a la biología y ecología de sus huéspedes. Con este método, los investigadores están obteniendo algunos resultados prometedores, como el llamativo ejemplo de la viruela del ratón. Otros tipos de datos pueden hacer que las predicciones sean aún mejores. Una de las características más importantes de un virus, por ejemplo, es el recubrimiento de moléculas de azúcar en su superficie. Diferentes virus terminan con diferentes patrones de moléculas de azúcar, y esa disposición puede tener un gran impacto en su éxito. Algunos virus pueden usar este glaseado molecular para esconderse del sistema inmunológico de su huésped. En otros casos, el virus puede usar sus moléculas de azúcar para adherirse a nuevas células y desencadenar una nueva infección.
Este mes, Carlson y sus colegas publicaron un comentario en línea afirmando que el aprendizaje automático puede obtener muchos conocimientos de la capa de azúcar de los virus y sus anfitriones. Los científicos ya han recopilado mucho de ese conocimiento, pero aún no se ha puesto en una forma de la que las computadoras puedan aprender.
“Mi intuición es que sabemos mucho más de lo que pensamos”, dijo Carlson.
De Wit mencionó que, algún día, los modelos de aprendizaje automático podrían llevar a virólogos como ella a estudiar algunos de los virus que afectan a los animales.
“Es definitivo que con esto se obtendrá un gran beneficio”, afirmó.
Pero también señaló que, hasta ahora, los modelos se han enfocado principalmente en la capacidad del patógeno de infectar las células humanas. Antes de ocasionar una nueva enfermedad en el ser humano, un virus también tiene que pasar de una persona a otra y provocar síntomas graves en el trayecto. De Wit está esperando que haya una nueva generación de modelos de aprendizaje automático que también puedan hacer esas predicciones.
“Lo que en verdad queremos saber no es necesariamente qué virus pueden infectar a los seres humanos, sino cuáles pueden ocasionar un brote”, dijo De Wit. “Así que, en realidad, ese es el siguiente paso que tenemos que dar”.
Carl Zimmer es el autor de la columna Matter. Ha publicado 14 libros, entre ellos Life’s Edge: The Search For What It Means To Be Alive. @carlzimmer