Noticias

La herramienta bioinformática de última generación permite un gran análisis de datos sin necesidad de conocimientos de programación

28 Sep 2020
La herramienta bioinformática de última generación permite un gran análisis de datos sin necesidad de conocimientos de programación

Una nueva herramienta de análisis de datos desarrollada por investigadores del Centro de Cáncer MD Anderson de la Universidad de Texas incorpora una interfaz fácil de usar y en lenguaje natural que permite a los investigadores biomédicos sin conocimientos especializados en bioinformática o lenguajes de programación realizar un análisis intuitivo de grandes conjuntos de datos.

El programa de acceso abierto impulsado por la inteligencia artificial (IA), denominado DrBioRight, se creó para reducir las barreras que impiden a todos los investigadores aprovechar plenamente las cantidades cada vez mayores de datos generados en los métodos de investigación modernos.

Un informe de esta plataforma fue publicado hoy en Cancer Cell.

"Sentimos que podíamos mejorar el modelo actual para llevar a cabo análisis bioinformáticos rutinarios y acelerar enormemente el tiempo de respuesta creando una herramienta que cualquier investigador pudiera utilizar", dijo el Dr. Han Liang, profesor de Bioinformática y Biología Computacional. "Nuestro objetivo a largo plazo para DrBioRight es ser un colaborador inteligente para cada investigador."

Las tecnologías de alto rendimiento utilizadas en la investigación biomédica moderna generan grandes y complejos conjuntos de datos que proporcionan información exhaustiva sobre los pacientes, los modelos animales o las líneas celulares que se están estudiando.

Estos pueden incluir, por ejemplo, el estudio de la totalidad de la información genética (genómica), la expresión de genes (transcriptómica) o la expresión de proteínas (proteómica).

Debido a que estos conjuntos de datos "ómicos" son tan complejos, puede resultar difícil responder a preguntas biológicas específicas sin enfoques analíticos especializados, explicó Liang.

Estos análisis suelen realizarse con un guión informático escrito en diversos lenguajes de programación, lo que requiere cierta comprensión tanto de la programación como de la bioinformática.

Los bioinformáticos pueden ayudar a navegar y procesar estos complejos conjuntos de datos, pero el trabajo puede llevar mucho tiempo.

Por ello, el equipo de investigación desarrolló el DrBioRight para permitir a los investigadores realizar más fácilmente análisis rutinarios de sus propios datos mediante una interfaz de chat fácil de usar con interacciones en lenguaje natural.

El programa orientado al lenguaje natural permite a los usuarios hacer preguntas al programa como si hablaran de forma natural en vez de en complejos lenguajes de programación, explicó Liang.

DrBioRight está disponible gratuitamente para los investigadores académicos.

Inicialmente, el programa tiene un número de módulos listos para manejar los tipos más comunes de preguntas bioinformáticas e incluye algunos de los conjuntos de datos públicos sobre el cáncer más frecuentemente utilizados, como el Atlas del Genoma del Cáncer y la Enciclopedia de la Línea Celular del Cáncer.

Como confirmación del enfoque, los investigadores replicaron el análisis de un documento clásico sobre genómica del cáncer utilizando el DrBioRight y encontraron que reproducía con precisión los resultados publicados anteriormente.

Debido a que el programa está impulsado por la IA, también tiene la capacidad de aprender de cada investigación y mejorar el análisis, convirtiéndose en una herramienta más útil con el tiempo.

En el futuro, los investigadores esperan mejorar DrBioRight para permitir a los usuarios analizar sus propios conjuntos de datos, así como permitir el desarrollo abierto de nuevos módulos.

"A medida que trabajamos para mejorar el programa, también queremos permitir que otros bioinformáticos contribuyan con sus algoritmos y enseñen DrBioRight", dijo Liang. "La participación de toda la comunidad de investigación ayudará a crear una herramienta que sea útil para responder a preguntas complejas de investigación de manera más eficiente".

Fuente: The University of Texas MD Anderson Cancer Center