Lenguaje R, una herramienta estadística que los médicos del futuro deben dominar
Las herramientas tecnológicas son cada vez más comunes en los entornos de investigación médica, un campo con gran potencial y que ha recibido un gran impulso gracias a la implementación de la inteligencia artificial (IA) entre otras tecnologías
Las herramientas tecnológicas son cada vez más comunes en los entornos de investigación médica, un campo con gran potencial y que ha recibido un gran impulso gracias a la implementación de la inteligencia artificial (IA) entre otras tecnologías. Una de estas nuevas herramientas es el lenguaje y entorno R, el cual permite a los médicos investigadores sistematizar, tabular y hasta graficar grandes volúmenes de datos de manera automatizada.
“En Bolivia y en toda la región tenemos una escasez de artículos científicos publicados, no porque no se produzca conocimiento, sino porque, con las herramientas actuales, el proceso de sistematización de datos es engorroso y su resultado no está bien presentado, en esto el uso de R nos puede ayudar muchísimo al ser la herramienta de referencia en el mundo”, explica José Luis Villca, médico e investigador científico.
Villca dictó una masterclass a más de 200 estudiantes y docentes de la carrera de Medicina, como antesala al Congreso Internacional de IA en Salud, evento organizado por la Universidad Franz Tamayo, Unifranz, el cual se llevará a cabo en Cochabamba el 17 de septiembre y contará con la presencia de expertos nacionales e internacionales en la temática.
“El lenguaje R es un entorno y lenguaje de programación de carácter libre utilizado ampliamente por todo tipo de analistas de datos. Su uso en el área de la salud ha incrementado en la última década y hoy en día es uno de los principales softwares estadísticos usados en investigación biomédica, el cual, no solo es gratis, sino que permite la visualización de la información en formatos aceptados por publicaciones científicas”, indica el investigador.
La información es una herramienta esencial en el trabajo de los profesionales de salud, ya que permite establecer los parámetros del tratamiento, identificar posibles complicaciones o trazar relaciones que permitan un mejor diagnóstico, pero esta cobra especial relevancia en la investigación, donde los grandes volúmenes de datos deben ser interpretados y graficados para obtener una validación.
Villca, médico, investigador y docente de la Universidad Franz Tamayo, Unifranz, indica que el uso de datos y su transformación en información útil es cada día más importante en todas las áreas del conocimiento y el sector salud no es la excepción y que esta tarea puede ser impulsada de manera importante mediante el uso del lenguaje R.
Por ejemplo, R se puede utilizar directamente en:
● Adquisición de los datos de las fuentes disponibles como bases de datos, archivos de texto o historias clínicas.
● Preparación de los datos como eliminación de duplicados, datos incorrectos, valores extremos.
● Análisis de los datos, construcción de modelos predictivos, de clasificación, de agrupamiento
● Comunicación de los resultados: realización de informes para presentación de los resultados y conclusiones.
● Aplicación de los resultados obtenidos: por ejemplo, utilización de modelos predictivos desarrollados para en función de una serie de datos históricos (datos de entrenamiento y test del modelo) predecir ciertas salidas.
Sin embargo, Villca apunta que esta herramienta, a pesar de ser fácilmente modificable y adaptable, no cuenta con muchos adeptos en la región.
“Creo que es importante impulsar el uso de R en la investigación médica, en la epidemiología y en la salud pública, ya que es una herramienta muy potente, que si bien tienen una curva de aprendizaje algo larga, vale toda la pena, sobre todo considerando que muy pronto, los volúmenes de datos crecerán gracias a la implementación de la IA en salud”, agrega.
Su uso en Big Data
Villca señala que en el ámbito del big data, el lenguaje R es muy efectivo a la hora de visualizar y analizar datos y que permite realizar numerosas acciones relacionadas con este ámbito, como, por ejemplo:
Crear visualizaciones de datos de alta calidad. Aunque los sistemas de big data suelen utilizar herramientas específicas para la visualización, R sigue siendo poderoso para crear gráficos de alta calidad y visualizaciones interactivas. Esto permite elaborar tableros para visualizar y analizar datos o crear informes automáticos.
Disponer de herramientas de análisis estadístico para ahondar en el conocimiento de los datos. El lenguaje R se adapta a la realización de análisis exploratorios de datos en conjuntos más pequeños antes de trasladarlos a sistemas big data. Del mismo modo, también permite trabajar con muestras representativas de los datos y realizar validaciones previas.
Construir modelos estadísticos y de aprendizaje automático. El lenguaje R es perfecto para la construcción de modelos estadísticos, análisis de regresión o series temporales. Esta función permite probar modelos en datos más pequeños antes de incluirlos en sistemas de big data.
“R es algo más que un lenguaje de programación. El usuario no programa propiamente, sino que utiliza R interactivamente: ensaya, se equivoca y vuelve a probar. Solo cuando termina el ciclo y el resultado es satisfactorio, produce un resultado final que, generalmente, no es un programa, sino un informe”, puntualiza el investigador.
Otra de las ventajas del uso de lenguaje R para el manejo de datos es su automatización, algo fundamental para el desarrollo del machine learning. A través de diferentes paquetes, esta herramienta realiza tareas de aprendizaje automático. Aunque no es tan completo como otros lenguajes específicos como Python, muchas de las funciones de análisis están directamente integradas en el lenguaje R y eso hace que la lectura de los algoritmos ya esté implícita en él.
“Bolivia va a necesitar médicos científicos que quieran aprender a usar estas herramientas estadísticas y que puedan apoyar en sedes, en el ministerio de salud y en investigación, ya que esta es la herramienta líder en el mundo, ya que esta habilidad es muy valorada en el exterior, nuestro necesita este tipo de proyectos para poder visualizar los problemas y tendencias”, concluye el médico.
IA y nuevas tecnologías en salud
La importancia de la aplicación de nuevas herramientas y tecnologías en la formación de futuros profesionales en salud es vital, razón que impulsa a Unifranz a realizar el Congreso Internacional de Inteligencia Artificial en Salud.
“Desde la academia queremos mostrar la importancia de incluir estas herramientas tecnológicas en la profesión porque la tecnología va de la mano del médico. Queremos llevar esto como una tendencia en innovación en educación, que ya lo estamos aplicando en la universidad, y mostrarles lo que va a ocurrir en pocos años”, señala el decano académico de la Facultad de Ciencias de la Salud de Unifranz, Jimmy Venegas.
El congreso contará con speakers nacionales e internacionales que mostrarán los beneficios de la inteligencia artificial, entre ellos el argentino Carlos Otero, quien expondrá “Retos y Experiencias en la Implementación de la Historia Clínica Electrónica del Hospital Italiano de Buenos Aires”; Fabián Villena, de Chile, con “Introducción a la ciencia de datos e inteligencia artificial en salud”; Martín Saban, de Argentina, con “Evaluación de Resultados de Salud y el Impacto de las Políticas Públicas Basadas en Datos”, entre otros.