Fuentes de Big Data en medicina

by Kevin Hwang, MD, MPH; Revisado por Richard N. Fogoros, MD

Una definición simple de big data en medicina es "la totalidad de los datos relacionados con la atención y el bienestar de la salud del paciente" (Raghupathi 2014). Pero, ¿qué son exactamente estos tipos de datos y de dónde provienen?

La siguiente es una descripción general de los tipos y fuentes de grandes datos de interés para los proveedores de servicios de salud, investigadores, contribuyentes, responsables de políticas e industria.

Estas categorías no son mutuamente excluyentes, porque los mismos datos pueden originarse en una variedad de fuentes.

Tampoco es exhaustiva esta lista, porque la aplicación práctica del análisis de big data seguramente continuará expandiéndose.

Sistemas de información clínica

Estas son fuentes tradicionales de datos clínicos que los proveedores de atención médica están acostumbrados a ver.

Registros electrónicos de salud (EHR) recopilan, almacenan y muestran información, como datos demográficos, historial médico pasado, problemas médicos activos, inmunizaciones, alergias, medicamentos, signos vitales, resultados de exámenes de laboratorio y radiología, informes de patología, notas de progreso creadas por el cuidado de la salud proveedores y documentos administrativos y financieros
Los registros médicos electrónicos (EMR) no son idénticos a los EHR y, por lo general, pertenecen a los datos almacenados con un médico en particular.
Los intercambios de información sanitaria sirven como centros entre sistemas dispares de información clínica

Los registros de pacientes, mantenidos por las organizaciones de atención médica en sus propios pacientes, a menudo están vinculados al EHR. Otros registros rastrean inmunizaciones, cáncer, trauma y otros problemas de salud pública en una escala geográfica más amplia.

Los portales de pacientes permiten a los pacientes acceder a la información de salud personal almacenada en el EHR de una organización de atención médica. Algunos portales para pacientes también les permiten a los usuarios solicitar renovaciones de recetas e intercambiar mensajes electrónicos seguros con el equipo de atención médica.

Los almacenes de datos clínicos agregan datos a nivel del paciente de múltiples sistemas de información clínica, como EHR y otras fuentes mencionadas anteriormente

Datos de reclamaciones de los pagadores

Los contribuyentes públicos (por ejemplo, Medicare) y los pagadores privados tienen grandes repositorios de datos de reclamos sobre sus beneficiarios. Algunas aseguradoras de salud ahora también ofrecen incentivos para compartir sus datos de salud.

Estudios de investigación

Las bases de datos de investigación contienen información sobre los participantes del estudio, tratamientos experimentales y resultados clínicos. Los grandes estudios generalmente son patrocinados por compañías farmacéuticas o agencias gubernamentales. Una aplicación de medicina personalizada es hacer coincidir a los pacientes individuales con tratamientos efectivos, según los patrones en los datos de ensayos clínicos.

Este enfoque va más allá de la aplicación de principios de medicina basados en la evidencia, mediante los cuales un proveedor de atención médica determina si un paciente comparte características generales (por ejemplo, edad, sexo, raza, estado clínico) con los participantes en el ensayo. Con el análisis de big data, es posible seleccionar un tratamiento basado en información mucho más granular, como el perfil genético del cáncer de un paciente (ver a continuación).

Los sistemas de apoyo a las decisiones clínicas (CDSS) también se han desarrollado rápidamente y ahora representan una gran parte de la inteligencia artificial (AI) en la medicina.

Utilizan datos de pacientes para ayudar a los médicos a tomar decisiones y a menudo se combinan con EHR.

Bases de datos genéticos

El repositorio de información genética humana continúa acumulándose a un ritmo rápido. Desde que se terminó el Proyecto del Genoma Humano en 2003, el costo de la secuenciación del ADN humano se ha reducido en un millón. El Personal Genome Project (PGP), lanzado en 2005 por Harvard Medical School, busca secuenciar y publicitar los genomas completos de 100.000 voluntarios de todo el mundo. El PGP en sí mismo es un excelente ejemplo de proyecto de big data debido al gran volumen y variedad de datos.

Un genoma personal contiene aproximadamente 100 gigabytes de datos. Además de secuenciar genomas, el PGP también está recolectando datos de EHR, encuestas y perfiles de microbioma.

Varias compañías ofrecen secuenciación genética directa al consumidor para la salud, los rasgos personales y la farmacogenética sobre una base comercial.

Esta información personal podría ser subyugada a los análisis de big data. Por ejemplo, 23andMe dejó de ofrecer informes genéticos relacionados con la salud a nuevos clientes a partir del 22 de noviembre de 2013 para cumplir con la Administración de Alimentos y Medicamentos de los EE. UU. Sin embargo, en 2015, la compañía comenzó a ofrecer ciertos componentes de salud de su prueba de saliva genética nuevamente, esta vez con la aprobación de la FDA.

Registros Públicos

El gobierno mantiene registros detallados de eventos relacionados con la salud, como la inmigración, el matrimonio, el nacimiento y la muerte. El Censo de EE. UU. Ha recopilado grandes cantidades de información cada 10 años desde 1790. El sitio web de estadísticas del Censo tenía 370 mil millones de células a partir de 2013, con aproximadamente 11 mil millones más agregados anualmente.

Búsquedas web

La información de búsqueda web recopilada por Google y otros proveedores de búsqueda web podría proporcionar información en tiempo real relacionada con la salud de la población. Sin embargo, el valor de los grandes datos de los patrones de búsqueda web podría mejorarse al combinarlo con las fuentes tradicionales de datos de salud.

Medios de comunicación social

Facebook, Twitter y otras plataformas de medios sociales generan una gran variedad de datos durante todo el día, dando una visión de las ubicaciones, los comportamientos de salud, las emociones y las interacciones sociales de los usuarios. La aplicación de big data de las redes sociales a la salud pública se conoce como detección digital de enfermedades o epidemiología digital. Twitter, por ejemplo, se ha utilizado para analizar las epidemias de gripe entre la población general.

El Proyecto Mundial de Bienestar que comenzó en la Universidad de Pensilvania es otro ejemplo del estudio de las redes sociales para comprender mejor la experiencia y la salud de las personas. El proyecto reúne a psicólogos, estadísticos e informáticos que analizan el lenguaje utilizado al interactuar en línea, por ejemplo, al escribir actualizaciones de estado en Facebook y Twitter. Los científicos están observando cómo el lenguaje de los usuarios se relaciona con su salud y felicidad. Los avances en el procesamiento del lenguaje natural y el aprendizaje automático están ayudando con sus esfuerzos. Una publicación reciente de la Universidad de Pensilvania analizó las formas de predecir las enfermedades mentales mediante el análisis de las redes sociales. Parece que los síntomas de la depresión y otras condiciones de salud mental se pueden detectar mediante el estudio de nuestro uso de Internet. Los científicos esperan que en el futuro estos métodos puedan identificar y ayudar mejor a las personas en riesgo.

Internet de las cosas (IoT)

Grandes cantidades de información relacionada con la salud también se recopilan y almacenan en dispositivos móviles y domésticos .

Teléfonos inteligentes : miles de aplicaciones mHealth capturan información sobre la actividad física del usuario, la ingesta nutricional, los patrones de sueño, las emociones y otros parámetros. Las aplicaciones nativas de teléfonos celulares (por ejemplo, GPS, correo electrónico, mensajes de texto) también pueden dar pistas sobre el estado de salud de una persona.
Monitores y dispositivos ponibles: los podómetros, acelerómetros, gafas, relojes y chips incrustados debajo de la piel también recopilan información relacionada con la salud y también pueden enviarlos a la nube.
Los dispositivos de telemedicina permiten a los proveedores de atención médica controlar los parámetros de los pacientes, como la presión arterial, la frecuencia cardíaca, la frecuencia respiratoria, la oxigenación, la temperatura, los trazados de ECG y el peso.

Transacciones financieras

Las transacciones con tarjeta de crédito de los pacientes se incluyen en los modelos predictivos utilizados por Carolinas HealthCare System para identificar a los pacientes que están en alto riesgo de ser readmitidos en el hospital. El proveedor de atención médica con base en Charlotte usa big data para dividir a los pacientes en varios grupos, por ejemplo, según la enfermedad y la ubicación geográfica.

Implicaciones éticas y de privacidad

Es necesario destacar que, en algunos casos, puede haber importantes implicaciones éticas y de privacidad cuando se recopilan y acceden datos en el cuidado de la salud. Las nuevas fuentes de big data pueden mejorar nuestra comprensión de lo que impacta a las personas y la salud de la población, sin embargo, los diferentes riesgos deben ser cuidadosamente considerados y monitoreados. Ahora también se ha reconocido que los datos previamente considerados anónimos pueden volver a identificarse. Por ejemplo, la Profesora Latanya Sweeney del Laboratorio de Privacidad de Datos de Harvard revisó a 1,130 voluntarios involucrados en el Proyecto del Genoma Personal. Ella y su equipo pudieron nombrar correctamente al 42 por ciento de los participantes según la información que compartieron (código postal, fecha de nacimiento, sexo). Este conocimiento puede aumentar nuestra conciencia de los riesgos potenciales y ayudarnos a tomar mejores decisiones para compartir datos.

> Fuentes:

> Conway M, O'Connor D. Las redes sociales, los grandes datos y la salud mental: avances actuales e implicaciones éticas. Current Opinion in Psychology 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Big data, mayores resultados. Revista de la American Health Information Management Association 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. La detección de la depresión y la enfermedad mental en las redes sociales: una revisión integradora . Opinión actual en Behavioral Sciences 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. La parábola de Google Flu: trampas en Big Data Analysis . Science 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Gran análisis de datos en salud: promesa y potencial. Ciencia y Sistemas de Información de Salud 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Identificación de participantes en el Proyecto del genoma personal por nombre . Universidad Harvard. Laboratorio de privacidad de datos Libro Blanco 1021-1. 24 de abril de 2013.