Real World Data - Variabilidad

08 de Mayo de 2025

Análisis de RWD con un enfoque en la varianza poblacional

Una de las características esenciales de los datos RWD es su capacidad para capturar la diversidad y la variabilidad poblacional, que se traduce en una representación más completa y precisa de las experiencias y resultados de salud en la población. La varianza poblacional se refiere a la dispersión o variabilidad dentro de una población en términos de factores como edad, género, origen étnico, condiciones médicas previas, acceso a la atención sanitaria, perfil genético y molecular, y factores socioeconómicos. Esta variabilidad es crucial para comprender cómo diferentes subgrupos responden a tratamientos, cómo se manifiestan las enfermedades y cuáles son los factores de riesgo específicos en cada contexto.

Hoy, como ya sabemos, los datos generados por el sistema de salud en muchas partes del mundo ya están produciendo grandes insights y revelaciones, con un aumento exponencial de estudios que aplican sofisticados métodos estadísticos y técnicas de machine learning (ML) y deep learning (DL). Con la pandemia vimos la aplicación directa en la evaluación de intervenciones sanitarias en poblaciones diversas, que permitió definir políticas sanitarias equitativas. Al identificar patrones y subgrupos en los datos poblacionales y analizar su varianza, los investigadores pueden diseñar tratamientos personalizados que optimicen los resultados para diferentes tipos de pacientes, lo que se conoce como medicina de precisión. Por ejemplo, la monitorización de la seguridad y eficacia de medicamentos y tratamientos utilizando RWD es un gran campo explorado. El objetivo es posibilitar un seguimiento continuo de los efectos secundarios y la eficacia de los tratamientos en la población, identificando riesgos que podrían no haberse detectado en ensayos clínicos o subgrupos poblacionales con una respuesta distinta, dada la poca representatividad de la población en las muestras que estos estudios consideran. 

(mental health, wellness, fitness, nutrition and supplements, remote monitoring)
(POC testing, lab testing, diagnostic technologies, decision support, population health)
(telehealth, home care, primary treatments, specialized treatments, hospitals)
(rehabilitation, social care, chronic care, elder care)
(training and certification, health and safety)
(health records, practice management, scheduling and referrals, health analytics)
 (wearables, medical devices, medical equipment, medical imaging, medical robotics)
(health benefits, corporate wellness, health insurance, health asset financing, healthcare real estate)
(drug manufacturing, drug commercialization, healthcare logistics, pharmacies)
(discoveries, clinical trials, clinical insights, precision medicine, genomics)
Un verdadero sistema de salud requiere evidencia de lo que funciona para cada población de pacientes, no solo para aquellos representados en ensayos aleatorios
Los ensayos clínicos son muy útiles, y suelen ser necesarios porque están diseñados para proporcionar un requisito fundamental en la etapa previa a la comercialización de un producto o dispositivo médico, esto es, evidencia sólida de su efectividad. Sin embargo, este tipo de estudios pueden ser muy costosos y complicados de realizar, y la validez interna lograda en estos ensayos muchas veces se logra a expensas de la incertidumbre sobre la generalización, especialmente porque las poblaciones inscritas en dichos estudios pueden y suelen diferir de manera significativa a las observadas en la práctica. El problema es que en los ensayos clínicos tradicionales, se tiende a seleccionar pacientes bajo criterios estrictos (y también a excluirlos) para reducir la heterogeneidad y controlar variables externas. Y esto es precisamente lo que puede limitar la generalización de los resultados a poblaciones más diversas e incluso conducir a sesgos.  

Refresquemos el caso del abacavir (Ziagen), el medicamento utilizado para tratar el VIH, donde la detección de un biomarcador genético fue lo que permitió preidentificar a los pacientes en alto riesgo de desarrollar una reacción de hipersensibilidad al fármaco. La determinación de ese pequeño grupo de pacientes fue lo que permitió  a la mayoría de los pacientes la posibilidad de seguir beneficiándose de esta terapia. Los ensayos clínicos no tienen la capacidad de identificar estos subgrupos de pacientes, pero si es posible hacerlo utilizando RWD.

Dadas estas tendencias, muchos investigadores, de ensayos clínicos y desarrolladores de productos médicos, se han interesado cada vez más en expandir e integrar la investigación clínica a entornos más diversos y representativos aprovechando el crecimiento exponencial de la generación y acceso a los datos RWD. La clave para entender la utilidad de la evidencia del mundo real (RWE) es apreciar su potencial para complementar el conocimiento obtenido de los ensayos clínicos tradicionales, cuyas conocidas limitaciones dificultan la generalización de los hallazgos, a poblaciones más grandes y más inclusivas de pacientes.

Recientemente la Administración de Alimentos y Medicamentos de Estados Unidos (FDA) desarrolló  un marco y establece protocolos para impulsar el uso de datos y evidencia del mundo real en la toma de decisiones regulatorias, principalmente para la aprobación de la comercialización de fármacos y dispositivos médicos. Este avance marca el inicio de una integración prometedora entre la investigación clínica tradicional y los enfoques basados en datos del mundo real.
La diversidad de los RWD mejora la calidad de los modelos predictivos utilizados en salud.
La alta varianza en los RWD permite identificar cómo los tratamientos y las enfermedades afectan a subgrupos específicos de la población. Por ejemplo, puede revelar diferencias en la eficacia de un medicamento entre pacientes mayores y jóvenes, o entre diferentes grupos étnicos. Esto es fundamental para personalizar la medicina y abordar desigualdades en la atención sanitaria. En este sentido, los algoritmos de aprendizaje automático (machine learning) entrenados con datos diversos pueden generalizar mejor y ofrecer predicciones más precisas para poblaciones amplias. Dado que los RWD reflejan la diversidad de condiciones reales, su análisis incrementa la validez externa de los estudios. Esto significa que los resultados obtenidos son más aplicables a la población general, en contraste con los obtenidos por los ensayos clínicos restringidos.
Sesgos en los ensayos clínicos

Los ensayos clínicos controlados aleatorios (ECA), estudios controlados donde los participantes son asignados aleatoriamente a diferentes grupos de tratamiento,  son estudios diseñados y desarrollados para responder preguntas específicas dentro del ámbito de la salud, especialmente de la industria y la investigación. Es un método comparativo y sistemático que se usa desde el año 1747, cuando un médico puso a prueba la efectividad de la vitamina C presente en los cítricos para tratar el escorbuto, una enfermedad que aquejaba a marineros. Es un método tradicional que funciona y aporta datos muy valiosos. En la industria, especialmente, se utilizan para obtener la aprobación regulatoria de medicamentos o dispositivos en investigación. En general, y hasta hace no muchos años, estos estudios no integraban información del mundo real, por lo que la data recolectada del mundo real en los años posteriores a la comercialización era muy valiosa para comprender el impacto de un fármaco, dispositivo o tratamiento en la población objetivo. 

Para controlar o considerar la mayor cantidad de variables posibles, los criterios de elegibilidad de los ensayos clínicos deben ser estrictos. Es así como se excluye de los mismos a personas con características vulnerables (como lo son  otras enfermedades o condiciones, que definimos como comorbilidades), personas que hacen un uso paralelo de medicamentos y con vulnerabilidades debido a la edad. Una validez externa deficiente en estos ensayos puede dar como resultado información inadecuada para la toma de decisiones en la salud. 

Cuando una población vulnerable está altamente excluida de los ECA, pero dentro de ella hay muchas personas a las que se les prescribe activamente el mismo medicamento, es probable que haya una brecha en la información sobre la toma de decisiones en el tratamiento. Muchos ECA seleccionan poblaciones con una única enfermedad utilizando criterios de elegibilidad estrictos, excluyendo así también a:
🔹Individuos que tienen mayor riesgo de un efecto adverso al medicamento debido a vulnerabilidades
🔹Individuos mayores
🔹Adolescentes
🔹Individuos con condiciones paralelas
🔹Personas con multimorbilidad
🔹Personas haciendo uso simultáneo de medicamentos y polifarmacia

De hecho, un dato no menor, es que la multimorbilidad y la polifarmacia son cada vez más comunes en personas menores de 65 años.

Las poblaciones de adolescentes y adultos mayores están altamente excluidas de los ECA, pero juntas constituyen aproximadamente el 50% de la población del mundo real.

Los criterios de exclusión de los ensayos clínicos aleatorios (ECA) excesivamente estrictos no consideran la heterogeneidad de las características vulnerables observadas en las poblaciones del mundo real, como con antecedentes familiares de alto riesgo, multimorbilidad, polifarmacia y acceso limitado a la atención médica, entre otros. Los datos RWD muchas veces son la única fuente de información sobre los resultados de tratamientos para estas poblaciones. En este sentido, tanto las aseguradoras como las compañías farmacéuticas comenzaron a hacer uso de los datos del mundo real, y más aún en los últimos años, para supervisar la eficacia de los nuevos productos y dispositivos comercializados, algunos de los cuales están cubiertos por modelos de distribución de riesgos. La evidencia del mundo real también se utiliza para reforzar el posicionamiento en formularios de tratamiento, especialmente para tratamientos de segunda y tercera línea, al documentar beneficios realistas a largo plazo que no suelen estudiarse en ECA. Así, utilizando RWD los investigadores pueden evaluar la efectividad de un tratamiento, dispositivo o medicamento tomando en consideración otras variables como comorbilidades, grupos demográficos y grupos de edad.

En general los criterios de exclusión de los ECA se deben a tres posibles vulnerabilidades: multimorbilidad, polifarmacia y la edad (adolescentes y personas mayores). 

En un estudio publicado en The Lancet Healthy Longetivity en 2022 se reportaron tasas de exclusión de la población superiores al 50% para los adolescentes que usan varios medicamentos, y cifras similares para las personas mayores de 80 años. La multimorbilidad tuvo una proporción de exclusión media del 91,1% (RIC 88,9-91,8) y para los medicamentos coexistentes la proporción de personas excluidas fue del 52,5% (RIC 50,0-53,7). Además se detectó un vacío de información para personas con enfermedades cardiovasculares y condiciones psiquiátricas, lo cual supone un gran  problema a la hora de extender generalizaciones a esta población.  

La exclusión de los adolescentes de los ensayos clínicos, exclusión incluso mayor que la de adultos mayores, da lugar a la prescripción fuera de etiqueta.  Los médicos, los pacientes y las aseguradoras suelen suponer que los tratamientos serán tan seguros y eficaces en los grupos vulnerables tratados en entornos reales como en los pacientes sin complicaciones tratados en entornos óptimos. Pero claro que esto no siempre es cierto. Tomemos como ejemplo el caso de la reducción del metabolismo de primer paso como consecuencia  del envejecimiento. Ocurre que frecuentemente resulta necesario ajustar las dosis administradas de un fármaco oral a personas mayores porque su concentración podría reducirse antes de alcanzar la circulación sistémica. De manera similar, las personas con enfermedades coexistentes (multimorbilidad), personas haciendo uso simultáneo crónico de medicamentos (polifarmacia) y las personas haciendo uso paralelo ocasional de medicamentos, son excluidas con frecuencia de los ensayos clínicos. La prevalencia de multimorbilidad es del 67,7%, una cifra considerable, la prevalencia de polifarmacia es del 62,5% y la prevalencia del uso paralelo de medicamentos es incluso mayor, del 98,5%. Es probable que esta exclusión conduzca a una validez externa de los ensayos clínicos deficiente y a una escasez de medicina basada en evidencia que cuantifiquen con precisión el riesgo o el beneficio del tratamiento en estas poblaciones subrepresentados, especialmente en el contexto de enfermedades coexistentes y el uso de medicamentos. 

Desde algunas especialidades clínicas se reportaron sesgos en la representatividad de los pacientes. Tal es el caso de las poblaciones con comorbilidad cardiovascular, condiciones psiquiátricas u otorrinolaringológicas, sobre las que menor cantidad de  información sobre decisiones de tratamiento se tiene. Por ejemplo, si se quisiera saber de qué manera impacta en un paciente con fibrilación auricular y cirrosis hepática el uso de anticoagulantes, sería complicado debido a que como la mayoría de los pacientes con afecciones hepáticas están subrepresentados o excluidos de los ECA cardiovasculares, esta información es escasa.  

Uno de los primeros ensayos controlados aleatorizados importantes realizados en un entorno del mundo real fue el ensayo de campo “Salk” de la vacuna contra la polio, que reunió un gran número de niños (750.000) que fueron asignados aleatoriamente para recibir la vacuna o el placebo (grupo control) y además se asignó otro gran grupo aún más grande (1 millón de niños) como control no aleatorizado (es decir una población que no fue seleccionada al azar), donde todos recibieron la vacuna.

La evidencia del mundo real también resulta muy valiosa en entornos de observación.  Actualmente se utiliza para generar hipótesis para ensayos prospectivos, es decir ensayos clínicos y observacionales a futuro; evaluar la generalización de los hallazgos de ensayos clínicos; realizar vigilancia de seguridad de productos y dispositivos médicos; examinar cambios en los patrones de uso terapéutico; y medir e implementar la calidad en la prestación de atención médica. Se han aceptado ensayos prospectivos de un solo grupo con controles externos (datos observacionales) y recopilación de datos de alta calidad para fines regulatorios en la evaluación de dispositivos médicos. Este es el caso de un sistema de asistencia ventricular que logró su aprobación utilizando controles emparejados por puntaje de propensión del Registro Interinstitucional para Asistencia Circulatoria Mecánicamente Asistido. 

La integración de datos y evidencia del mundo real proporciona una solución perfecta para complementar los ensayos clínicos aleatorios, y así ampliar las poblaciones objetivo, disminuir el sesgo y reducir costos.  

Claro que no todo lo que brilla es oro, o en ocasiones como esta sólo es necesario pulirlo.
El uso de RWD también implica desafíos.
Si bien la varianza poblacional aporta un gran valor, también introduce una notable complejidad en el análisis. Factores como el sesgo en la recolección de datos, la calidad desigual de las fuentes y la confusión a causa de variables no controladas deben ser tratados con metodologías estadísticas robustas y diseños de estudio cuidadosos. Los datos de los registros médicos electrónicos, y los datos administrativos y  de aseguradoras no se recopilan ni se organizan con el objetivo de respaldar la investigación y el desarrollo, ni tampoco se han optimizado para esos fines, por lo tanto deben ser pulidos y estructurados. A  esto se suma el desafío en la falta de información sobre la precisión y la credibilidad de los datos obtenidos por diversos dispositivos personales y aplicaciones asociadas a la salud.
El tamaño de la muestra influye en la precisión de la inferencia causal, el análisis de causa y efecto, pero el diseño del estudio es crucial
Es correcto afirmar que un mayor tamaño de muestra ayuda a reducir ciertos desafíos en la inferencia causal, es decir facilita el análisis de conjuntos de datos para establecer relaciones de causa y efecto. Y esto es especialmente cierto en términos de precisión de las estimaciones y reducción del error aleatorio. Sin embargo, también es correcto mencionar que no resuelve por completo los problemas de confusión, sesgo de selección, o variables no observadas. Estos problemas requieren enfoques metodológicos adicionales que complementen el aumento de tamaño de muestra como el ajuste por variables confusoras, el diseño de estudios estadísticos adecuados, y el uso de técnicas estadísticas avanzadas. Por lo tanto, aunque un tamaño de muestra más grande es fundamental (datos RWD), la calidad del diseño del estudio y el método de análisis estadístico siguen siendo fundamentales para obtener inferencias causales válidas y confiables.

Independientemente del área en la que se centre un proyecto de RWD, inferencia causal o predicción y clasificación, la representatividad de los datos de la población a la que se generalizarán las conclusiones del estudio es fundamental. De lo contrario, la estimación o predicción puede ser engañosa o incluso perjudicial. Entonces, para proporcionar datos válidos, el registro del que se tomen debe cubrir la mayoría (por lo menos el 95%) de la población definida, informar parámetros relevantes con buena calidad, y tener un seguimiento cercano y completo.


Los datos del mundo real proporcionan la representatividad que la investigación y el desarrollo biotecnológico del futuro necesitan.

Escrito por Valeria Analia Dávila.

Bibliografía:
Tan, Y. Y., Papez, V., Chang, W. H., Mueller, S. H., Denaxas, S., & Lai, A. G. (2022). Comparing clinical trial population representativeness to real-world populations: an external validity analysis encompassing 43 895 trials and 5 685 738 individuals across 989 unique drugs and 286 conditions in England. The Lancet Healthy Longevity, 3(10), e674-e689.
Rosa, J. M., & Frutos, E. L. (2022). Ciencia de datos en salud: desafíos y oportunidades en América Latina. Revista Médica Clínica Las Condes, 33(6), 591-597.
Liu, F., & Panagiotakos, D. (2022). Real-world data: a brief review of the methods, applications, challenges and opportunities. BMC Medical Research Methodology, 22(1), 287.
Sharma, R., & Kshetri, N. (2020). Digital healthcare: Historical development, applications, and future research directions. International Journal of Information Management, 53, 102105.