Cáncer y datos: potenciales usos del análisis en salud oncológica

04 de Junio de 2025

El cáncer como segunda causa de mortalidad global

De acuerdo con datos de la Organización Mundial de la Salud (OMS), en 2018 el cáncer fue responsable de aproximadamente 9,6 millones de muertes, lo que representa cerca de uno de cada seis fallecimientos a nivel global. Los tipos de cáncer más prevalentes en varones son el cáncer de pulmón, próstata, colorrectal, gástrico y hepático; en mujeres, predominan el cáncer de mama, colorrectal, pulmonar, cérvico-uterino y tiroideo.

Las proyecciones epidemiológicas no son alentadoras: un informe reciente de la OMS, en conjunto con la Agencia Internacional para la Investigación del Cáncer (IARC), estima que hacia 2050 se registrarán más de 35 millones de nuevos casos anuales, lo que representaría un incremento del 77 % respecto de los 20 millones reportados en 2022. Entre los principales factores de riesgo asociados al aumento en la incidencia, se destacan el tabaquismo, el consumo nocivo de alcohol y la obesidad.

El cáncer se cobra 10 millones de vidas al año, y el diagnóstico en etapa avanzada suele ser el culpable. La detección temprana mejora significativamente las tasas de supervivencia; sin embargo, los métodos de detección actuales son inaccesibles para muchas personas o carecen de la sensibilidad suficiente para detectar el cáncer en sus etapas iniciales.

Por ejemplo, las mamografías presentan una tasa de falsos negativos estimada en torno al 12 %. Incluso con tecnologías avanzadas, como la mamografía digital 3D, se han reportado tasas acumulativas de falsos positivos superiores al 50 % a lo largo de una década. Esta situación se agrava en neoplasias de órganos como hígado, páncreas u ovario, donde los métodos de screening poblacional eficaces aún no están disponibles, resultando en diagnósticos tardíos con escasas opciones terapéuticas efectivas.

(mental health, wellness, fitness, nutrition and supplements, remote monitoring)
(POC testing, lab testing, diagnostic technologies, decision support, population health)
(telehealth, home care, primary treatments, specialized treatments, hospitals)
(rehabilitation, social care, chronic care, elder care)
(training and certification, health and safety)
(health records, practice management, scheduling and referrals, health analytics)
 (wearables, medical devices, medical equipment, medical imaging, medical robotics)
(health benefits, corporate wellness, health insurance, health asset financing, healthcare real estate)
(drug manufacturing, drug commercialization, healthcare logistics, pharmacies)
(discoveries, clinical trials, clinical insights, precision medicine, genomics)
Datos del mundo real (Real World Data) en investigación oncológica
Dentro del ámbito oncológico, ha emergido un interés creciente en el uso de datos del mundo real (RWD) como complemento a los ensayos clínicos controlados, con el objetivo de responder interrogantes clínicos y de política sanitaria que no pueden abordarse exclusivamente desde el paradigma experimental.

El RWD refiere a información recopilada de fuentes heterogéneas del ámbito asistencial —como registros médicos electrónicos, bases de datos administrativas o registros poblacionales de cáncer— y suele organizarse en torno a tres dimensiones fundamentales: características basales del paciente, modalidades terapéuticas administradas y desenlaces clínicos observados.

Entre los desafíos asociados al uso de RWD en oncología se encuentran la identificación precisa de eventos adversos no graves (p. ej., neuropatía periférica, náuseas persistentes, fatiga crónica) y la atribución confiable de causas de mortalidad.
Proyección anual de nuevos casos de cáncer
Proyección anual del número de nuevos casos de cáncer en el mundo entre 2022 y 2050. La curva muestra un crecimiento exponencial sostenido, pasando de 20 millones de casos en 2022 a aproximadamente 35 millones en 2050. Esta proyección refleja la creciente carga global del cáncer y la necesidad urgente de estrategias escalables de prevención, detección temprana y tratamiento.
Limitaciones en métodos actuales de detección

La sensibilidad diagnóstica de las mamografías es menor en pacientes jóvenes, con mamas densas, o con tumores hormononegativos (es decir, que no expresan receptores de estrógeno o progesterona). Además, los cánceres de crecimiento acelerado pueden desarrollarse entre estudios de rutina, escapando a la detección periódica.

Un estudio publicado en 2018 por Khozin et al. utilizó registros electrónicos clínicos de la red Flatiron Health para analizar los resultados terapéuticos de pacientes con carcinoma pulmonar no microcítico (NSCLC) tratados con inhibidores de puntos de control inmunitario como nivolumab y pembrolizumab. Este análisis incorporó variables pronósticas relevantes (estado tabáquico, expresión de PD-L1, mutaciones en EGFR y reordenamientos en ALK) que no estaban disponibles previamente en otras fuentes de RWD.

Desde 2020, se ha observado un incremento en el uso de imágenes DICOM (radiografías, resonancias, tomografías y PET-CT) para entrenar modelos de machine learning (ML) y deep learning (DL). Simultáneamente, han ganado relevancia los datos ómicos, especialmente los genómicos, permitiendo la estratificación molecular y la personalización terapéutica.

Variables para distintos dominios en conjuntos de datos relacionados con el cáncer
Edad - Sexo - Fecha de diagnóstico - Histología del tumor - Estadio del tumor al diagnóstico - Detalles patológicos y moleculares del tumor (estado de márgenes, extensión de disección ganglionar, invasión linfovascular, grado y marcadores moleculares como receptores hormonales o mutaciones) - Nivel socioeconómico - Estado funcional - Comorbilidades - Función de órganos (por ejemplo, renal) - Altura, peso y/o superficie corporal - Segundo cáncer primario
Extensión de la enfermedad al momento del tratamiento - Intención del tratamiento - Procedimiento quirúrgico - Fecha de ingreso y/o alta quirúrgica - Dosis, fraccionamiento, volumen y técnica de radioterapia - Fármacos de quimioterapia, dosis y cronograma - Fechas de inicio y fin del tratamiento - Consultas con especialistas
Fecha de fallecimiento - Causa de fallecimiento - Diagnóstico y fechas de ingreso y/o egreso hospitalario - Diagnóstico y fechas de visitas a emergencias - Síntomas reportados por el paciente y calidad de vida - Estado funcional - Uso de recursos del sistema y/o costos.
Aplicaciones actuales en detección y monitoreo oncológico
Cáncer de mama: La combinación de mamografía digital 2D con tomosíntesis mejora significativamente la tasa de detección, reduce repeticiones de estudios, disminuye la exposición a radiación y optimiza recursos. En mujeres con mamas densas, la resonancia magnética (RM) ofrece mayor sensibilidad, aunque con una tasa más alta de falsos positivos.

Cáncer de pulmón: La tomografía computada de baja dosis (LDCT), aplicada en forma anual, ha demostrado una capacidad superior para detectar cáncer en estadios iniciales en comparación con las radiografías tradicionales.

Cáncer de tiroides: La captación de FDG en estudios PET-CT se ha correlacionado con la agresividad tumoral, permitiendo distinguir entre formas bien diferenciadas y variantes más agresivas.

Sarcomas óseos: En sarcoma de Ewing metastásico múltiple, estudios muestran que la RM alcanza una sensibilidad del 99 % para detectar lesiones menores de 7 mm, superando ampliamente al PET/CT (62 %), lo que refuerza su uso en la planificación terapéutica.

Metástasis óseas: Algoritmos de aprendizaje profundo entrenados con imágenes de gammagrafía ósea han demostrado igualar el rendimiento diagnóstico de médicos nucleares, mejorando la precisión y la eficiencia en el análisis de grandes volúmenes de estudios.

Melanoma: Modelos de aprendizaje profundo entrenados con bases de datos internacionales de imágenes dermatoscópicas han alcanzado niveles de desempeño comparables al juicio clínico experto en detección de lesiones pigmentadas sospechosas.
Imagenología, datos clínicos y genómica: hacia un enfoque multimodal
Los avances actuales apuntan a la construcción de datasets multimodales, que integren imágenes médicas, registros clínicos estructurados y datos genómicos. Este enfoque permite desarrollar herramientas predictivas más robustas, acelerar el diagnóstico y personalizar tratamientos.

Un caso ejemplar es el Federated Tumor Segmentation (FeTS) Challenge, en el que más de 30 centros colaboran en el entrenamiento de modelos de segmentación de tumores cerebrales sin centralizar los datos. Este tipo de aprendizaje federado tiene particular relevancia para regiones con limitaciones normativas o de infraestructura, como América Latina.
Inteligencia artificial en investigación y desarrollo oncológico
La aplicación de IA en oncología no se limita al diagnóstico por imagen. También se utilizan modelos para:
🔹Predecir respuesta terapéutica en función de biomarcadores moleculares.
🔹Correlacionar patrones histopatológicos con datos genómicos y clínicos.
🔹Optimizar flujos de trabajo clínico y estratificación de pacientes en estudios observacionales o ensayos clínicos.

El uso de datos del mundo real (RWD) ha demostrado ser una herramienta clave para entender subtipos tumorales complejos. Por ejemplo, la integración de datos clínicos longitudinales con características moleculares ha permitido mejorar la estratificación y el tratamiento en subtipos como el cáncer de mama HR+/HER2- o triple negativo.

En patologías como el cáncer de páncreas, estudios recientes han mostrado cómo la integración de imágenes histológicas con datos de PET-CT y ctDNA permite una evaluación más completa del perfil tumoral, lo que abre nuevas posibilidades en diagnóstico temprano y medicina personalizada.
El valor de los datos integrados
Desde Cromodata, entendemos que el verdadero potencial de la IA en oncología depende de la calidad, diversidad y trazabilidad de los datos disponibles. Por eso, trabajamos para facilitar el acceso a información estructurada, desidentificada y estandarizada, contribuyendo a que equipos científicos y tecnológicos puedan construir soluciones precisas, escalables y clínicamente relevantes.

Escrito por Valeria Analia Dávila.

Bibliografía:
Booth, C. M., Karim, S., & Mackillop, W. J. (2019). Real-world data: towards achieving the achievable in cancer care. Nature reviews Clinical oncology, 16(5), 312-325.
Khozin, S., Abernethy, A. P., Nussbaum, N. C., Zhi, J., Curtis, M. D., Tucker, M., ... & Pazdur, R. (2018). Characteristics of real‐world metastatic non‐small cell lung cancer patients treated with nivolumab and pembrolizumab during the year following approval. The Oncologist, 23(3), 328-336.
Juliusson, G., Lazarevic, V., Hörstedt, A. S., Hagberg, O., & Höglund, M. (2012). Acute myeloid leukemia in the real world: why population-based registries are needed. Blood, The Journal of the American Society of Hematology, 119(17), 3890-3899.