Saltar al contenido
SALUD

Inteligencia artificial en medicina

IA Sherpa |

(FL) es una tecnología innovadora en medicina que permite entrenar modelos de IA manteniendo la privacidad de los datos de los pacientes. A diferencia de los métodos tradicionales que centralizan los datos, FL los mantiene en su origen, como los hospitales. Consiste en distribuir un modelo de IA a varios nodos, donde cada nodo lo entrena localmente sin compartir datos brutos.

Sólo los parámetros actualizados del modelo se envían a un servidor central, que los agrega para mejorar el modelo, garantizando el cumplimiento de las estrictas normas de protección de datos.

Aplicaciones en medicina

1. Diagnóstico por imagen médica

FL es especialmente útil en radiología y patología, donde los conjuntos de datos suelen ser enormes y estar dispersos en distintas instituciones.

  • Detección de tumores cerebrales: Un modelo FL puede entrenarse con imágenes de resonancia magnética de varios hospitales. Cada hospital entrena el modelo con sus propias imágenes de tumores y pacientes sanos. Combinando los conocimientos de cada centro, el modelo final puede detectar tumores con mayor precisión y generalizarse mejor a distintos tipos de escáneres o poblaciones de pacientes.
  • Detección de neumonía a partir de radiografías: De forma similar, un modelo puede aprender a identificar signos de neumonía a partir de radiografías de tórax de múltiples clínicas, mejorando la robustez del modelo al estar entrenado en diversas representaciones de la enfermedad.

2. Medicina de precisión y farmacogenómica

FL puede utilizarse para desarrollar modelos que predigan la respuesta de un paciente a un medicamento o el riesgo de una enfermedad en función de su perfil genético.

  • Predicción de la dosis óptima de medicamentos: Varios hospitales pueden colaborar para entrenar un modelo que prediga la dosis correcta de un fármaco para un paciente, utilizando datos genómicos y clínicos, sin necesidad de compartir información confidencial del paciente.
  • Identificación de biomarcadores: FL permite el análisis colaborativo de grandes conjuntos de datos genómicos y clínicos para identificar biomarcadores asociados a determinadas enfermedades, como el cáncer.

3. Salud móvil y dispositivos wearables

FL puede utilizarse para entrenar modelos que analicen datos de dispositivos wearables (smartwatches, monitores de actividad) para hacer un seguimiento de la salud de los pacientes.

  • Predicción de arritmias: Se puede entrenar un modelo utilizando datos de electrocardiograma (ECG) recogidos por dispositivos móviles de miles de usuarios. FL permite que los datos permanezcan en el dispositivo del usuario mientras el modelo aprende a detectar patrones de arritmias, como la fibrilación auricular.

Comparación con otras tecnologías

Aprendizaje Federado vs Centralizado vs BlockchainFL representa un cambio de paradigma que permite a la IA alcanzar todo su potencial en el ámbito de la salud, superando las barreras de la privacidad y posibilitando la colaboración a gran escala. Es una herramienta clave para construir modelos de IA más sólidos, equitativos y útiles para la atención sanitaria.

En Sherpa.ai hemos desarrollado una plataforma de aprendizaje federada diseñada para preservar la privacidad de la IA.

Contamos con varias colaboraciones y casos de uso en el sector sanitario, que se destacan en nuestro sitio web y en diversas publicaciones.

Estos son algunos ejemplos de cómo se está aplicando nuestra plataforma de aprendizaje federado en la atención sanitaria:

1. Avance en el diagnóstico de enfermedades raras: Este es un ejemplo clave en la atención sanitaria. Trabajamos con los Institutos Nacionales de Salud (NIH ) y el University College de Londres (UCL). Su objetivo es mejorar el diagnóstico de las distrofias relacionadas con el colágeno VI (COL6-RD), una enfermedad genética rara.

  • El reto: Diagnosticar enfermedades raras es difícil porque los datos de los pacientes son escasos y están dispersos por distintos hospitales y centros de investigación de todo el mundo. Centralizar esta información médica sensible violaría las regulaciones de privacidad como HIPAA y RGPD.
  • Nuestra solución: La plataforma permite a los NIH y al UCL entrenar de forma colaborativa un modelo de aprendizaje automático en imágenes de microscopía de inmunofluorescencia de colágeno VI. Los datos nunca salen de las instituciones. Cada organización entrena el modelo con sus propias imágenes y solo se comparten y agregan las actualizaciones del modelo.
  • El resultado: Al entrenarse con un conjunto de datos más amplio y diverso, la precisión diagnóstica del modelo mejora significativamente, sin que se transfiera el registro de un solo paciente. Se trata de la primera aplicación global del aprendizaje federado para el diagnóstico de la COL6-RD.

2. Diagnóstico colaborativo asistido por IA

Nuestra plataforma de IA se utiliza para permitir la colaboración entre redes hospitalarias con el fin de entrenar modelos de diagnóstico compartidos para afecciones más comunes.

  • El reto: Los hospitales suelen tener sus propios conjuntos de datos para enfermedades como el cáncer de pulmón, la retinopatía diabética o el Alzheimer. Aunque valiosos, estos conjuntos de datos aislados pueden no ser lo suficientemente grandes o diversos como para crear un modelo de IA altamente robusto y generalizable.
  • Nuestra solución: Varios hospitales pueden utilizar la plataforma para entrenar conjuntamente un modelo de detección de enfermedades. Cada hospital entrena el modelo localmente utilizando sus propias radiografías, imágenes de retina o historiales de pacientes. La plataforma sincroniza de forma segura los parámetros del modelo.
  • El resultado: El modelo resultante es más preciso y eficaz porque ha aprendido de una gama más amplia de datos, incluyendo diferentes poblaciones, equipos y presentaciones de enfermedades, todo ello manteniendo los datos de los pacientes privados y seguros dentro del firewall de cada hospital.

3. Medicina y planes de tratamiento personalizados

La plataforma facilita el desarrollo de modelos predictivos específicos para cada paciente.

  • El reto: La medicina de precisión requiere analizar grandes cantidades de datos clínicos, genómicos y farmacológicos para predecir la respuesta de un paciente a un tratamiento específico. Estos datos son muy sensibles y existen en diferentes silos de datos.
  • Nuestra solución: Los hospitales y centros de investigación pueden colaborar para entrenar modelos predictivos de respuesta a la inmunoterapia en pacientes con cáncer, por ejemplo. El modelo aprende de los datos de diversas poblaciones en diferentes instituciones sin que los datos genéticos o sanitarios sensibles se muevan o compartan en ningún momento.
  • El resultado: Esto permite crear terapias adaptadas a cada paciente, manteniendo un control total de los datos y el cumplimiento de la normativa.

4. Aceleración de ensayos clínicos

Nuestra tecnología también se utiliza para acelerar la investigación médica y los estudios clínicos.

  • El reto: Los ensayos clínicos multicéntricos suelen implicar la transferencia de datos de pacientes a través de fronteras internacionales, lo que supone un proceso lento y complejo debido a las distintas normativas sobre privacidad.
  • Nuestra solución: Un ensayo clínico descentralizado sobre la eficacia de un nuevo fármaco puede entrenar un modelo a partir de datos distribuidos de múltiples centros sin transferir los historiales de los pacientes a través de las fronteras.
  • El resultado: Esto agiliza el proceso de investigación, reduce el tiempo de comercialización de terapias que salvan vidas y garantiza el cumplimiento de la normativa local sobre privacidad.

En todos estos casos, nuestra plataforma de IA Federadet hace hincapié en los principios clave del aprendizaje federado: soberanía de los datos, privacidad por diseño y capacidad para construir una inteligencia colectiva a partir de fuentes de datos descentralizadas.

También incorpora características como la privacidad diferencial para añadir una capa extra de seguridad, garantizando matemáticamente que los puntos de datos individuales no puedan reconstruirse a partir de las actualizaciones del modelo compartido.

En lo que respecta a la intersección del aprendizaje federado y la genómica, varios trabajos de investigación y plataformas están explorando este prometedor campo. El reto de la genómica es especialmente agudo, ya que los datos genéticos son muy sensibles y a menudo están aislados en diferentes instituciones, lo que dificulta la investigación colaborativa a gran escala.

He aquí algunos trabajos de investigación y plataformas clave relacionados con el aprendizaje federado en genómica:

Eficacia del aprendizaje federado en datos genómicos: un estudio sobre el Biobanco del Reino Unido y el Proyecto 1000 Genomas

Este artículo, publicado en Frontiers in Big Data, proporciona un trabajo fundacional sobre la aplicabilidad del aprendizaje federado a los datos genómicos a nivel individual.

  • Contribución clave: El estudio investiga directamente si un modelo federado puede alcanzar un rendimiento comparable al de un modelo centralizado a la hora de predecir fenotipos a partir de genotipos y ascendencia a partir de datos genómicos. Utilizan dos conjuntos de datos masivos y bien conocidos, el Biobanco del Reino Unido y el Proyecto 1000 Genomas, para llevar a cabo sus experimentos.
  • Resultados: Los investigadores demuestran que los modelos federados entrenados a partir de datos divididos en "nodos" independientes (que simulan diferentes silos de datos) logran un rendimiento muy próximo al de un modelo centralizado. Se trata de un hallazgo crucial, ya que demuestra que la naturaleza de preservación de la privacidad de FL no tiene por qué ir necesariamente en detrimento de la precisión del modelo en genómica. El artículo también explora los efectos de la frecuencia de comunicación entre los clientes y el servidor central sobre la precisión del modelo.

Romper barreras en la investigación genómica mundial

Se trata de un artículo de revisión publicado en la revista Genes, que ofrece una visión global del potencial y los retos del FL en genómica.

  • Contribución clave: Este artículo detalla la metodología de FL en el contexto de la investigación genómica, explicando cómo los datos genómicos específicos de una institución (como archivos FASTQ, BAM o VCF) pueden utilizarse para entrenar modelos locales. Se analiza el proceso de agregación segura y mejora iterativa del modelo.
  • Discusión: Los autores examinan desafíos clave, como la integración de datos heterogéneos de diferentes plataformas de secuenciación y los riesgos de ciberseguridad asociados con FL. También discuten cómo FL puede ayudar con el cumplimiento de regulaciones como RGPD. El artículo destaca las aplicaciones exitosas y analiza las direcciones futuras, incluida la integración de FL con otras técnicas de IA para avanzar en la medicina de precisión.
Democratización de los datos clínico-genómicos: Cómo las plataformas FL pueden promover el intercambio de beneficios en genómica

Este artículo de perspectiva, publicado en Molecular Systems Biology, explora el papel de las plataformas de datos federadas para hacer que los datos genómicos sean más accesibles para la investigación, al tiempo que promueven el "reparto de beneficios" con los participantes.

  • Aportación clave: El artículo sostiene que las plataformas de datos federados son un medio para lograr simultáneamente la accesibilidad y la seguridad de los datos. Describe cómo pueden utilizarse estas plataformas para vincular virtualmente los "entornos de investigación de confianza" (ERT) donde se almacenan los datos de los pacientes, sin mover físicamente los datos.
  • Debate: Los autores discuten la gobernanza y las consideraciones éticas de estas plataformas, haciendo hincapié en la necesidad de reglamentos estrictos y sistemas de acreditación para crear confianza pública. Destacan que un beneficio clave de la federación es democratizar el acceso a los activos de datos globales y mejorar la representación de los grupos infrarrepresentados en la investigación genómica, ya que los esfuerzos de secuenciación no siempre han sido diversos.
Federated Learning Enables Big Data for Rare Cancer Boundary Detectio (del proyecto FeTS)

Aunque no se centra exclusivamente en la genómica, el proyecto Federated Tumor Segmentation (FeTS) es un excelente ejemplo de plataforma de aprendizaje federado a gran escala y multiinstitucional en oncología, que implica en gran medida datos genómicos y clínicos.

  • Contribución clave: Este artículo, publicado en Nature Communications, detalla un esfuerzo de colaboración en el que participaron investigadores de 6 continentes y 71 centros para entrenar un modelo de segmentación de glioblastoma (un tumor cerebral poco frecuente).
  • Resultados: Mediante un enfoque FL, los investigadores pudieron aprovechar un conjunto de datos amplio y diverso de más de 6.300 pacientes sin necesidad de trasladar, integrar o armonizar los datos. Esto mejoró significativamente la precisión y la generalizabilidad del modelo en comparación con los modelos entrenados en conjuntos de datos más pequeños y de una sola institución, lo que demuestra el poder de FL para las enfermedades raras en las que los datos son escasos y están distribuidos.

Nuestra plataforma de IA permite

El entrenamiento colaborativo de modelos de IA en datos genómicos sin necesidad de centralizar o compartir los datos. Esta capacidad es crucial porque la información genómica es muy sensible y a menudo está aislada debido a estrictas normas de privacidad y cortafuegos institucionales.

Estas son las capacidades clave de nuestra plataforma de IA en genómica:

Colaboración en la investigación para preservar la privacidad

La principal ventaja de la plataforma es su capacidad para facilitar la investigación conjunta entre múltiples instituciones -como hospitales, universidades y centros de investigación- sin comprometer la privacidad de los pacientes.

En lugar de poner en común los datos genómicos brutos, la plataforma envía el modelo de IA al silo de datos de cada institución. El modelo se entrena localmente, y sólo las actualizaciones cifradas del modelo se envían de vuelta a un servidor central. Este proceso se repite hasta crear un modelo global de gran precisión.

  • Ejemplo práctico: La empresa tiene una notable colaboración con los Institutos Nacionales de Salud (NIH ) y el University College London (UCL). Utilizaron la plataforma para entrenar un modelo de diagnóstico de las distrofias relacionadas con el colágeno VI (COL6-RD), una enfermedad genética rara. Al entrenarse con imágenes de microscopía de ambas instituciones, el modelo mejoró su precisión diagnóstica sin que ningún dato del paciente saliera de su fuente.

Superar la escasez de datos sobre enfermedades raras

Los datos genómicos de las enfermedades raras son intrínsecamente escasos y están fragmentados en distintos lugares del mundo. La plataforma ayuda a superar este reto permitiendo a los investigadores construir colectivamente un conjunto de datos de entrenamiento más amplio y diverso de forma virtual.

  • Ventaja: Esto permite crear modelos más sólidos y generalizables de lo que sería posible para una sola institución. En el caso de enfermedades en las que existen unas pocas docenas de casos en todo el mundo, el aprendizaje federado puede cambiar las reglas del juego al unificar el "conocimiento" de estos casos dispersos en una única y potente herramienta de IA.

Cumplimiento de la normativa

Los datos genómicos están sujetos a algunas de las leyes de privacidad de datos más estrictas, incluida la HIPAA en Estados Unidos y el RGPD en Europa. Nuestra solución Federada está diseñada teniendo en cuenta estas normativas.

  • Cómo funciona: Debido a que los datos en bruto nunca salen del firewall institucional, la plataforma reduce significativamente el riesgo de violación de datos y simplifica las complejidades legales y administrativas del intercambio transfronterizo de datos, garantizando el pleno cumplimiento de la normativa.

Posibilitar la medicina personalizada

La plataforma puede utilizarse para desarrollar modelos predictivos de medicina personalizada. Estos modelos pueden analizar datos genómicos, clínicos y de estilo de vida para predecir el riesgo de enfermedad de un paciente o su posible respuesta a un fármaco específico.

  • Aplicación: Los investigadores pueden entrenar modelos en colaboración para identificar biomarcadores genómicos asociados a una enfermedad concreta o a la eficacia de un tratamiento, sin que cada institución tenga que compartir información sensible sobre los pacientes. Esto ayuda a acelerar el desarrollo de terapias y planes de tratamiento personalizados.

Libere el poder de los datos y la IA

No espere más, solicite una demo con nosotros, uno de nuestros expertos le proporcionará una demostración de la plataforma adaptada a sus necesidades, incluyendo recomendaciones para implementar con confianza nuestra solución para impulsar el valor de su organización.

  • Defina su caso de uso personalizado
  • Trabaje para un mejor uso de sus datos
  • Entrene su modelo preservando la privacidad