El aprendizaje federado está ganando un impulso significativo para las aplicaciones financieras, ya que ofrece una solución práctica para entrenar modelos de aprendizaje automático de forma colaborativa, mientras que los datos sensibles permanecen seguros dentro del entorno local de cada banco.
Esto permite a las entidades financieras optimizar la detección del fraude y la gestión del riesgo entre organizaciones y países, algo que antes se consideraba imposible debido a las barreras normativas y competitivas.
El aprendizaje federado (FL), en esencia, es un paradigma de aprendizaje automático distribuido que permite que los modelos de IA se entrenen de forma colaborativa en una red de instituciones descentralizadas. A diferencia de los modelos centralizados tradicionales, que requieren que los datos se agrupen, FL mantiene los datos locales, preservando así la integridad de la información confidencial de los clientes, los datos confidenciales de las transacciones y las intrincadas relaciones financieras.
Dado que la privacidad de los datos es primordial en el entorno normativo actual, regido por leyes como GDPR y CCPA, FL es una herramienta esencial en la búsqueda de la industria financiera de conocimientos impulsados por la IA mientras se salvaguarda la información crítica.
Este post presenta una aplicación de FL dentro de los servicios financieros, demostrando mejoras en los procesos de detección de fraude y antiblanqueo de dinero (AML).
Mediante el uso de la plataforma de inteligencia artificial Sherpa.ai Privacy-Preserving, un consorcio de bancos puede entrenar de forma colaborativa un modelo de inteligencia artificial superior que detecta patrones de fraude sofisticados e interinstitucionales.
El modelo FL resultante reduce significativamente las pérdidas financieras y los costes operativos asociados a las altas tasas de falsos positivos, al tiempo que garantiza el pleno cumplimiento de la normativa.
¿Cómo funciona el aprendizaje federado?
Cada vez que se utiliza una aplicación de banca digital, ésta recopila datos. Estos datos son muy sensibles, ya que contienen notas personales, mensajes privados y detalles financieros. Almacenar estos datos en una ubicación central representaría un riesgo empresarial significativo y sería difícil de justificar ante clientes y reguladores.
Por esta razón, FL entra en juego para entrenar potentes modelos de IA, como para la detección de fraudes, sin compartir nunca los datos en bruto.
Así es como funciona en un consorcio bancario:
- Distribuir el modelo inicial de IA: Un modelo inicial, diseñado para detectar patrones de transacciones fraudulentas, se distribuye desde la plataforma Sherpa.ai a cada banco participante.
- Preparación de datos: A medida que se producen las transacciones, los datos de entrenamiento se recopilan dentro del entorno seguro de cada banco. FL permite utilizar datos sin procesar, ya que nunca se comparten ni se exponen. Sin embargo, se puede añadir una capa adicional de privacidad y seguridad antes de utilizar estos datos, aplicando tecnologías de mejora de la privacidad como la privacidad diferencial. Esta técnica añade una cantidad matemáticamente calibrada de «ruido» a los datos, lo que hace imposible realizar ingeniería inversa de puntos de datos individuales sin alterar los patrones generales necesarios para el entrenamiento.
- Entrenamiento local: El modelo de IA se entrena de forma asíncrona dentro de la infraestructura segura de cada banco, utilizando únicamente sus datos de transacciones locales. Este entrenamiento se realiza directamente en los servidores del banco, lo que garantiza que los datos confidenciales de los clientes permanezcan privados y nunca salgan de su control.
- Creación local de la actualización del modelo: Tras el entrenamiento local, cada banco genera una actualización del modelo. Esta actualización contiene cambios resumidos y encriptados de los parámetros del modelo (pesos) basados en los patrones aprendidos de sus datos locales. Se trata de una representación compacta y anónima de las mejoras.
- Transmitir la actualización local: Esta representación compacta de los cambios del modelo se envía al servidor central de Sherpa.ai.
- Aprender globalmente: La plataforma Sherpa.ai combina de forma segura todas las actualizaciones del modelo de los bancos participantes para crear un nuevo modelo global más inteligente utilizando algoritmos como el promedio federado.
- Despliegue del modelo global actualizado: Cada banco participante recibe el modelo global actualizado. Como resultado, cada institución se beneficia de la inteligencia colectiva, disfrutando de capacidades de detección de fraude mejoradas y más precisas.
En este ejemplo, todos los bancos están realizando la misma tarea de "detección de fraude" utilizando el mismo tipo de datos de entrada de "registros de transacciones". Esto se conoce como Aprendizaje Horizontal Federado (HFL), en el que varias partes tienen las mismas características de datos para diferentes conjuntos de clientes.
¿Cómo ayuda el aprendizaje federado al sector financiero?
La transición de la IA de la investigación a las aplicaciones financieras en el mundo real suele fracasar por muchas razones, desde barreras normativas hasta preocupaciones estratégicas y riesgos de ciberseguridad. La plataforma de aprendizaje federado Sherpa.ai es una opción convincente para hacer frente a estos retos.
- Barreras normativas: Los datos financieros están sujetos a regulaciones estrictas como GDPR, que pueden impedir que los datos se muevan a través de las fronteras de los países. FL mantiene los datos locales y los procesa en la fuente, garantizando el cumplimiento mientras aprovecha las perspectivas de los datos a través de las fronteras y las organizaciones.
- Preocupaciones estratégicas: La detección del fraude en el mundo real requiere más datos de los que puede proporcionar un solo banco. Sin embargo, los bancos son competidores y les preocupa compartir datos y propiedad intelectual. Con una configuración FL, los datos permanecen en manos de su propietario y los socios colaboradores acuerdan compartir únicamente las perspectivas específicas representadas por el modelo de IA.
- Preocupación por los costes: Las instituciones financieras modernas generan enormes cantidades de datos. Aunque los costes de transferencia de datos a la nube pueden parecer mínimos al principio, el mero volumen hace que los costes aumenten. FL reduce los costes de transferencia de datos y la huella de carbono asociada.
- Riesgos de ciberseguridad: Los grupos centrales de datos financieros combinados son un objetivo atractivo para los actores maliciosos. Con FL, no es necesaria una reserva central de datos, lo que mitiga elegantemente los riesgos asociados.
¿Cómo puede funcionar el aprendizaje federado en toda la cadena de valor financiera?
Imaginemos dos empresas: un banco tiene datos sobre hábitos financieros y una empresa de telecomunicaciones posee datos sobre el uso del móvil y las pautas de viaje. Aunque ambas empresas tienen datos sobre el mismo cliente, los atributos de los datos ("características") que poseen son diferentes.
Con el aprendizaje vertical federado (VFL), pueden entrenar en colaboración un modelo utilizando sus características combinadas sin intercambiar directamente datos brutos sobre sus clientes. Para el VFL, el modelo se divide esencialmente en partes, y cada empresa entrena su parte del modelo. La VFL puede aplicarse a toda la cadena de valor, donde cada participante entrena una parte del modelo para su segmento.
Aplicar esto a las finanzas podría suponer mejoras significativas en áreas como la mejora de la puntuación crediticia o las campañas de marketing altamente personalizadas.
¿Qué se necesita para implantar el aprendizaje federado en la banca?
El aprendizaje federado es una combinación profundamente tecnológica de dominio del aprendizaje automático y sistemas distribuidos. Los requisitos para implantar el FL de nivel industrial en la banca son significativos:
- Privacidad y seguridad de los datos: Proteger los datos exige impedir la ingeniería inversa a partir del modelo de IA. Aquí es donde resultan esenciales las tecnologías avanzadas de mejora de la privacidad (PET).
- Datos heterogéneos: La configuración de cada banco es diferente, y los datos pueden variar en formatos, intervalos y sistemas de almacenamiento. La capacidad de entrenar el mismo modelo con datos diferentes es esencial.
- Combinación de entidades y productos: Al desarrollar modelos, deben tenerse en cuenta las combinaciones de diferentes segmentos de clientes, productos financieros y tipos de transacciones. Definir cohortes de combinaciones comparables es un reto cuando los detalles se mantienen confidenciales.
- Heterogeneidad de dispositivos y configuraciones: La variedad de infraestructuras informáticas, protocolos de seguridad y condiciones operativas de los bancos representa un reto importante.
- Modelo inicial: Los escenarios requieren un modelo inicial para comenzar, lo que implica que algunos datos están disponibles para el desarrollo. Esto puede ser un obstáculo para muchos marcos FL, especialmente en los casos VFL.
- Monitorización de datos y modelos: Una configuración FL requiere tanto una supervisión local del rendimiento del modelo como una supervisión federada que preserve la privacidad para el proceso de formación general.
- Potencia de cálculo descentralizada: El entrenamiento de modelos realizado localmente requiere recursos informáticos de IA descentralizados en cada institución participante.
Aplicaciones del aprendizaje federado en los servicios financieros
FL establece sistemas de aprendizaje fiables entre múltiples partes. Las siguientes áreas de aplicación ilustran parte del potencial que la plataforma Sherpa.ai puede desbloquear hoy en día.
- Detección del fraude y lucha contra el blanqueo de dinero (AML): Este es un caso de uso primario. Mediante el análisis colaborativo de los datos de transacciones de varios bancos, un modelo federado puede identificar sofisticadas redes de fraude y blanqueo de dinero que son invisibles para una sola institución.
- Calificación crediticia y predicción de morosos: Un consorcio de prestamistas puede entrenar un modelo de riesgo crediticio más preciso sin compartir datos financieros confidenciales de los clientes, lo que permite tomar mejores decisiones de préstamo y reducir el riesgo.
- Predicción de la pérdida de clientes: Los bancos pueden colaborar de forma segura con socios, como compañías de seguros o empresas de telecomunicaciones, para construir una visión más holística del cliente y predecir y prevenir con mayor precisión la pérdida de clientes de alto valor.
- Detección de amenazas de ciberseguridad: Las instituciones pueden entrenar modelos de forma colaborativa para detectar amenazas emergentes de ciberseguridad, como ransomware o ataques de phishing, compartiendo lo aprendido de su actividad en la red sin exponer detalles sensibles de la infraestructura.
- Marketing personalizado y venta cruzada: Al asociarse con minoristas o aerolíneas, los bancos pueden desarrollar mejores modelos de IA para la venta cruzada de productos relevantes -como una tarjeta de crédito de viaje premium- sin ninguna fuga de datos entre las organizaciones.
El aprendizaje federado no es sólo una tecnología prometedora, es una necesidad para cualquier institución financiera que quiera innovar respetando la privacidad de los datos.
Con nuestra plataforma de IA, los bancos pueden por fin colaborar de forma segura -entre sí y con socios de confianza- para luchar contra el fraude, retener a los clientes y desbloquear nuevas fuentes de ingresos.Sin transferencias de datos arriesgadas. Sin problemas de cumplimiento. Solo IA más inteligente.
En un mundo en el que la confianza es la nueva moneda,nuestra solución ayuda a los bancos a proteger tanto a sus clientes como su ventaja competitiva.