Meeting en #Dublin de IA sobre blanqueamiento de dinero

Hoy he ido a mi primer meeting en Dublin. 30 minutos a pie desde la última parada del LUAS (tram) hasta las oficinas de Zalando. No, no había ropa. Aquí en Dublin está concentrada toda la programación de las grandes empresas. Dentro del edificio es como cualquier empresa de programación, mesas largas con ordenadores y más ordenadores. Las instalaciones se ven bastante bien con las fotos que proporciona google maps: Zalando Ireland – Google Maps

Me ha sorprendido todo en el buen sentido. Para empezar, creo que el meeting no era algo ni pensado a lo grande, ni altamente planificado. Más bien algo que se postea por ahí y luego va quien quiere, en plan el Mistela&Tweets en Xátiva. A pesar de ello, el resultado es mucho mejor que muchas charlas en España.

La gente es tremendamente abierta, me ha saludado todo el mundo que se ha cruzado conmigo, se han presentado y incluso dan conversación. Tristemente mi inglés no me da aún para conversar fluidamente, así que poca conversación a mi pesar.

Otra cosa es que el 99% de los asistentes en esta presentación eran programadores y posiblemente más del 80% parecían entender bastante del tema. Más que yo, que no es que entienda mucho de IA (lo básico). Pero siendo un área tan especializada, nueva, y el meetup tan casual, que realmente esperaba unos porcentajes mucho más bajos.

Luego llegaron 3 personas cargadas con cajas y cajas de pizza que se fueron repartiendo. ¡Pizza gratis para todos! La entrada era gratis, sin registro y sin nada. Además nos dieron permiso para “robarles” bebida de la nevera ¡y tenían cerveza! (y Coca-cola, etc). El evento teóricamente empezaba a las 6 de la tarde, pero dejaron un espacio para comer y charlar. Dio tiempo para conocerse a la gente entre ella y comernos las pizzas. Media hora más tarde empieza la charla. Mi nivel de inglés se tambalea un poco para seguir al ponente en lo que va explicando. Pero en las preguntas y respuestas sí que no entendía casi nada. Os hago un breve resumen de lo que se comentó:

Los bancos tienen que reportar a los gobiernos los posibles casos de blanqueo de dinero que detectan. Los gobiernos por lo general no contestan ni al 1% de los casos remitidos. Actualmente para detectar esto usan reglas escritas manualmente, que disparan avisos, lo que pasa es que estos avisos lógicamente están llenos de falsos positivos. Después unos inspectores revisan a mano estos avisos para verificar si realmente es actividad sospechosa o no, y deciden qué casos remitir a las autoridades. El análisis lo realizan revisando la actividad de las cuentas en distintos aspectos, tarjetas de crédito, movimientos bancarios y también las bases de datos de actividad criminal de Estados Unidos.

El problema viene cuando se disparan muchísimas alarmas por día y terminas con un ejército de inspectores subcontratados que ni aun así dan abasto con las alarmas. Por lo que nos cuenta el ponente, al final los sistemas escogen alguna alarma al azar y la entregan a varios inspectores para su análisis. El resto de alarmas, se descartan.

Encima, el sistema de alarmas es muy sensible y se dispara demasiado rápido. En el mejor de los casos el 80% de las alarmas disparadas son un falso positivo. En el peor, el 100% de las alarmas son falso positivo y no contienen ninguna actividad sospechosa.

Imaginaros al inspector revisando alarmas todo el día, un proceso que por cada una de ellas toma horas, que el 95% de veces sea basura.

Entonces ésta empresa (H2o) que tiene un framework de IA software libre, está proponiendo a los bancos usar la inteligencia artificial para mejorar éstos números y simplificar el trabajo de los inspectores. Y además de ser más productivos (más cantidad de positivos confirmados), dejan de descartar alarmas que posiblemente sean un positivo (falsos negativos).

La idea es como sigue, usan un “Decision Tree” (árbol de decisiones) para que las decisiones tomadas por la máquina puedan ser justificadas a las entidades regulatorias. Al fin y al cabo es un clasificador inteligente, igual que el filtro del correo electrónico nos clasifica los emails entre Spam y Ham (no spam), su clasificador lo hace entre Sospechoso y no sospechoso.

Y, al igual que en los filtros de correos electrónicos, este sistema pasa por un aprendizaje. Hay que decirle qué actividad es sospechosa y cual no, para que aprenda el patrón y sea capaz de predecir en qué categoría cae cualquier actividad que le suministres aunque no la haya visto antes. Para esto, le pasan el resultado de lo que realizan ahora los inspectores, ya que ellos ya estaban clasificando en este mismo sentido. Usando la clasificación previa ya realizada por esta gente, la máquina es capaz de aprender y realizar algo parecido para cualquier dato nuevo.

El resultado es que al usar este sistema como “prefiltro” pueden reducir los falsos positivos a un 60%, pero más importante, es que ahora pueden procesar todas las alarmas y no dejarse nada por revisar.

No quiero complicarlo más porque la charla se extendió hasta conceptos bastante complejos, como la entrada y transformación de datos, sistemas de aprendizaje y feedback, detección de actividad sospechosa, deep learning y aprendizaje no supervisado, etc.

La gente estuvo muy atenta y prueba de ello es que hubo más tiempo de preguntas que de charla. Mucha gente distinta preguntó muchas cosas, muy avanzadas.

Terminó la charla y el tiempo de preguntas y la gente estuvo tiempo allí agradeciendo al ponente su tiempo y esfuerzo. Estuve charlando con un par de personas (dentro de lo que buenamente supe) y me fui; bastante contento por cierto.

Me hubiera gustado haber hecho alguna amistad, aunque supongo que aún es demasiado pronto. Pero tiempo al tiempo!