En el pasado mes de enero le fue adjudicada a Deloitte Development Llc la patente número WO2015002630 A2, titulada ‘Métodos y sistemas para la detección del fraude’. Dicha patente emplea un análisis estadístico no supervisado para detectar varios tipos de fraude en seguros especialmente en reclamaciones de seguros de accidentes personales.
Fraude de accidentes personales
Según lo mencionado por la patente el fraude de accidentes personales ocurre ‘‘cuando un individuo hace una reclamación de seguros por un accidente y recibe dinero cuando no tiene derecho, ya sea por invención o exageración de la heridas, planeando el accidente, manipulando los hechos del accidente para asignar incorrectamente culpabilidad o de otra manera engañar la compañía de seguros’’.
El documento indica que los tipos de seguros más susceptibles al fraude son los relacionados con accidentes personales relacionados con vehículos, que para el caso colombiano sería el Seguro Obligatorio de Accidentes de Tránsito (Soat).
Algunas generalidades sobre el fraude
La patente clasifica el fraude en duro y suave. El primero hace referencia a heridas e incidentes falsos y el último incluye exageraciones de severidad alrededor de un evento legítimo.
Según el documento un reclamación fraudulenta puede ser descubierta solo si esta es investigada. Muchas reclamaciones son procesadas y no investigadas por las compañías, y también se presenta el caso que a pesar de investigar el siniestro no se logre detectar que se trataba de un fraude.
Como consecuencia de lo anterior, según la patente, la mayoría de las compañías aseguradoras ‘‘(…) no saben con certeza, y sus bases de datos no reflejan con precisión, el estado de todas las reclamaciones con respecto a la actividad fraudulenta’’. Esto tiene implicaciones en el tipo de modelo predictivo para detectar el fraude.
Modelos para detectar el fraude
El documento indica que es posible emplear modelos predictivos para segmentar los siniestros e identificar los que tienen una mayor propensión a ser fraudulentos. Existen dos categorías generales de modelos predictivos para detectar fraude: los modelos supervisados y los modelos no supervisados.
Particularidades de los modelos
La patente señala que el análisis supervisado tiene como supuesto que la variable objetivo es completa, es decir, que la entidad aseguradora conoce todos los casos en los que se han cometido fraude; sin embargo este supuesto no es correcto. Adicionalmente el documento indica que dichos modelos le dan una mayor ponderación a los tipos de fraude ya conocidos.
Por su parte el análisis no supervisado no emplea variables objetivo dentro de su análisis y según el documento pueden ser de gran utilidad para identificar modalidades de fraude ya conocidas y desconocidas. Algunos ejemplos de análisis no supervisados son los conglomerados y las reglas de asociación.
Conglomerados
El documento expresa que la técnica de conglomerados tiene como objetivo segmentar en grupos las reclamaciones de manera homogénea en varias dimensiones y determinar el o los conglomerados que contienen los casos ‘sospechosos’ para ser posteriormente remitidos a las unidades investigativas.
Por ejemplo, según la patente, los conglomerados están la capacidad de identificar las reclamaciones que involucran muerte y heridas severas, y de paso asignar menor probabilidad de fraude a los conglomerados que contienen dichas reclamaciones debido a la gravedad de la situación.
Las variables empleadas
El tipo de variables a emplear para la detección del fraude dependen del tipo de negocio y la naturaleza del fraude que puede ocurrir. Adicionalmente el documento indica que se deben tomar dos pasos para seleccionar las variables:
- Seleccionarlas según las reglas de negocio e hipótesis comunes.
- Remover variables que sean altamente correlacionadas o similares.
En el presente artículo se mencionan las variables que se podrían emplear para detectar fraudes en accidentes personales relacionados con vehículos. El documento analizado suministra nueve categorías de variables:
1: tiempo de la reclamación
La patente indica que el conocimiento de la cronología y el tiempo de los eventos pueden ayudar a suministrar información acerca de la hipótesis de fraude que se está manejando. Por ejemplo, si existe mucho tiempo entre el reporte de la reclamación se puede sugerir que el solicitante está esperando a que la herida sane y poder exagerar la severidad de la misma.
Algunos ejemplos son un gran margen de tiempo entre el involucramiento de un abogado y la fecha de reporte y bastante tiempo transcurrido entre la fecha del accidente y la del reporte.
2: participación del abogado
Este tipo de información es importante asumiendo que el abogado se puede considerar sospechoso si se involucra desde el primer día o si lo hace meses o años después. En el primer caso, según el documento, el solicitante está presionando por un acuerdo rápido antes de llevar a cabo la investigación y en el segundo el solicitante espera obtener un beneficio financiero antes de la expiración de los términos.
Algunas señales de alerta son:
- Si el abogado del solicitante está radicado a 50 millas del solicitante.
- Si el pleito se establece entre los 30 días de la fecha de reporte.
- Si el pleito se establece 30 días antes de la fecha de la expiración de los términos.
Percy
3: información de las heridas
La patente indica que revisar el tipo de herida, en conjunto con otra información, sirve para determinar la validez de la solicitud y por lo tanto se deben incluir las partes del cuerpo que fueron afectadas. Se sugiere revisar si hubo fracturas, cirugías y/o parálisis
4: daño del vehículo
Identificar el daño del vehículo y las heridas sirven para determinar la validez de la reclamación. Por ejemplo, daños en el techo, espejo o choques laterales son indicadores de combinaciones sospechosas cuando la herida observada no corresponda con el daño del vehículo.
5: información del solicitante y asegurado
La información básica del asegurado y del solicitante es clave para la generación de los conglomerados, según estipula el documento. Por ejemplo, el hecho de que un solicitante presente varias reclamaciones puede considerarse una señal de alerta.
En este número se sugiere revisar el número de reclamaciones por solicitante, la distancia entre el hogar del asegurado y del solicitante, y verificar si el carro del asegurado es lujoso o estándar.
6: información del reclamo
Esta información es importante para conocer las circunstancias que rodearon el accidente, la cual al no ser consistente puede generar señales de alerta acerca de la validez de la reclamación. Por ejemplo, se puede revisar si el accidente ocurrió durante periodo de vacaciones o en un fin de semana.
7: información acerca del hogar
La información está enfocada a determinar la situación financiera del reclamante, entre otras variables. Por ejemplo, se puede revisar el ingreso medio del hogar y el índice de educación recibida.
8: análisis de redes
La patente indica que otra forma de detectar el fraude es a través de la construcción de redes basadas en la asociación de reclamos pasados. Según el documento, al coleccionar información de los individuos asociados con cada reclamo y al construir una red a través del tiempo se puede encontrar que ‘‘el fraude tiende a agruparse al interior de ciertos anillos, comunidades y distribuciones geométricas’’.
9: evaluación de los conglomerados
Una vez se corre el algoritmo, cada conglomerado puede ser descrito a partir del promedio de sus observaciones, y a partir de la hipótesis de fraude que tenga la aseguradora, esta selecciona los conglomerados que tengan mayor propensión al fraude.
Por ejemplo, según el documento, un conglomerado que presente un 40% de los reclamos con litigios y 82% de ellos involucran a un abogado, es realista considerar que es posible encontrar fraude suave en dichos reclamos.
Volver a calibrar el modelo
La patente indica que es importante hacer una calibración periódica del modelo para identificar el fraude emergente, dado que los defraudadores emplean nuevos métodos cada cierto tiempo. El proceso consiste en asignar las nuevas reclamaciones a cada conglomerado, pero simultáneamente estas se emplean para crear nuevos conglomerados para detectar patrones anómalos que pueden convertirse en nuevas modalidades de fraude.
Adicionalmente el área encargada de correr el modelo antifraude puede recibir retroalimentación de las unidades de investigación para determinar que conglomerados detectan el fraude de forma más eficiente.
En caso que las compañías aseguradoras deseen montar un sistema similar para la detección del fraude, la entidad debe primer escoger el ramo o línea de negocio a la que quiere hacerle seguimiento, posteriormente formular unas hipótesis de fraude y aplicar finalmente una metodología de minería de datos como Crisp-DM o Semma la cual tiene bastante aplicación para este fin.
Conclusiones
Este documento es útil para que las entidades aseguradoras comparen, frente a la patente, las herramientas, procesos y métodos de minería de datos que emplean en el día a día de su negocio para prevenir el fraude.
Es necesatio advertir que los métodos y sistemas contemplados en la patente son propiedad intelectual del inventor y por ende su aplicación está sujeta a restricciones. Sin embargo, llama la atención que muchas de las técnicas descritas en el documento son comunes en la industria, como por ejemplo el uso de modelos no supervisados, estandarización de variables, definición de numero de conglomerados, entre otros.
Lo anterior plantea el siguiente interrogante: ¿las entidades tienen que solicitar las debidas autorizaciones por aplicar algún método o sistema de una patente que a su vez es un estándar de la industria? Un tema para tener en cuenta.
La patente se puede consultar en el siguiente enlace: http://bit.ly/1JZpWl3