Deteccion de fraude en el sector financiero utilizando Analisis de Datos

Orden de compra
Orden de compra

En casi todas las empresas se compran una variedad de productos de muchos proveedores. La actividad de seguimiento para la detección de fraudes se ve dificultada por el gran número de transacciones que están mal documentadas, datos faltantes, o que tienen errores. Los métodos deterministas no logran establecer un comportamiento normal y por lo tanto no pueden identificar otras anomalías para detectar fraudes.

Un enfoque más sofisticado es capaz de entender los comportamientos de la línea base de las unidades de negocios o vendedores y detectar desviaciones. Esto requiere de la generación de datos (1) para entender el comportamiento esperado (2), identificar y corregir errores en la introducción de datos, y establecer semejanzas y relaciones entre las unidades de negocio y proveedores.

Algunos de los fraudes más comunes y algunos de los mecanismos existentes para detectarlos son:

Facturas duplicadas: Se pueden detectar utilizando técnicas de inteligencia artificial para parametrizar las facturas utilizando el vendedor, el número de factura, la fecha de la factura, el valor de la factura. Luego se debe calcular la distancia, por ejemplo las distancias Damerau Levenshtein (3), entre las diferentes facturas analizadas, y aquellas cuya distancia es menor a una distancia umbral se podrán etiquetar como sospechosas de ser duplicadas.

Los vendedores se consideran similares si comparten nombres similares, la misma cuenta bancaria, dirección y/o teléfono. Los números de factura se consideran iguales si la distancia entre ambos números se encuentra por debajo de un umbral. Las fechas se consideran cercanas si están en un rango de 7 días o son la misma fecha pero en formato diferente (MES/DIA/AÑO  AÑO/MES/DIA). Los valores pagados se consideran cercanos si son idénticos o su distancia es pequeña.

 

Nombres múltiples de proveedores:  Hay que distinguir las situaciones normales (sin fraude) de las anómalas (con fraude). Hay situaciones en las que 2 nombres muy similares pueden corresponder a subsidiarias de una misma gran empresa, debido a fusiones o adquisiciones, médicos de un mismo centro médico, etc. Hay situaciones en las que proveedores malintencionados pueden tener múltiples identidades con el objetivo de cometer fraude.

Algunos criterios para definir si se trata de un mismo proveedor son: Comparten el mismo número de cuenta bancaria, la misma dirección y/o teléfono, comparten el mismo nombre o similar.

Para determinar si dos nombres son similares se remueven las preposiciones, artículos y demás palabras adicionales. Se procesan los sinónimos y abreviaturas. Se calcula la Tf-idf (4), frecuencia inversa de documento, la frecuencia de ocurrencia del término en los documentos, es una medida numérica que expresa cuán relevante es una palabra para un documento. El valor tf-idf aumenta proporcionalmente al número de veces que una palabra aparece en el documento.

 

Tecnicas de agrupamiento
Tecnicas de agrupamiento

Perfil de comportamiento de los vendedores:  Hay que asumir que la mayoría de transacciones de los vendedores son legítimas. Pero pueden haber diferentes comportamientos “normales”. Hay que determinar las transacciones anómalas: Caracterizando las facturas; utilizando algoritmos de agrupamiento, usando dendogramas por ejemplo (5); determinando la densidad de cada grupo; identificando los grupos con baja densidad como anómalos.

 

Perfil de comportamiento de compras:  En las empresas hay patrones de compras similares. Patrones anómalos de compras pueden ayudar a identificar fraudes o patrones antieconómicos. Se pueden agrupar las compras para determinar los patrones de compra.

 

Referencias

  1. http://www.datasciencecentral.com/video/dsc-webinar-series-machine-learning-for-forensic-accounting
  2. http://www.fraud-magazine.com/article.aspx?id=203
  3. http://es.wikipedia.org/wiki/Distancia_de_Levenshtein
  4. http://es.wikipedia.org/wiki/Tf-idf
  5. http://benjamindespensa.tripod.com/spss/AC.pdf

 

 

Suscribete a nuestro blog: http://www.auroratech.com.co/blog

 

Carlos Agudelo

Director de Proyectos

AuroraTech

www.auroratech.com.co

Facebook: http://www.facebook.com/auroratechpymes

Twitter:       http://twitter.com/AuroraTechPymes

Blog:              http://www.auroratech.com.co/blog

LinkedIn:    http://www.linkedin.com/company/auroratech?trk=biz-companies-cym

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *