[Newsletter N6]

Buenos Aires - Argentina

  SYSTECH SA
 
   

Data Mining, ¿qué?

  Acelerador de Cambios  

El concepto de data mining ha sido mitificado en más de una oportunidad. La realidad, es que no hay algo nuevo o distinto a lo que generalmente se aplica y en muchas ocasiones se intenta mencionar a esta técnica o a otras como métodos revolucionarios.

 
 

En verdad, todo lo que se realiza desde el punto de vista de procesos se viene efectuando desde hace años y lo que se ha ido incorporando fueron criterios metodológicos que facilitaban esas tareas. Ahora, ¿qué fue lo que cambió?.

Lo que cambio fue “la tecnología”. Hoy por hoy, la tecnología nos permite acercar con mayor facilidad al usuario final elementos que antes estaban reservados solo para organizaciones de alto presupuesto y gran capacidad de investigación.

Los procesos de investigación pueden ser manejados en un 80 % por técnicas estándar de consultas pero existe un 20 % de esta información, para la cual necesitamos un trabajo muy exhaustivo y, sin lugar a dudas, el trabajo más complejo. Para esto último es que debemos trabajar con herramientas que nos permitan encontrar y descubrir patrones de comportamiento ocultos en la información y donde tiene absoluta validez el termino data mining o “minería de datos”.

Para poder clarificar el concepto iremos brindando algunos elementos que facilitarán su interpretación.

Los “Algoritmos de Minería de datos”, los podemos clasificar en dos grandes categorías:

Supervisados o Predictivos y No Supervisados o de Descubrimiento del Conocimiento.

Los “supervisados”, nos permiten predecir el valor de un atributo desconocido de un conjunto de datos o atributos descriptivos conocidos. Partiendo de ese concepto se induce una relación que nos permitirá predecir y determinar una relación entre el atributo conocido y el desconocido. Este método se lo conoce como supervisado y debemos trabajarlo en dos fases:

  • Entrenamiento: Construcción del modelo sobre datos conocidos.
  • Prueba: ejecución del modelo sobre datos desconocidos.

Cuando una aplicación no es lo suficientemente madura debemos aplicar el método “no supervisado o del descubrimiento de conocimiento” que descubren patrones y tendencias en los datos actuales (no utilizan datos históricos).

Dentro de estos dos grandes conjuntos tenemos algoritmos y técnicas de aplicación propios de cada uno, los cuales iremos viendo en futuras ediciones.

Hasta la próxima.

Alejandro Rocchetti
Director Ejecutivo

 

 
     
   
 
   
2-4.08.2006
7ma Conferencia Anual Latinoamericana
sobre Lavado de Dinero
Ciudad de México, México
07-10.08.2006
Seminario de Tipologías (EAG)
Bishkek, Kyrgyzstan
21-26.08.2006
Reuniones Plenarias y del Consejo de Ministros (ESAAMLG)
Harare, Zimbabwe
Ver calendario completo
 
 
  Nuestros Productos  

DIG


VISUALINKS


SIRTECH


VIGÍA


[ www.systechsa.com - info@systechsa.com ]
Copyright © 2006 Systech SA - Todos los derechos reservados