Crear actividad
Jugar Relacionar Columnas

Selección

Transformación reducción

Minería de datos Data mining

Interpretación evaluación

Preprocesamiento limpieza

-Se crea un conjunto de datos objetivo, con base en una muestra representativa, o todo el conjunto de datos -La selección de los datos varía de acuerdo a los objetivos del negocio

-Se interpretan los patrones descubiertos y posiblemente se regresa a las etapas anteriores para posteriores iteraciones -Puede incluir la visualización de los patrones extraídos, la remoción de los patrones redundantes o irrelevantes y la traducción de los patrones útiles en términos entendibles para el usuario

-Se analiza la calidad de los datos -Se aplican operaciones básicas como la remoción de datos ruidosos -Se seleccionan estrategias para el manejo de datos desconocidos, nulos, duplicados y técnicas estadísticas par su reemplazo -Es muy importante la interacción con el usuario o analista

-Se buscan características útiles para representar los datos dependiendo de la meta del proceso -Se utilizan métodos de reducción de dimensiones o de transformación para reducir el número efectivo de variables -Se utilizan técnicas de reducción como agregaciones, compresión de datos, histogramas, segmentación, muestreo y otras

-El objetivo es la búsqueda y descubrimiento de patrones insospechados y de interés -Se aplican tareas de descubrimiento como clasificación, clustering, patrones secuenciales y asociaciones, entre otras -Se crean modelos predictivos o descriptivos -La elección del algoritmo de minería de datos depende de la selección de los métodos por aplicar en la búsqueda de patrones en los datos, así como la decisión sobre los modelos y los parámetros más apropiados, dependiendo del tipo de datos por utilizar