IBM SPSS Modeler es una herramienta integrada de minería de datos (Data Mining), Business Intelligence (BI) y Big Data. Permite trabajar con diversas fuentes de orígenes de datos (ASCII, XLS, ODBC, etc.), presenta una interfaz visual basada en procesos/flujos de datos (streams) e incorpora una amplia variedad de herramientas de minería de datos e inteligencia de negocios (exploración, correlación, reglas de asociación, regresión, segmentación, clasificación, redes neuronales, reglas y árboles de decisión, patrones, etc.), manipulación de datos (pick & mix, muestreo, matching y separación, etc.), combinación de modelos, visualización de datos, exportación de modelos a distintos lenguajes (C, SPSS, SAS, etc.), exportación de datos integrada a otros programas y generación de informes. Todas estas herramientas se estudian a lo largo del libro y se ilustran con ejemplos.
El entorno de IBM SPSS Modeler está basado en nodos que se van disponiendo y conectando para formar un flujo, o stream, traducido también como “ruta”. Los streams pueden almacenarse en ficheros separados o en proyectos que engloban a varios de ellos que se puede cargar, guardar, modificar, reejecutar o reorganizar y que son independientes de las fuentes de datos. Estas características permiten automatizar los procesos de inteligencia de negocios.
A lo largo del libro se desarrollan totalmente más de un centenar de ejemplos de minería de datos con la plataforma IBM SPSS Modeler. También se incorporan notas metodológicas sobre las técnicas de Data Mining y Business Intelligence clarificándolas con los correspondientes ejercicios paso a paso.
1. INTRODUCCIÓN A LA MINERÍA DE DATOS
1.1 CONCEPTO DE MINERÍA DE DATOS
1.2 EL PROCESO DE MINERÍA DE DATOS
1.3 TÉCNICAS DE MODELADO EN MINERÍA DE DATOS
1.4 HERRAMIENTAS DE MINERÍA DE DATOS
ENTORNO DE TRABAJO DE IBM SPSS MODELER
2.1 INTRODUCCIÓN A IBM SPSS MODELER
2.2 EJEMPLO DE TRABAJO CON IBM SPSS MODELER
2.3 NODOS DE ORÍGENES DE DATOS
2.4 NODOS DE OPERACIONES CON REGISTROS
2.5 NODOS DE OPERACIONES CON CAMPOS
2.6 NODOS PARA GRÁFICOS
2.7 NODOS PARA MODELADO
2.8 NODOS DE RESULTADO
2.9 NODOS DE EXPORTACIÓN
2.10 IBM SPSS MODELER E IBM SPSS STATISTICS
FASE DE SELECCIÓN EN IBM SPSS MODELER
3.1 LA FASE DE SELECCIÓN EN MINERÍA DE DATOS
3.2 SELECCIÓN DE DATOS POR MUESTREO
3.3 LA FASE DE SELECCIÓN EN IBM SPSS MODELER
3.4 SELECCIÓN DE DATOS CON IBM SPSS MODELER
3.5 MUESTREO ALEATORIO SIMPLE Y SISTEMÁTICO CON IBM SPSS MODELER
3.6 MUESTREO ESTRATIFICADO CON IBM SPSS MODELER
3.7 MUESTREO DE CONGLOMERADOS CON IBM SPSS MODELER
3.8 MUESTREO ALEATORIO SIMPLE CON IBM SPSS STATISTICS
3.9 MUESTREO ESTRATIFICADO CON IBM SPSS STATISTICS
3.10 ESTIMACIONES Y CÁLCULO DE ERRORES EN EL MUESTREO ESTRATIFICADO
3.11 MUESTREO DE CONGLOMERADOS MONOETÁPICO Y POLIETÁPICO CON IBM SPSS STATISTICS
3.12 ESTIMACIONES Y CÁLCULO DE ERRORES EN EL MUESTREO DE CONGLOMERADOS
4. FASE DE EXPLORACIÓN EN MINERÍA DE DATOS. NODOS EXPLORATORIOS EN IBM SPSS MODELER
4.1 LA FASE DE EXPLORACIÓN EN MINERÍA DE DATOS
4.2 ANÁLISIS EXPLORATORIO DE LOS DATOS
4.3 ANÁLISIS Y DETECCIÓN DE VALORES ATÍPICOS
4.4 ESTADÍSTICOS ROBUSTOS DE CENTRALIZACIÓN
4.5 ESTADÍSTICOS ROBUSTOS DE DISPERSIÓN
4.6 ESTADÍSTICOS ROBUSTOS DE ASIMETRÍA Y CURTOSIS
4.7 INFORMACIÓN FALTANTE O DATOS MISSING
4.8 TRATAMIENTO DE LOS DATOS AUSENTES. IMPUTACIÓN
4.9 LA FASE DE EXPLORACIÓN EN IBM SPSS MODELER
4.10 EL NODO GRÁFICO
4.11 EL NODO DISTRIBUCIÓN
4.12 EL NODO HISTOGRAMA
4.13 EL NODO MALLA
4.14 EL NODO GRÁFICO MÚLTIPLE
4.15 EL NODO COLECCION
4.16 EL NODO TABLERO
4.17 EL NODO GRAFICO DE TIEMPO
4.18 EL NODO MATRIZ
4.19 EL NODO ESTADISTICOS
4.20 EL NODO MEDIAS
4.21 EL NODO AUDITAR DATOS
4.22 NODOS DE ANALISIS EXPLORATORIO RELATIVOS A OPERACIONES CON CAMPOS
4.23 EL NODO TIPO PARA ASIGNAR ATRIBUTOS A VARIABLES
4.24 EL NODO FILTRO
4.25 EL NODO DERIVAR PARA TRANSFORMACIÓN DE VARIABLES
4.26 EL NODO RELLENAR Y EL NODO VAL. GLOBALES PARA IMPUTACIÓN DE DATOS MISSING
4.27 OTROS NODOS DE ANALISIS EXPLORATORIO RELATIVOS A OPERACIONES CON CAMPOS
FASE DE EXPLORACIÓN CON IBM SPSS STATISTICS
5.1 EL PROCEDIMIENTO EXPLORAR EN IBM SPSS STATISTICS
5.2 PROCEDIMIENTO GRÁFICOS DE CONTROL DE SPSS PARA LA DETECCIÓN DE VALORES ATÍPICOS
5.3 PROCEDIMIENTO ANALISIS DE VALORES PERDIDOS DE SPSS
5.4 PROCEDIMIENTO ANALIZAR PATRONES DE IBM SPSS
5.5 PROCEDIMIENTO IMPUTAR VALORES DE DATOS PERDIDOS DE SPSS
5.6 PROCEDIMIENTO IDENTIFICAR CASOS ATÍPICOS DE IBM SPSS 6. FASE DE MODIFICACION (TRASFORMACIÓN) EN EL PROCESO DE MINERÍA DE DATOS
6.1 TRANSFORMACIÓN DE DATOS EN EL PROCESO DE EXTRACCIÓN DEL CONOCIMIENTO
6.2 MODIFICACIÓN DE DATOS
6.3 MODIFICACIÓN CON TÉCNICAS DE REDUCCIÓN DE LA DIMENSIÓN
6.4 COMPONENTES PRINCIPALES
6.5 ANÁLISIS FACTORIAL
6.6 LA FASE DE MODIFICACIÓN DE DATOS EN IBM SPSS MODELER
6.7 EL NODO SELECCIONAR
6.8 EL NODO EQUILIBRAR
6.9 EL NODO AGREGAR PARA CALCULAR ESTADÍSTICOS POR SUBGRUPOS
6.10 EL NODO ORDENAR
6.11 EL NODO FUNDIR PARA PROCESOS DE MATCHING
6.12 EL NODO AÑADIR PARA CONCATENACIÓN DE ARCHIVOS
6.13 EL NODO DISTINGUIR
6.14 EL NODO FACTOR/PCA PARA ANÁLISIS FACTORIAL Y COMPONENTES PRINCIPALES
FASE DE MODELIZACIÓN EN EL PROCESO DE MINERÍA DE DATOS. TÉCNICAS PREDICTIVAS
7.1 TÉCNICAS DE ANALISIS DE DATOS (MODELIZACIÓN)
7.2 IBM SPSS MODELER Y LAS TÉCNICAS DE MODELADO
7.3 TÉCNICAS PREDICTIVAS PARA LA MODELIZACIÓN
7.4 MODELO DE REGRESIÓN MÚLTIPLE
7.5 MODELOS DE ELECCIÓN DISCRETA LOGIT Y PROBIT
7.6 MODELOS DE ELECCIÓN MÚLTIPLE: MODELO LOGIT MULTINOMIAL
7.7 MODELO LINEAL GENERAL DE REGRESIÓN MÚLTIPLE (GLM)
7.8 CLASIFICACIÓN AD HOC: ANÁLISIS DISCRIMINANTE
7.9 TÉCNICAS PREDICTIVAS DE MODELIZACIÓN CON IBM SPSS MODELER
FASE DE MODELIZACIÓN EN MINERÍA DE DATOS. ÁRBOLES DE DECISIÓN
8.1 ÁRBOLES DE DECISIÓN 8.2 CARACTERÍSTICAS DE LOS ÁRBOLES DE DECISIÓN
8.3 TIPOS DE ÁRBOLES DE DECISIÓN
8.4 IBM SPSS STATISTICS Y LOS ÁRBOLES DE DECISIÓN
8.5 ÁRBOLES DE DECISIÓN CON IBM SPSS MODELER
FASE DE MODELIZACIÓN EN MINERÍA DE DATOS. REDES NEURONALES
9.1 DESCRIPCIÓN DE UNA RED NEURONAL
9.2 REDES NEURONALES Y AJUSTE DE MODELOS PREDICTIVOS
9.3 APRENDIZAJE EN LAS REDES NEURONALES
9.4 FUNCIONAMIENTO DE UNA RED NEURONAL
9.5 REDES NEURONALES CON IBM SPSS MODELER10. FASE DE MODELIZACIÓN EN MINERÍA DE DATOS. TÉCNICAS DE SEGMENTACIÓN
10.1 PRIMEROS CONCEPTOS
10.2 TÉCNICAS DE SEGMENTACIÓN
10.3 EL ANÁLISIS CLUSTER COMO TÉCNICA DE CLASIFICACIÓN Y SEGMENTACIÓN
10.4 CLUSTERING MEDIANTE REDES NEURONALES
10.5 TÉCNICAS DE SEGMENTACIÓN CON IBM SPSS MODELER
FASE DE MODELIZACIÓN EN MINERÍA DE DATOS. REGLAS DE ASOCIACIÓN
11.1 REGLAS DE ASOCIACIÓN
11.2 REGLAS DE ASOCIACIÓN EN IBM SPSS. EL NODO A PRIORI
11.3 REGLAS DE ASOCIACIÓN EN IBM SPSS. EL NODO CARMA
FASE DE MODELIZACIÓN EN MINERÍA DE DATOS. MODELOS AUTOMÁTICOS Y EVALUACIÓN DE MODELOS
12.1 MODELIZACIÓN AUTOMÁTICA EN IBM SPSS MODELER
12.2 EL NODO CLASIFICADOR AUTOMATICO DE IBM SPSS
12.3 EL ALGORITMO AUTONUMÉRICO DE IBM SPSS
12.4 EL ALGORITMO AUTOCONGLOMERACION DE IBM SPSS
12.5 EL ALGORITMO SERIE TEMPORAL DE IBM SPSS