Tema 1 - Introducción

Qué estudiar

Capítulos del Libro: 1 (1.1, 1.2, 1.3, 1.4, 1.5 y 1.7) y 2 (2.1, 2.2, 2.3, 2.4 y 2.5)
Presentación PPT de Minería de Datos: Hasta la trasparencia 23 (incluida)

Conceptos

  1. Concepto de la minería de datos (data mining).
  2. Tipologías de datos y de modelos.
  3. Concepto del proceso de extracción de conocimiento (KDD) y sus fases.
  4. Visión general de las técnicas de análisis y de minería de datos.
  5. Conceptos generales sobre la evaluación de los modelos.

Ejercicios

  1. Indique, en su entorno de trabajo, a qué datos podría aplicar técnicas de análisis y qué posibles beneficios se podrían esperar de dicho proceso.
  2. Dentro del dominio arriba indicado mencione las posibles operaciones de integración y limpieza de datos que se deberían aplicar
  3. Dentro del dominio arriba indicado cite ejemplos de posibles reglas de asociación y de clasificación
  4. Dentro del dominio arriba indicado proponga cómo aplicaría los modelos extraídos a mejorar el servicio o a proporcionar nuevas funcionalidades.

Comentarios sobre el tema

Este primer tema es básicamente de introducción, trata conceptos muy generales y los desarrolla en base a ejemplos y varios escenatios (Sección 1.2). La sección 1.3 trata los diferentes tipos de datos. Para los que habéis trabajado con bases de datos no os va a resultar complejo, al final se comentan algunos casos más de datos más complejos. Al final del primer tema del libro se repasa por encima qué es el proceso de KDD (extracción de conocimiento en bases de datos). Veréis que la nomenclatura de este campo tiene muchos solapes, KDD es un término más “académico” y data mining tiene un ámbito más comercial. Análisis Inteligente de datos (IDA) es un nombre más genérico, y es por eso que lo hemos tomado para denotar este módulo.

El primer tema no es muy largo y se hace ameno de leer. Muchos de los conceptos que trata supongo que os serán familiares, para los que esteis un poco más sueltos en el tema os puede valer para organizar un poco las ideas. La parte de aplicaciones de estas técnicas es, por así decirlo, el glosario de referencia sobre los posibles escenarios de uso de estas técnicas (no lo vamos a ver pero os puede ser interesante de leer).

El segundo tema tampoco es muy largo. Consiste en el desarrollo de las fases del proceso KDD, fase de recopilación, limpieza, análisis (minería) de datos y evaluación de resultados. Este tema cubre muy bien el repaso de las diferententes técnicas. Eso es bueno, puesto que no vamos a ver todas, y es bueno tener una visión general, aunque concretemos unas pocas.

Intentad resolverlo lo antes posible y remitidme las soluciones. Si se os plantea alguna duda o dificultad, no dudeis en preguntar.

Os rogaría que las respuestas de este tema (y de los sucesivos) me las mandaseis en texto dentro del mensaje. En el último módulo hemos tenido muchos problemas con los ficheros adjuntos que han hecho que se pierdan algunos mensajes. Si escribís las soluciones aparte, cortar-y-pegar el texto en el mensaje.

 
docencia/cursos/inap/tema1.txt · Última modificación: 2012/10/08 17:58 (editor externo)
 
Recent changes RSS feed Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki