Minería de datos

La sobredosis de información por el momento es demasiada….aclararé ciertos términos que se escuchan en el aire…

minería de datos ( data mining) : es la extracción no trivial de información implícita, previamente desconocida y potencialmente útil, a partir de datos. También se define como el análisis y descubrimiento de conocimiento a partir de datos.
Ella hace uso de todas las técnicas que puedan aportar información útil, es un campo multidisciplinar que cubre numerosas áreas y se aborda desde múltiples puntos de vista, como la estadística, la informática (cálculo automático) o la ingeniería.
Actualmente está cobrando una importancia cada vez mayor la minería de datos desestructurados como es la información contenida en ficheros de texto (text mining), en Internet (web mining), etc.
Una aplicación especial de la minería de datos es la minería web ( web mining) que consiste en extraer información y conocimiento útil específicamente de la actividad de un sitio web: análisis de tráfico (visitas y visitantes), contenidos más accedidos, procedencia, tipo de usuarios, navegadores y sistemas operativos, reglas de asociación entre páginas (tasa de conversión)…

Fases de un proyecto de minería de datos :

1. Selección y preproceso de datos

En esta etapa e filtran los datos, se obtienen muestras de los mismos , o se reduce el número de valores posibles (mediante redondeo, clustering…).

2. Selección de variables

La selección de características reduce el tamaño de los datos eligiendo las variables más influyentes en el problema. Los métodos pson básicamente dos:

  • Basados en la elección de los mejores atributos del problema
  • Otros que buscan variables independientes mediante tests de sensibilidad, algoritmos de distancia o heurísticos.  

 3. Extracción de conocimiento

También pueden usarse varias técnicas a la vez para generar distintos modelos, generalmente cada técnica obliga a un preproceso diferente.

4. Interpretación y evaluación

De haber obtenido varios modelos mediante el uso de distintas técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema.

Enlace original
http://www.daedalus.es/mineria-de-datos/

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s