El Bruno

Blog dedicado a las experiencias del desarrollo con tecnologías Microsoft.
BI - Data Mining, ahora desde Excel 2007 !!!

Buenas,

ayer comenté el lanzamiendo de una serie de Addins para Office 2007 que permiten trabajar con la minería de datos. Hoy voy a demostrar con un pequeño ejemplo como se pueden utilizar los mismos.

Una vez instalado los Addins para minería de datos para Office 2007, es necesario configurar los mismos. Si lanzamos la aplicacion Gettting Started del menú All Programs - Microsoft SQL Server 2005 DM Add-ins - Getting Started; veremos que nos aparece el siguiente wizard:

 

 

El mismo nos permite seleccionar la instancia del servidor que utilizaremos en nuestro startup. Una vez finalizado este paso, deberemos configurar y crear una nueva instancia de bases de datos de Data Mining que será la DB donde almacenaremos nuestras proyecciones y nuestro trabajo desde nuestro cliente Office 2007.

Para esto, también utilizamos un wizard que nos lleva por los siguientes pasos.

1. Welcome

 

2. Definir servidor de base de datos

 

3. Creación de una nueva base de datos o utilización de una DB ya existente

 

4. Seteo de permisos de acceso

 

5. Proceso completo !!!

 

 

Una vez finalizada la configuración de nuestro acceso a una base de datos de Data Mining; podremos comenzar a trabajar y utilizar las herramientas de Data Mining desde el propio Microsoft Excel 2007. En este momento podemos lanzar un archivo de ejemplo DMAddins_SampleData.xlsx (C:\Program Files\Microsoft SQL Server 2005 DM Add-Ins\DMAddins_SampleData.xlsx) y dentro del mismo probar una feature de Data Mining: Estimate Data Wizard.

Esta herramienta permite crear un modelo de estimación basado en datos existentes de una tabla del Excel, de un rango de Excel, o de una consulta de Analysis Services 2005. El modelo extrae patrones de datos y utiliza la información para predecir los factores que afectan valores continuos. Por ejemplo, es posible analizar los factores que se relacionan con los valores numéricos tales como tipos de dato de moneda o de fechas. Si la columa sobre la que queremos aplicar la predicción, por ejemplo, esta relacionada con la cantidad de coches por cliente, es posible analizar factores tales como la cantidad de personas solteras o casadas que tienen coche, el sexo de estas personas y la cantidad de coches por sexo, etc.

El asistente de creación, utiliza el algoritmo de árboles de la decisión de Microsoft, y a partir del mismo crea los gráficos que representan las dependencias y reglas en ventana interactiva.

1. Dentro de la Ribbon de Excel, seleccionamos el Tab Data Mining y hacemos click en el boton Estimate.

 

2. A continuación debemos definir la columna sobre la que queremos estimar los datos y las columnas que servirán como "input Data" para realizar el análisis de estimación. En este caso, trabajaremos sobre la columna "cars" que determina la cantidad de coches que posee una persona o un cliente

 

3. Una vez definidos los parámetros de entrada, podremos comenzar a generar y analizar los datos. Para esto creamos una nueva tabla (Table2 Structure_1) basada en modelo de decisión.

 

4. Finalmente, una vez finalizado el proceso de generación de datos, podremos ver los mismos en 2 modos gráficos:

  - Árbol de decisión

   

  - Red de dependencias

   

 

Como podemos ver las capacidades de mineria de datos son realmente impresionantes y además, a partir de este momento podemos tenerlas incorporadas en Excel 2007. Existen varios modelos de trabajo, además del Estimate Data; y cada uno se puede aplicar en situaciones diferentes. De a poco, las capacidades de Business Intelligence se acercan más a los usuarios finales, ya que todo el mundo sabe como utilizar y representar datos en Excel. Y ahora lo único que necesitamos, es que estos usuarios comiencen a conocer estas nuevas funcionalidades y a explotarlas !!!

 

Saludos

El Bruno

 

 

PD: se que no tiene nada que ver con la minería de datos, ni con Analysis Services, ni siquiera con la informática (aunq desp de ver la audiencia que tengo tal vez si); pero no puedo dejar pasar este EXCELENTE REFRIGERADOR LANZADOR DE CERVEZAS. Ver para creer http://www.metacafe.com/watch/445498/robotic_beer_launching_refrigerator/

Published lunes, 26 de febrero de 2007 15:38 by elbruno

Comments

# re: BI - Data Mining, ahora desde Excel 2007 !!!@ jueves, 31 de julio de 2008 10:31

Hola Bruno:

He creado hace un año una consultora dedicada a la planificación y dirección de proyectos estratégicos. Estamos ahora embarcados en un proyecto de análisis estadístico sobre un sector económico a través de encuestas. Deseamos hacer minería de datos para ver proyecciones y tendencias. He intentado configurar los complementos de minería de datos para excel pero no sé como avanzar en la definición del servidor de base de datos. ¿Tiene que ser de SQL? Nosotros tenemos un servidor en la empresa -IBM system 3200-, ¿Puedo definir el programa contra mi servidor?

Muchas gracias por tu tiempo y enhorabuena por tu blog.

Ildefonso.

Ildefonso de la Campa Montenegro

# re: BI - Data Mining, ahora desde Excel 2007 !!!@ jueves, 31 de julio de 2008 10:36

Hola Bruno

A la hora de definir el servidor:

1. ¿Tiene que ser un servidor sql?

2. ¿Puedo definir como servidor el mío: IBM system x3200?

3. ¿Cómo coño lo hago?

llevo cuatro días peleándome con la configuración de los complementos y nada.

Gracias y enhorabuena por el blog.

Ildefonso

Ildefonso de la Campa Montenegro