Buenas,
ayer comenté el lanzamiendo de una serie de Addins para Office 2007 que permiten trabajar con la minería de datos. Hoy voy a demostrar con un pequeño ejemplo como se pueden utilizar los mismos.
Una vez instalado los Addins para minería de datos para Office 2007, es necesario configurar los mismos. Si lanzamos la aplicacion Gettting Started del menú All Programs - Microsoft SQL Server 2005 DM Add-ins - Getting Started; veremos que nos aparece el siguiente wizard:

El mismo nos permite seleccionar la instancia del servidor que utilizaremos en nuestro startup. Una vez finalizado este paso, deberemos configurar y crear una nueva instancia de bases de datos de Data Mining que será la DB donde almacenaremos nuestras proyecciones y nuestro trabajo desde nuestro cliente Office 2007.
Para esto, también utilizamos un wizard que nos lleva por los siguientes pasos.
1. Welcome
2. Definir servidor de base de datos

3. Creación de una nueva base de datos o utilización de una DB ya existente

4. Seteo de permisos de acceso

5. Proceso completo !!!

Una vez finalizada la configuración de nuestro acceso a una base de datos de Data Mining; podremos comenzar a trabajar y utilizar las herramientas de Data Mining desde el propio Microsoft Excel 2007. En este momento podemos lanzar un archivo de ejemplo DMAddins_SampleData.xlsx (C:\Program Files\Microsoft SQL Server 2005 DM Add-Ins\DMAddins_SampleData.xlsx) y dentro del mismo probar una feature de Data Mining: Estimate Data Wizard.
Esta herramienta permite crear un modelo de estimación basado en datos existentes de una tabla del Excel, de un rango de Excel, o de una consulta de Analysis Services 2005. El modelo extrae patrones de datos y utiliza la información para predecir los factores que afectan valores continuos. Por ejemplo, es posible analizar los factores que se relacionan con los valores numéricos tales como tipos de dato de moneda o de fechas. Si la columa sobre la que queremos aplicar la predicción, por ejemplo, esta relacionada con la cantidad de coches por cliente, es posible analizar factores tales como la cantidad de personas solteras o casadas que tienen coche, el sexo de estas personas y la cantidad de coches por sexo, etc.
El asistente de creación, utiliza el algoritmo de árboles de la decisión de Microsoft, y a partir del mismo crea los gráficos que representan las dependencias y reglas en ventana interactiva.
1. Dentro de la Ribbon de Excel, seleccionamos el Tab Data Mining y hacemos click en el boton Estimate.

2. A continuación debemos definir la columna sobre la que queremos estimar los datos y las columnas que servirán como "input Data" para realizar el análisis de estimación. En este caso, trabajaremos sobre la columna "cars" que determina la cantidad de coches que posee una persona o un cliente

3. Una vez definidos los parámetros de entrada, podremos comenzar a generar y analizar los datos. Para esto creamos una nueva tabla (Table2 Structure_1) basada en modelo de decisión.

4. Finalmente, una vez finalizado el proceso de generación de datos, podremos ver los mismos en 2 modos gráficos:
- Árbol de decisión

- Red de dependencias

Como podemos ver las capacidades de mineria de datos son realmente impresionantes y además, a partir de este momento podemos tenerlas incorporadas en Excel 2007. Existen varios modelos de trabajo, además del Estimate Data; y cada uno se puede aplicar en situaciones diferentes. De a poco, las capacidades de Business Intelligence se acercan más a los usuarios finales, ya que todo el mundo sabe como utilizar y representar datos en Excel. Y ahora lo único que necesitamos, es que estos usuarios comiencen a conocer estas nuevas funcionalidades y a explotarlas !!!
Saludos
El Bruno
PD: se que no tiene nada que ver con la minería de datos, ni con Analysis Services, ni siquiera con la informática (aunq desp de ver la audiencia que tengo tal vez si); pero no puedo dejar pasar este EXCELENTE REFRIGERADOR LANZADOR DE CERVEZAS. Ver para creer http://www.metacafe.com/watch/445498/robotic_beer_launching_refrigerator/