lunes, 15 de noviembre de 2010

Series De Tiempo Y Pronósticos

Una serie de tiempo es un conjunto de datos numéricos que se obtienen en períodos regulares a través del tiempo. Estos datos pueden ser muy variados, generalmente son usados para evaluar el comportamiento de las ventas de una empresa, o para evaluar el comportamiento de los índices de precio de un país o de un tipo de producto pero en general pueden aplicarse a cualquier negocio y /o área. Este comportamiento puede tener características de tipo estacional, o cíclico o siguen alguna tendencia ya sea a la baja, de subida o sin variación.

El comportamiento de las series de tiempo, se debe a 4 componentes: la tendencia, la variación cíclica, la variación estacional y la variación irregular.

La tendencia o tendencia secular, es aquella tendencia a largo plazo sin alteraciones de una serie de tiempo. Esta tendencia pudiera ser de tipo lineal o no lineal, así como también creciente o decreciente y también como una combinación de alguna de las anteriores. Muchos productos, servicios e indicadores económicos siguen un comportamiento de este tipo, y su análisis más generalizado es a través de varios años, teniendo en cuenta los períodos que más se ajustan a cada negocio, pudiendo ser semestrales, trimestrales, mensuales, semanales, etc.

La segunda componente es la variación cíclica en la que a través del período de tiempo analizado se producen ascensos y descensos en varias oportunidades. Este tipo de comportamiento es muy asociado a variaciones de carácter económico.

La tercera componente es la variación estacional, que tiene como característica de variación regular dentro de un año y que a su vez se repite cada año, casos típicos son la producción de algunas frutas y/o comestibles o ventas asociadas a productos como ropa de temporada.

La última componente es la componente irregular que adiciona las características anteriores pero además tiene comportamiento extraños imprevisibles que se dan generalmente en el corto plazo.

La tercera componente es la variación estacional, que tiene como característica de variación regular dentro de un año y que a su vez se repite cada año, casos típicos son la producción de algunas frutas y/o comestibles o ventas asociadas a productos como ropa de temporada.

La última componente es la componente irregular que adiciona las características anteriores pero además tiene comportamiento extraños imprevisibles que se dan generalmente en el corto plazo.

A continuación voy a hacer un ejercicio donde se pronostique el precio de la tortilla en México
 
Año
1990
1995
2000
2005
2010
Precio
4,7
3,4
5,7
6
10
 


Calculo de las Componentes de la Serie de Tiempo

El modelo se la serie de tiempo que trabajaremos es el modelo multiplicativo, es decir, un modelo de la forma:

Y = T ×C × S × I

Donde cada uno de sus componentes lo

identificaremos como:

Y = Valor Original Observado

T = Valor de la Tendencia Secular

S = Valor de la componente Estacional

C = Valor de la componente Cíclica

I = Valor de la componente Irregular



Calculo de la Tendencia Secular:
x
y
x2
xy
1
4,7
1
4,7
2
3,4
4
6,8
3
5,7
9
17,1
4
6
16
24
5
10
25
50
15
29,8
55
102,6
Donde N = 5, la tendencia secular está representada por la recta,
yt = a + b xt
en donde y = t Precio de la tortilla en México
xt =Años
Sustituyendo
a=((829.5)(55)-(15)(102.6))/(5(55)-(15)2)
a= 100/50 =2

b=((5)(102.6)-(15)(29.8))/ (5(55)-(15)2)
b= (66/50)=1.32


y=2 + 1.32x

Con la tendencia secular calculada, podemos predecir el precio de las tortillas para el siguiente lustro, reemplazando en la formula  Xt , por el periodo que se quiera estimar, las estimaciones para los primeros 5 lustros son las siguientes:

Año
1990
1995
2000
2005
2010
2015
Precio
4,7
3,4
5,7
6
10
Precio Secular
3,32
4,64
5,96
7,28
8,6
9,92




Herramientas de Data Mining

En la actualidad existen varias herramientas de data mining, algunas libres, otras no, en esta ocasión hablare de una: RapidMiner.

RapidMiner es un sistema de código abierto líder en el mundo para la minería de datos. Está disponible para el análisis de datos y como un motor de minería de datos. Presente en más de 40 países.

En RapidMiner podrás realizar integración de datos, análisis de datos, informes, repositorio para proceso, manipulación de datos y metadatos.

Cuenta con un tutorial integrado en la aplicación donde te va mostrando paso a paso la manera de utilizarlo, te toma aproximadamente 1 hora verlo, al final conocerás los conceptos básico de RapidMiner.

   
También cuenta con videos en línea que te mostrar una forma muy sencilla de cómo utilizarlo como el siguiente te muestra como importar datos de una hoja de Excel  http://rapid-i.com/videos/rm_5_demo_EN/rm_5_demo_EN.html

RapidMiner te permite realizar procesos importante de data mining es libre y con mucha ayuda para aprenderlo.