martes, 26 de octubre de 2010

Reseña Articulo Dra. Elisa Schaeffer

En este ocasión voy a escribir sobre el articulo Graph clustering de la Dra. Satu Elisa Schaffer, el cual fue publicado en el 2007.

El articulo trata sobre definiciones y métodos de  agrupación de grafos, las definiciones de que una agrupamiento en un grafo y la medidas de calidad de este. Nosotros mostramos un algoritmo mundial para producir un agrupamiento  de vértices en un grafo, después de lo cual se discute la tarea de identificar un agrupamiento de vértices de una semilla  específica por computación local.
Cualquier información no uniforme contiene una estructura subyacente de heterogeneidad en la información. El proceso se identificar esta estructura en términos de agrupamiento de elemento  de datos es llamada clustering, también llamada información clasificada. El grupo resultante es llamado clusters. El grupo es normalmente definido por una medición definida por los datos.
Los grafos son estructuras formadas por una serie de vértices (también llamados nodos) y la conexión entre ellos son los lados o bordes. El agrupamiento de grafos es la tarea de agrupar los vértices de un grafo considerando la estructura de los bordes del grafo de manera que debería de haber muchos bordes dentro del agrupamiento y relativamente pocos entre el agrupamiento
Teoría de Grafos
Un grafo G es un par de conjuntos G = (V, E). V es el conjunto de vértices y  el numero de vértices n=|V| es el orden de la grafica. El conjunto E contiene los bordes del  grafo.  En un grafo no dirigido, cada arista es un par no ordenado {v, w}. En un grafo dirigido (también llama dígrafo en la literatura mucho), los bordes son pares ordenados. Los vértices v y w son llamados los extremos de los bordes. La borde cuenta | E | = m es el tamaño del gráfico. En un grafo ponderado, una función de peso! : E! R se define que asigna un peso en cada borde. Un grafo es plano si se puede dibujar en un plano sin que ninguno de los bordes de cruce.
Es común que en aplicaciones, los grafos no son simples, ligeros y sin dirección. Si más de un bordes está permitido entres dos vértices, en lugar de una adyacencia binaria la matriz se acostumbra a utilizar una matriz que determina para cada par de vértices cuántas aristas que comparten. Gráficos con tales multiplicidades borde se llaman multígrafos.
Aplicaciones de graph clustering.
·         Transformación de Datos
·         Redes de información y uso de la información
·         Sistemas de Base de Datos
·         Redes Biológica y sociológica
·         Otras Aplicaciones
Problemas y futuro
Los 3 principales problemas de graph clustering son:
·         Selección de parámetros: ¿Cómo determina el usuario los valores de los parámetros para dar una entrada para un algoritmo de clusterig?
·          Escalabilidad: ¿cómo el consumo de tiempo de ejecución y la memoria del algoritmo se comportan para los gráficos de entrada masiva?
·         Evaluación: cómo decidir cuál de varios agrupamientos es el mejor.

Los fundamentos teóricos de graph clustering nos están totalmente explorados; pero se no se espera que exista una sola respuesta para las preguntas de graph clustering.

lunes, 4 de octubre de 2010

Data warehousing: architecture and implementation

En esta ocasión les hablare de un libro sobre Data Warehouse, le daré una breve explicación de que podrán encontrar en él y como está estructurado.

Data warehousing: architecture and implementation

Es un libro para profesionales de TI que han trabajado en  planear, administrar, diseñar, implementar, soportar o mantener el data warehouse.
Lo que encontraras son en un principio los conceptos básicos de arquitectura y almacenamiento de datos.
En la segunda sección encontraras las 3 llaves que cualquier que tiene iniciativa de implementar un proyecto de almacenamiento de datos debera tener presente. Estas tres llaves son: el patrocinador del proyecto, el jefe de sistemas y el administrador de proyectos.
En la siguiente sección del libro encontraras un proceso y las guias necesarias para planear e implementar un data warehouse (almacenamiento de datos).
En la cuarta parte encontraras aspectos sobre  tecnología de data warehouse y en la última sección encontraras un pronóstico de los data warehouse para el futuro.
Algunos ejemplos de conceptos que encontraras en el libro son:
Base de Datos de Operaciones.- es una colección de base de datos integradas para soportar el monitoreo de las operaciones
Data Warehouse.- El concepto de almacenamiento de datos desarrollado por los profesionales de TI incrementa cada vez más la diferencia entre las bases de datos necesarias para las transacciones y las bases de datos necesarias para el análisis de datos.

Data warehousing: architecture and implementation

 Mark Humphries, Michael W. Hawkins, Michelle C. Dy

Tema del Proyecto

El proyecto en el cual voy a trabajar es en un sistema para el apoyo de la toma de decisiones de la mesa de ayuda de la Dirección General de Informática de la UANL.
La mesa de ayuda lleva el nombre de CIATI (Centro Institucional de Atención en Tecnología de Información) y es la encargada de recibir las solicitudes de servicios relacionados con informática de la UANL, principalmente recibe las solicitudes de los departamentos centrales de la universidad,  de la facultades y preparatorias lo hace a través de los responsables de informática de cada escuela.
El CIATI recibe aproximadamente 60 solicitudes diarias, las cuales son registradas por 3 operadores y un supervisor, estas solicitudes llegan al CIATI mediante varios medios principalmente teléfono y correo, también llegan por medio de oficio, mensajería instantánea, personalmente o por el personal de seguridad fuera del horario de establecido (8:00 am a 7:00 pm).
Una vez que la solicitudes son recibidas y registradas por el CIATI están son canalizadas a diferentes áreas según sea el tipo de solicitud, así bien también son clasificadas y se les asigna una prioridad y un nivel de impacto.
Uno de los indicadores de calidad de la DGI es la satisfacción de usuario y las solicitudes de servicio es una forma de reflejar esa satisfacción por lo cual el análisis de la información nos ayudara a tomar las mejores decisiones respecto a los servicios que se ofrecen en la DGI.