REPUBLICA BOLIVARIANA DE
VENEZUELA
UNIVERSIDAD YACAMBU
MAESTRIA DE GERENCIA DE LAS
FINANZAS Y DE LOS NEGOCIOS
Catedra: Seminario
Elaborado por: Lixbeth Rodriguez
Facilitador: Prof. Mary Alonso
Caracas, 05 Febrero de 2007
MODELAJE DE UN DATAWAREHOUSE DE CLIENTES PYME PARA
INDICE
1.- Planteamiento del problema.
3.- Sistematización del Problema
4.- Objetivo General del Problema.
6.- Justificación de la Investigación.
Objetivos y metas del Data Warehouse
CANTV, se enfrenta a un entorno dinámico y cambiante, como
lo es la reciente apertura en el sector de Telecomunicaciones en Venezuela,
sector donde operaba de forma única; lo cual le obliga a utilizar cualquier
información actual e histórica de su negocio medular, con el fin de tomar las
decisiones más oportunas y precisas, asumiendo los cambios de estrategia que
les permita mantener y aumentar su posicionamiento en el mercado de las
telecomunicaciones.
La recopilación de toda la información referente a
Con los sistemas y procesos actualmente utilizados, se
convierte la integración en un proceso complejo, que necesita una dedicación
especial de parte de los usuarios finales que deben verificar de forma manual
la consistencia e integridad de los datos obtenidos, y al mismo tiempo arriesga
oportunidades de negocio por no disponer de información clave en el momento
oportuno.
Los datos críticos de
¿Como se impacta la calidad
de la información al obtener los datos de diferentes fuentes y de forma manual?
¿Con que periodicidad es
requerida la información de Facturación, Recaudación y Tráfico de llamadas por
parte de
¿Que características de los
datos son consideradas para el estudio y análisis de la información?
¿Como se afecta el proceso
de toma de decisiones de
Proponer la implantación de
un sistema de tipo ‘Data Warehouse’ de almacenamiento de la información
estratégica, conformando un ambiente centralizado de datos con herramientas
para optimizar la capacidad de análisis y la toma de decisiones del área en
cuestión.
a) Identificar
los elementos que causan demora en la consolidación de la información de las áreas
de Facturación, Recaudación y Tráfico de llamadas de los clientes del sector
Empresas, para la toma de decisión de
b) Identificar
las fuentes y los caminos para la obtención de los datos críticos de
c)
Identificar cuales son los indicadores
de gestión que utiliza
d) Realizar un
estudio de factibilidad y riesgo de los procesos y de los indicadores a generar
para apoyar la toma de decisiones.
Para que una organización sobreviva
y sea exitosa, debe tener un plan estratégico que guíe sus acciones. El estratega
del negocio normalmente está falto de la información necesaria para detectar
comportamientos dentro del ambiente de negocios, ya que la infraestructura de
la organización no puede proveérsela, porque está basada en sistemas
operacionales no integrados y no sumarizados en los niveles adecuados (por
ejemplo, cuando se estudia el comportamiento del mercado no se analiza lo que
hace un solo cliente, sino el conjunto de clientes). Es por esto que se
necesita otra clase de estructura que soporte estas necesidades, la cual hemos
definido como una aplicación integrada de Data Warehouse.
Un Data Warehouse es parte
de una estructura integral,
La tecnología en la cual se apoya
esta filosofía permite que la visualización de la información se efectúe de
manera flexible, rápida y en los niveles de consolidación requeridos al momento
de la consulta, basada en un conjunto de datos consistentes, confiables y
veraces de la organización.
Dentro del área de apoyo a la toma
de decisiones, ha tomado un auge impactante la filosofía y las soluciones de
Data Warehouse, apoyando e impulsando de forma acelerada el soporte a las
decisiones de impacto en la gestión de las empresas del mercado.
En un Data
Warehouse la información de los sistemas operacionales de la empresa se extrae,
se depura y se almacena, eliminando las discrepancias que comúnmente existen
entre los mismos. De esta forma, la información contenida en el repositorio
logra reflejar una visión de empresa, y es especialmente útil para el análisis
y toma de decisiones a diferentes niveles.
Según otros reconocido autor Michael
Corvey (experto en Oracle)
en su libro “Oracle Data Warehousing”,1.997.
pp.3, un Data Warehouse se puede definir como una colección de información
corporativa derivada directamente de los sistemas operacionales y de algunos
orígenes de datos externos.
Su propósito específico es soportar
la toma de decisiones en un negocio, no las operaciones de un negocio. De esto
es de lo que se trata un Data Warehouse, de ayudar a un negocio a plantearse
preguntas del tipo ... ¿qué pasaría si...?. Las
respuestas a estas preguntas asegurarán que el negocio sea activo, y no
reactivo, lo cual es una necesidad en la actual era de la información.
Las áreas del negocio que se
tomaron para este proyecto fueron: Facturación, Recaudación y Tráfico de
llamadas.
·
Montos, llamadas y minutos facturados.
·
Productos y servicios facturados.
·
Llamadas en suspenso.
·
Ajustes a la facturación.
·
Planes de precios de facturación.
·
Análisis de deuda y monto recaudado.
El Tráfico de llamadas lleva
el control de uso de las redes de Cantv para la realización de las llamadas
desde ó a través de los servicios de CANTV.
Proporciona datos como:
·
Análisis de uso de la red por tráfico CANTV
(voz).
·
Análisis de uso de la red por tráfico de otras
operadoras.
Por último
se evalúan los datos básicos del cliente.
Entre
las actividades a desarrollarse están: el análisis funcional de alto nivel en cada una de los
procesos de Facturación, Recaudación y Ventas de
A
partir del análisis realizado se generará una matriz de ponderación para
definir los procesos más importantes y posteriormente desarrollar las reglas de
negocio asociadas a dicha información. Posterior a la priorización
de funcionalidades se llevará a cabo la factibilidad de las mismas, expresada
en complejidad técnica y riesgo para garantizar su generación oportuna y su
veracidad.
En la actualidad las industrias están a la búsqueda de nuevos
procesos y herramientas que les permitan posible procesar grandes volúmenes de
información analíticamente; para manipular su información actual e histórica,
con el fin de enfrentar la toma decisiones con fundamento. De la misma manera
estas compañías están minadas de grandes cantidades de información sin depurar
debido al enfoque tecnológico adquirido desde sus inicios, ahora, un negocio
que no utilice de forma efectiva la tecnología para manipular y viajar por la
información, no sobrevive. El negocio que logre conseguir acceso y comprensión
de su información tendrá poder, que es equivalente a tener la ventaja
competitiva frente a los otros.
Una de las formas claves para gestionar la información es
usar la tecnología adecuada. Así lo demuestran dos casos de grandes empresas
norteamericanas que destacan este punto y que fueron comentados por Corey y Abbey (2002), cuando se
refirieron a las compañías “Hertz y Victoria’s Secret, quienes
pudieron gestionar los datos de sus empresas y manipular los grandes volúmenes
de información gracias al Data Warehouse” (p.7). Ambas empresas llegaron a ser
líderes en la industria, logrando acercarse más a sus clientes y ofrecerles un
servicio de alto nivel. Pero esto solo se logra cuando se tiene información
acerca de los clientes, la necesaria para batir a la competencia.
Corey y Abbey (2002), “La velocidad con que Hertz,
responde a sus clientes, hace que la seleccionen sin dudar, cuando se trata de
obtener el servicio de alquiler de carros, ya que ellos garantizan rapidez,
seguridad y conocimiento en las gestiones que llevan a cabo con el cliente.”
(p.7).
Estos ejemplos demuestran que cuando los negocios hacen
buen uso de la información y logran sacar de ella todo lo que se pueda, pueden
entender mejor a los clientes y en consecuencia pueden ocupar una mejor
posición en el mercado. De esto precisamente se trata el Data Warehouse, de
poner los datos de una corporación en un sistema que se preste para la toma de
decisiones, poder hacer análisis basados en la data actual e histórica.
Para conocer otras experiencias realizadas y los resultados
obtenidos a través de trabajos de investigación referentes al tópico en estudio
que pudieran dar una orientación y apoyo al proyecto, se analizaron en detalle
tres tesis:
Morales (1996) realizó una investigación titulada “Creación
de un modelo conceptual de un Data Warehouse para el Banco Mercantil e
implementación departamental”, con el objetivo de diseñar e implementar un Data
Warehouse para una empresa del sector financiero. La investigación fue un
trabajo de campo, de tipo descriptiva, la cual consideró una población de 15
personas equivalentes al 100%. La técnica de recolección de datos utilizada fue
la entrevista y el cuestionario. La investigación arrojó como resultado la creación
de un sistema que almacena la información tanto histórica como actual y que
ofrece un análisis de estos datos en forma seleccionada, integrada organizada e
historiada. El sistema se implementó con base a un estudio sobre las
estrategias de diseño e implementación de Data Warehouse. El sistema se basó en
la implementación de dos fases: construcción y análisis.
El problema planteado en esta tesis radica en que existe
una descentralización de los datos requeridos por las aplicaciones de los
niveles estratégicos de la organización, trayendo como consecuencia que las
consultas en línea realizadas por los ejecutivos resulten muy lentas y
engorrosas, ocasionando también una disminución del tiempo de respuesta de la
máquina central, en donde se llevan a cabo continuamente los procesos
operacionales.
En el mismo orden se analizó otra tesis elaborada por Gómez
y Ochoa (1998), quien realizó una investigación titulada “Conceptualización
del Data Warehouse, análisis, diseño e implementación de un prototipo”, realizado
en
La metodología utilizada en esta investigación fue una
fusión entre la propuesta por el Sr. William Inmon
(1992) en su libro Building The Data Warehouse, para el análisis de modelos de
datos de los sistemas origen y de la metodología propuesta por la empresa SAS
llamada SAS/WA “System Management Methodology/Data Warehousing". Los resultados obtenidos permitieron a los usuarios entre
otros, lo siguiente:
1. Disponer de la información integrada sobre una variable,
logrando una visión más amplia del fenómeno analizado.
2. Validar los resultados obtenidos en un subsistema al
cruzarlos con otras variables e indicadores asociados.
3. Permitir al investigador el planteamiento de nuevas hipótesis
sobre el problema analizado.
4. Acceder a un nivel superior en el manejo de la información,
contribuyendo a mejorar el proceso de toma de decisiones y la planificación de
los usuarios.
5. Permitir una interrelación armónica entre distintos
proyectos de producción estadística que administra la oficina central.
Esta tesis permitió
conocer la metodología de sistemas empleada por el autor para el desarrollo de
las diferentes etapas que conducen a la consolidación de un Data Warehouse.
La tercera tesis fue realizada en México Ydirín (2004) quien realizó una investigación sobre
“Construcción de un Data Warehouse de datos del medio ambiente para la toma de
decisiones: aplicación a los datos hidrológicos” y está disponible en
Internet en la página: http://140.148.3.250/u_dl_a/servlet/mx.udlap.
ict.tales.html., que pertenece a
En otro orden, también se debe considerar el aporte
significativo que se obtuvo de la información consultada en Internet, tanto en
universidades como de empresas consultoras en Data Warehouse, que tienen una
gran cantidad de documentación y escritos relacionados con su diseño e
implementación, tales como: http://www.techguide.com/
y http: //www.datawarehouse.com/, en cuyo sites se
puede además encontrar los autores y teorías discutidas sobre el tema en
cuestión.
Finalmente, las lecturas realizadas a los textos de quien
fuera la primera persona que acuñó el término Data Warehouse y quien ha
desarrollado muchos libros explicativos sobre técnicas y herramientas como Data
Mining, W.H.Inmon. Y que
desde 1990 viene trabajando con el fenómeno del Data Warehouse, fue la base
fundamental para entender a través de ejemplos citados, los aspectos
fundamentales del Data Warehouse y otras técnicas.
Un Data Warehouse es un repositorio de datos provenientes
de diversas fuentes de la empresa, que incluye tanto los datos actuales como
históricos en un ambiente integrado, para satisfacer las necesidades de
consultas, reportes analíticos y soportes de toma de decisiones de los usuarios
finales. No se puede interpretar como un software ó hardware, sino como un conjunto
de componentes y procesos que integran una arquitectura diseñados para el
almacenamiento de información y para dar soporte a los procesos de acción /
decisión.
El concepto universalmente aceptado de un Data Warehouse
fue definido por Bill Inmon
en los años 1.990, y este dice que: “Un Data Warehouse es una colección de
datos integrados, no volátiles, orientados a tema y cambiante en el tiempo, que
son usados para la toma de decisiones estratégicas” (p.7).
En esta definición el autor recalca la gran ventaja que el
Data Warehouse tiene sobre los sistemas operacionales ó “Legacy”,
que es la de hacer útil los datos a la gestión corporativa y la de garantizar
su permanencia en el tiempo, permitiendo que toda la información pueda ser
utilizada cuando sea requerida por los usuarios. Así mismo, cuando explica que
“...es una colección de datos integrados...”, se refiere a que se puede
explotar esta información obteniéndose sumarizaciones
y consolidaciones de la información de acuerdo a una característica única. Otra
ventaja que representa una gran diferencia con respecto a las otras filosofías
de sistemas, es que la información se clasifica en base a los temas que son de
interés para la empresa. Por ejemplo, en el caso de Cantv, los sistemas operacionales manejan la figura
de Abonado ó servicio compuesto de un
número para la central, área y número de teléfono, para el Data Warehouse se
manejaría la figura del cliente (Cédula de Identidad ó Rif),
con todos sus servicios asociados.
Podemos concluir que el Data Warehouse surgió de la
necesidad de disponer un acceso sencillo e inmediato a determinada información
de negocio estructurada y de calidad para ser utilizada por los procesos de
toma decisiones.
Figura 1. Esquema de un Data
Warehouse
En un Data Warehouse la información de los sistemas
operacionales de la empresa se extrae, se depura y se almacena, eliminando las
discrepancias que comúnmente existen entre los mismos. De esta forma, la información
contenida en el repositorio logra reflejar una visión de empresa, y es
especialmente útil para el análisis y toma de decisiones a diferentes niveles.
La diferencia
existente entre un sistema operacional y un Data Warehouse es la siguiente:
|
Base de Datos Operacional |
Data Warehouse |
|
Datos Operacionales |
Datos del negocio para
Información |
|
Orientado a la aplicación |
Orientado al sujeto |
|
Actual |
Actual + histórico |
|
Detallada |
Detallada + más resumida |
|
Cambia continuamente |
Estable |
Figura 2 Comparación entre Base de Datos Operacional
vs. DW
El ingreso de datos en el Data Warehouse viene desde el
ambiente operacional en casi todos los casos. El DW es siempre un almacén de
datos transformados y separados físicamente de la aplicación donde se
encontraron los datos en el ambiente operacional.
Un DW tiene como objetivo la centralización, integración y organización
de la información de la organización.
Un DW ofrece funcionalidades como:
1. Integra bases de datos heterogéneas y de orígenes
diferentes, internas y externas en una sola base de datos ó repositorio.
2. Ejecuta consultas complejas de la información, no
predefinidas, con diferentes niveles de agrupamiento, totalizando datos y
permitiendo su visualización de forma gráfica.
3. Tiene adaptabilidad ante los cambios dados por las
necesidades del usuario.
4. Analiza los problemas en términos de diferentes dimensiones
(por ejemplo, dimensión tiempo).
5. Controla la calidad de los datos para asegurar
consistencia, homogeneidad y relevancia.
6. Tiene la posibilidad de combinar y formular nuevos datos a
partir de los datos existentes.
7. Provee información histórica, que no necesariamente está en
los sistemas operacionales (ya que se puede mantener solo cierta historia de
las transacciones en los mismos).
8. Incorpora datos externos que complementan los análisis del
negocio, tales como lo es la información de la competencia.
9. Su diseño es fácilmente aceptado por todos los usuarios del
DW: lo importante no es construir una solución usando tecnología de punta, sino
reducir los riesgos de la no-confiabilidad de los datos, facilitar la
manipulación de los mismos y suplir las necesidades de información tan pronto
como sea necesario.
A
continuación se definen los términos más importantes:
Un Data Warehouse es un
repositorio de datos de la organización, cuyo objetivo es proveer, a los
niveles estratégicos de la empresa, información para el análisis de la gestión
y para la toma de decisiones. Dicho repositorio se alimenta de los sistemas
operacionales de la organización, del Operational Data Store
(cuyo concepto será explicado más adelante), de información de la empresa
llevada manualmente y de información externa a la misma.
Las soluciones de Data Warehouse
ofrecen en general las siguientes ventajas:
1.· Centralización y consistencia de la información útil
para toda la corporación.
2.· Acceso a la data corporativa y organizacional en forma
rápida y clasificada en diversas dimensiones y en diferentes niveles de
detalle.
3.· Posibilidad de combinar y formular nuevos datos a
partir de los datos existentes.
4.· Proveer,
además de datos, un conjunto de herramientas para consultar, elaborar reportes,
analizar y presentar información.
5.· Proveer información histórica, que no necesariamente
está en los sistemas operacionales (ya que se puede mantener solo cierta
historia de las transacciones en los mismos).
6.· Incorporar datos externos que complementan los
análisis del negocio, tales como lo es la información de la competencia.
Un Operational Data
Store (ODS) es un repositorio de datos de la organización, cuyo
objetivo es proveer, a los niveles tácticos de la empresa, información
integrada para el análisis operacional. Dicho repositorio se alimenta de los
sistemas operacionales de la organización, y puede ser enriquecido con
información externa a la misma.
Un Operational
Data Store puede ser definido como una arquitectura con las siguientes
características, algunas iguales al Data Warehouse:
·
Orientado al sujeto, el ODS es diseñado y organizado alrededor de los
sujetos principales de la corporación, como el Cliente, el Producto, etc.
·
Integrado, a medida que los datos pasan de los sistemas operacionales al ODS, los
datos son transformados en un todo consistente y unificado, dando una visión
corporativa unificada.
·
Volátil, los datos en un ODS son actualizados en cada carga.
·
Evaluado actual, los datos en un ODS típicamente son actuales, en ningún caso más viejos que unos pocos días, y su historia es de 3 meses en
el caso de CANTV.
En resumen, los
datos en un ODS sirven más para la comunidad operacional, y de allí surge la
necesidad de que sean detallados. A medida que los datos sean un insumo para
niveles más altos de la organización, la necesidad es que los mismos sean más
agregados, y surge el requerimiento de tenerlos en un Data Warehouse.