REPUBLICA BOLIVARIANA DE
VENEZUELA
UNIVERSIDAD YACAMBU
MAESTRIA DE GERENCIA DE LAS
FINANZAS Y DE LOS NEGOCIOS
Catedra: Seminario
Elaborado por: Lixbeth Rodriguez
Facilitador: Prof. Mary Alonso
Caracas, 05 Febrero de 2007
MODELAJE DE UN DATAWAREHOUSE DE CLIENTES PYME PARA
INDICE
1.- Planteamiento del
problema.
3.- Sistematización del
Problema
4.- Objetivo General del
Problema.
6.- Justificación de la
Investigación
Objetivos y ventajas del Data Warehouse
Definición de un Operational Data Store
Objetivos y Ventajas de un Operational Data Store
Procesos que componen un Data Warehouse
Procesos que componen un Operational Data Store
CANTV, se enfrenta a un entorno dinámico y cambiante, como
lo es la reciente apertura en el sector de Telecomunicaciones en Venezuela,
sector donde operaba de forma única; lo cual le obliga a utilizar cualquier
información actual e histórica de su negocio medular, con el fin de tomar las
decisiones más oportunas y precisas, asumiendo los cambios de estrategia que
les permita mantener y aumentar su posicionamiento en el mercado de las
telecomunicaciones.
La recopilación de toda la información referente a
Con los sistemas y procesos actualmente utilizados, se
convierte la integración en un proceso complejo, que necesita una dedicación
especial de parte de los usuarios finales que deben verificar de forma manual
la consistencia e integridad de los datos obtenidos, y al mismo tiempo arriesga
oportunidades de negocio por no disponer de información clave en el momento
oportuno.
Los datos críticos de
¿Como
se impacta la calidad de la información al obtener los datos de diferentes
fuentes y de forma manual?
¿Con
que periodicidad es requerida la información de Facturación, Recaudación y
Tráfico de llamadas por parte de
¿Que
características de los datos son consideradas para el estudio y análisis de la
información?
¿Como
se afecta el proceso de toma de decisiones de
Proponer la implantación de un sistema de tipo ‘Data
Warehouse’ de almacenamiento de la información estratégica, conformando un
ambiente centralizado de datos con herramientas para optimizar la capacidad de
análisis y la toma de decisiones del área en cuestión.
a) Identificar
los elementos que causan demora en la consolidación de la información de las
áreas de Facturación, Recaudación y Tráfico de llamadas de los clientes del
sector Empresas, para la toma de decisión de
b) Identificar
las fuentes y los caminos para la obtención de los datos críticos de
c)
Identificar cuales son los indicadores
de gestión que utiliza
d) Realizar un
estudio de factibilidad y riesgo de los procesos y de los indicadores a generar
para apoyar la toma de decisiones.
Para que una organización sobreviva
y sea exitosa, debe tener un plan estratégico que guíe sus acciones. El
estratega del negocio normalmente está falto de la información necesaria para
detectar comportamientos dentro del ambiente de negocios, ya que la infraestructura
de la organización no puede proveérsela, porque está basada en sistemas
operacionales no integrados y no sumarizados en los niveles adecuados (por
ejemplo, cuando se estudia el comportamiento del mercado no se analiza lo que
hace un solo cliente, sino el conjunto de clientes). Es por esto que se
necesita otra clase de estructura que soporte estas necesidades, la cual hemos
definido como una aplicación integrada de Data Warehouse.
Un Data Warehouse es parte
de una estructura integral,
La tecnología en la cual se apoya
esta filosofía permite que la visualización de la información se efectúe de
manera flexible, rápida y en los niveles de consolidación requeridos al momento
de la consulta, basada en un conjunto de datos consistentes, confiables y
veraces de la organización.
Dentro del área de apoyo a la toma
de decisiones, ha tomado un auge impactante la filosofía y las soluciones de
Data Warehouse, apoyando e impulsando de forma acelerada el soporte a las
decisiones de impacto en la gestión de las empresas del mercado.
En un Data
Warehouse la información de los sistemas operacionales de la empresa se extrae,
se depura y se almacena, eliminando las discrepancias que comúnmente existen
entre los mismos. De esta forma, la información contenida en el repositorio
logra reflejar una visión de empresa, y es especialmente útil para el análisis
y toma de decisiones a diferentes niveles.
Según otros reconocido autor Michael
Corvey (experto en Oracle)
en su libro “Oracle Data Warehousing”,1.997.
pp.3, un Data Warehouse se puede definir como una colección de información
corporativa derivada directamente de los sistemas operacionales y de algunos
orígenes de datos externos.
Su propósito específico es soportar
la toma de decisiones en un negocio, no las operaciones de un negocio. De esto
es de lo que se trata un Data Warehouse, de ayudar a un negocio a plantearse
preguntas del tipo ... ¿qué pasaría si...?. Las
respuestas a estas preguntas asegurarán que el negocio sea activo, y no
reactivo, lo cual es una necesidad en la actual era de la información.
Las áreas del negocio que se
tomaron para este proyecto fueron: Facturación, Recaudación y Tráfico de
llamadas.
·
Montos, llamadas y minutos facturados.
·
Productos y servicios facturados.
·
Llamadas en suspenso.
·
Ajustes a la facturación.
·
Planes de precios de facturación.
·
Análisis de deuda y monto recaudado.
El Tráfico de llamadas lleva
el control de uso de las redes de Cantv para la realización de las llamadas
desde ó a través de los servicios de CANTV.
Proporciona datos como:
·
Análisis de uso de la red por tráfico CANTV (voz).
·
Análisis de uso de la red por tráfico de otras operadoras.
Por último
se evalúan los datos básicos del cliente.
Entre
las actividades a desarrollarse están: el análisis funcional de alto nivel en cada una de los
procesos de Facturación, Recaudación y Ventas de
A
partir del análisis realizado se generará una matriz de ponderación para
definir los procesos más importantes y posteriormente desarrollar las reglas de
negocio asociadas a dicha información. Posterior a la
priorización de funcionalidades se llevará a cabo la factibilidad de las
mismas, expresada en complejidad técnica y riesgo para garantizar su generación
oportuna y su veracidad.
En la actualidad las industrias están a la búsqueda de
nuevos procesos y herramientas que les permitan posible procesar grandes
volúmenes de información analíticamente; para manipular su información actual e
histórica, con el fin de enfrentar la toma decisiones con fundamento. De la
misma manera estas compañías están minadas de grandes cantidades de información
sin depurar debido al enfoque tecnológico adquirido desde sus inicios, ahora,
un negocio que no utilice de forma efectiva la tecnología para manipular y viajar
por la información, no sobrevive. El negocio que logre conseguir acceso y
comprensión de su información tendrá poder, que es equivalente a tener la
ventaja competitiva frente a los otros.
Una de las formas claves para gestionar la información es
usar la tecnología adecuada. Así lo demuestran dos casos de grandes empresas
norteamericanas que destacan este punto y que fueron comentados por Corey y Abbey (2002), cuando se
refirieron a las compañías “Hertz y Victoria’s Secret, quienes
pudieron gestionar los datos de sus empresas y manipular los grandes volúmenes
de información gracias al Data Warehouse” (p.7). Ambas empresas llegaron a ser
líderes en la industria, logrando acercarse más a sus clientes y ofrecerles un
servicio de alto nivel. Pero esto solo se logra cuando se tiene información
acerca de los clientes, la necesaria para batir a la competencia.
Corey y Abbey (2002), “La velocidad con que Hertz,
responde a sus clientes, hace que la seleccionen sin dudar, cuando se trata de obtener
el servicio de alquiler de carros, ya que ellos garantizan rapidez, seguridad y
conocimiento en las gestiones que llevan a cabo con el cliente.” (p.7).
Estos ejemplos demuestran que cuando los negocios hacen
buen uso de la información y logran sacar de ella todo lo que se pueda, pueden
entender mejor a los clientes y en consecuencia pueden ocupar una mejor
posición en el mercado. De esto precisamente se trata el Data Warehouse, de
poner los datos de una corporación en un sistema que se preste para la toma de
decisiones, poder hacer análisis basados en la data actual e histórica.
Para conocer otras experiencias realizadas y los resultados
obtenidos a través de trabajos de investigación referentes al tópico en estudio
que pudieran dar una orientación y apoyo al proyecto, se analizaron en detalle
tres tesis:
Morales (1996) realizó una investigación titulada “Creación
de un modelo conceptual de un Data Warehouse para el Banco Mercantil e
implementación departamental”, con el objetivo de diseñar e implementar un Data
Warehouse para una empresa del sector financiero. La investigación fue un
trabajo de campo, de tipo descriptiva, la cual consideró una población de 15
personas equivalentes al 100%. La técnica de recolección de datos utilizada fue
la entrevista y el cuestionario. La investigación arrojó como resultado la
creación de un sistema que almacena la información tanto histórica como actual
y que ofrece un análisis de estos datos en forma seleccionada, integrada
organizada e historiada. El sistema se implementó con base a un estudio sobre
las estrategias de diseño e implementación de Data Warehouse. El sistema se
basó en la implementación de dos fases: construcción y análisis.
El problema planteado en esta tesis radica en que existe
una descentralización de los datos requeridos por las aplicaciones de los
niveles estratégicos de la organización, trayendo como consecuencia que las
consultas en línea realizadas por los ejecutivos resulten muy lentas y
engorrosas, ocasionando también una disminución del tiempo de respuesta de la
máquina central, en donde se llevan a cabo continuamente los procesos
operacionales.
En el mismo orden se analizó otra tesis elaborada por Gómez
y Ochoa (1998), quien realizó una investigación titulada “Conceptualización
del Data Warehouse, análisis, diseño e implementación de un prototipo”,
realizado en
La metodología utilizada en esta investigación fue una
fusión entre la propuesta por el Sr. William Inmon
(1992) en su libro Building The Data Warehouse, para el análisis de modelos de
datos de los sistemas origen y de la metodología propuesta por la empresa SAS
llamada SAS/WA “System Management Methodology/Data Warehousing". Los resultados obtenidos permitieron a los usuarios entre
otros, lo siguiente:
1. Disponer de la información integrada sobre una variable,
logrando una visión más amplia del fenómeno analizado.
2. Validar los resultados obtenidos en un subsistema al
cruzarlos con otras variables e indicadores asociados.
3. Permitir al investigador el planteamiento de nuevas
hipótesis sobre el problema analizado.
4. Acceder a un nivel superior en el manejo de la información,
contribuyendo a mejorar el proceso de toma de decisiones y la planificación de
los usuarios.
5. Permitir una interrelación armónica entre distintos
proyectos de producción estadística que administra la oficina central.
Esta tesis permitió
conocer la metodología de sistemas empleada por el autor para el desarrollo de
las diferentes etapas que conducen a la consolidación de un Data Warehouse.
La tercera tesis fue realizada en México Ydirín (2004) quien realizó una investigación sobre
“Construcción de un Data Warehouse de datos del medio ambiente para la toma de
decisiones: aplicación a los datos hidrológicos” y está disponible en
Internet en la página: http://140.148.3.250/u_dl_a/servlet/mx.udlap.
ict.tales.html., que pertenece a
En otro orden, también se debe considerar el aporte
significativo que se obtuvo de la información consultada en Internet, tanto en
universidades como de empresas consultoras en Data Warehouse, que tienen una
gran cantidad de documentación y escritos relacionados con su diseño e
implementación, tales como: http://www.techguide.com/
y http: //www.datawarehouse.com/, en cuyo sites se
puede además encontrar los autores y teorías discutidas sobre el tema en
cuestión.
Finalmente, las lecturas realizadas a los textos de quien fuera
la primera persona que acuñó el término Data Warehouse y quien ha desarrollado
muchos libros explicativos sobre técnicas y herramientas como Data Mining, W.H.Inmon. Y que desde
1990 viene trabajando con el fenómeno del Data Warehouse, fue la base fundamental
para entender a través de ejemplos citados, los aspectos fundamentales del Data
Warehouse y otras técnicas.
Un Data Warehouse es un repositorio de datos provenientes
de diversas fuentes de la empresa, que incluye tanto los datos actuales como
históricos en un ambiente integrado, para satisfacer las necesidades de
consultas, reportes analíticos y soportes de toma de decisiones de los usuarios
finales. No se puede interpretar como un software ó hardware, sino como un
conjunto de componentes y procesos que integran una arquitectura diseñados para
el almacenamiento de información y para dar soporte a los procesos de acción /
decisión.
El concepto universalmente aceptado de un Data Warehouse
fue definido por Bill Inmon
en los años 1.990, y este dice que: “Un Data Warehouse es una colección de
datos integrados, no volátiles, orientados a tema y cambiante en el tiempo, que
son usados para la toma de decisiones estratégicas” (p.7).
En esta definición el autor recalca la gran ventaja que el
Data Warehouse tiene sobre los sistemas operacionales ó “Legacy”,
que es la de hacer útil los datos a la gestión corporativa y la de garantizar
su permanencia en el tiempo, permitiendo que toda la información pueda ser
utilizada cuando sea requerida por los usuarios. Así mismo, cuando explica que
“...es una colección de datos integrados...”, se refiere a que se puede
explotar esta información obteniéndose sumarizaciones
y consolidaciones de la información de acuerdo a una característica única. Otra
ventaja que representa una gran diferencia con respecto a las otras filosofías
de sistemas, es que la información se clasifica en base a los temas que son de
interés para la empresa. Por ejemplo, en el caso de Cantv, los sistemas operacionales manejan la figura
de Abonado ó servicio compuesto de un
número para la central, área y número de teléfono, para el Data Warehouse se
manejaría la figura del cliente (Cédula de Identidad ó Rif),
con todos sus servicios asociados.
Podemos concluir que el Data Warehouse surgió de la
necesidad de disponer un acceso sencillo e inmediato a determinada información
de negocio estructurada y de calidad para ser utilizada por los procesos de
toma decisiones.
Figura 1. Esquema de un
Data Warehouse
En un Data Warehouse la información de los sistemas
operacionales de la empresa se extrae, se depura y se almacena, eliminando las
discrepancias que comúnmente existen entre los mismos. De esta forma, la
información contenida en el repositorio logra reflejar una visión de empresa, y
es especialmente útil para el análisis y toma de decisiones a diferentes
niveles.
La diferencia
existente entre un sistema operacional y un Data Warehouse es la siguiente:
|
Base de Datos Operacional |
Data Warehouse |
|
Datos Operacionales |
Datos del negocio para
Información |
|
Orientado a la aplicación |
Orientado al sujeto |
|
Actual |
Actual + histórico |
|
Detallada |
Detallada + más resumida |
|
Cambia continuamente |
Estable |
Figura 2 Comparación entre Base de Datos Operacional
vs. DW
El ingreso de datos en el Data Warehouse viene desde el
ambiente operacional en casi todos los casos. El DW es siempre un almacén de
datos transformados y separados físicamente de la aplicación donde se
encontraron los datos en el ambiente operacional.
Un DW tiene como objetivo la centralización, integración y
organización de la información de la organización.
Un DW ofrece funcionalidades como:
1. Integra bases de datos heterogéneas y de orígenes
diferentes, internas y externas en una sola base de datos ó repositorio.
2. Ejecuta consultas complejas de la información, no
predefinidas, con diferentes niveles de agrupamiento, totalizando datos y
permitiendo su visualización de forma gráfica.
3. Tiene adaptabilidad ante los cambios dados por las
necesidades del usuario.
4. Analiza los problemas en términos de diferentes dimensiones
(por ejemplo, dimensión tiempo).
5. Controla la calidad de los datos para asegurar
consistencia, homogeneidad y relevancia.
6. Tiene la posibilidad de combinar y formular nuevos datos a
partir de los datos existentes.
7. Provee información histórica, que no necesariamente está en
los sistemas operacionales (ya que se puede mantener solo cierta historia de
las transacciones en los mismos).
8. Incorpora datos externos que complementan los análisis del
negocio, tales como lo es la información de la competencia.
9. Su diseño es fácilmente aceptado por todos los usuarios del
DW: lo importante no es construir una solución usando tecnología de punta, sino
reducir los riesgos de la no-confiabilidad de los datos, facilitar la manipulación
de los mismos y suplir las necesidades de información tan pronto como sea
necesario.
Un Operational Data Store (ODS)
es un repositorio de datos de la organización, cuyo objetivo es proveer, a los
niveles tácticos de la empresa, información integrada para el análisis
operacional. Dicho repositorio se alimenta de los sistemas operacionales de la
organización, y puede ser enriquecido con información externa a la misma.
Un Operational Data Store puede
ser definido como una arquitectura con las siguientes características, algunas
iguales al Data Warehouse:
·
Orientado al sujeto, el ODS es diseñado y organizado alrededor de los
sujetos principales de la corporación, como el Cliente, el Producto, etc.
·
Integrado, a medida que los datos pasan de los sistemas operacionales al
ODS, los datos son transformados en un todo consistente y unificado, dando una
visión corporativa unificada.
·
Volátil, los datos en un ODS son actualizados en cada carga.
·
Evaluado actual, los datos en un ODS típicamente son actuales, en ningún
caso más viejos que unos pocos días, y su historia es
de 3 meses en el caso de CANTV.
·
Contiene datos detallados, los datos en un ODS sirven más para la
comunidad operacional, y de allí surge la necesidad de que sean detallados. A
medida que los datos sean un insumo para niveles más altos de la organización,
la necesidad es que los mismos sean más agregados, y surge el requerimiento de
tenerlos en un Data Warehouse.
Un Operational Data Store tiene
los mismos objetivos del Data Warehouse, con la diferencia que soporta la toma
de decisiones en las áreas tácticas, es decir toma de decisiones de corto a
mediano plazo.
En cuanto a las ventajas de un ODS, básicamente son las
mismas ventajas de un Data Warehouse, con la diferencia de que la información
está a nivel operacional y dirigida a usuarios
operacionales. Cabe destacar algunas desventajas que tienen los sistemas
operacionales contra un ODS:
·
Los sistemas operacionales, en especial los viejos o pre-fabricados,
no cubren todos los requerimientos para el análisis operativo del negocio.
·
Los sistemas operacionales, en muchos casos, son construidos uno a la
vez, siendo la integración entre ellos débil o inexistente.
·
Los sistemas operacionales tienden a ser frágiles, no soportando
modificaciones o alteraciones sustanciales.
El proceso para obtener un Data Warehouse se compone por
una serie de pasos que permiten lograr los objetivos planteados anteriormente.
El primer paso consiste en un proceso de extracción de los
datos requeridos de los sistemas fuente de la organización, de fuentes
manuales, de fuentes externas, y del Operational Data
Store (prefiriéndose esta última fuente sobre las otras, ya que en ella se
encuentran los datos depurados e integrados). Estos datos son almacenados en un
área de trabajo (Staging Area),
en la cual los datos se combinan, se depuran y se transforman mediante la aplicación
de reglas de negocio y de sintaxis que permiten obtener un conjunto de datos
consistentes, veraces y con sentido de negocio.
El siguiente paso consiste en un proceso de carga de los
datos al repositorio central, que físicamente se puede traducir en una base de
datos o un conjunto de bases de datos (relacionales), las cuales pueden ser
accedidas a través de numerosas herramientas en el mercado que trabajan bajo el
enfoque OLAP (Online Analytical Process,
cuyo concepto es explicado más adelante). En este repositorio central, se puede
almacenar los datos al más bajo nivel de detalle y consolidarlos en diferentes
niveles, en función de la estrategia que se defina para la presentación de la
información. El alcance de este proyecto no conlleva la implementación de
herramientas OLAP enfocadas a Inteligencia de negocio, sino que propone el uso
de una herramienta OLAP de visualización que facilita el análisis de los datos y provee técnicas
básicas para comenzar a conocer los datos del negocio.
Con esta serie de pasos, el usuario tiene a su disposición
un conjunto de información consistente, veraz y oportuna y la posibilidad de
consultar de una forma muy rápida la información más solicitada, y a la vez
acceso confiable a los datos de un mayor nivel de detalle.
Finalmente, el Data Warehouse suministra bases para la toma
de decisiones a diversos niveles y para las distintas necesidades dentro de
cualquier organización, colocando toda la información que la organización
necesita disponible para quien la requiera, respetando los mecanismos
apropiados de seguridad y acceso.
Similarmente al
proceso del Data Warehouse, el Operational Data Store
tiene un proceso de extracción de datos de los sistemas operacionales, fuentes
manuales y de las fuentes externa, a los cuales también se les realiza la
limpieza y transformaciones necesarias, ya sea al momento de extraerlos, o en
el área en donde se almacenan temporalmente antes de pasar al ODS (Staging Area). La diferencia es que
los datos extraídos estarán a un nivel de detalle mayor, y su frecuencia de
extracción puede ser desde en tiempo real (en cuyo caso se tienen que
implementar mecanismos en los sistemas operacionales para que transfieran los
datos en tiempo real, tales como disparadores de base de datos o sistemas de
mensajería) hasta extracciones una vez cada varios días.
Los datos
extraídos de los sistemas operacionales y almacenados en el Staging
Area, pasan al
ODS de manera consistente e integrados, el cual es una
base de datos relacional o un conjunto de bases de datos relacionales.
En el mercado existe una diversidad de productos y
herramientas que apoyan a la implementación del Data Warehouse y del Operational Data Store. Cambridge
no está asociada a ninguna en particular, por lo que
el proceso de selección de la herramienta estará basada en la mayor adaptación
a las necesidades y preferencias del usuario.
A
continuación se definen los términos mas importantes:
Un Data Warehouse es un repositorio de datos de la
organización, cuyo objetivo es proveer, a los niveles estratégicos de la
empresa, información para el análisis de la gestión y para la toma de
decisiones. Dicho repositorio se alimenta de los sistemas operacionales de la
organización, del Operational Data Store (cuyo
concepto será explicado más adelante), de información de la empresa llevada
manualmente y de información externa a la misma.
Las soluciones de Data Warehouse ofrecen en general las
siguientes ventajas:
·
Centralización y consistencia de la información útil para toda la
corporación.
·
Acceso a la data corporativa y organizacional en forma rápida y
clasificada en diversas dimensiones y en diferentes niveles de detalle.
·
Posibilidad de combinar y formular nuevos datos a partir de los datos
existentes.
·
Proveer, además de datos, un conjunto de herramientas para consultar,
elaborar reportes, analizar y presentar información.
·
Proveer información histórica, que no necesariamente está en los
sistemas operacionales ( ya que se puede mantener solo
cierta historia de las transacciones en los mismos ).
·
Incorporar datos externos que complementan los análisis del negocio,
tales como lo es la información de la competencia.
Un Operational Data Store (ODS)
es un repositorio de datos de la organización, cuyo objetivo es proveer, a los
niveles tácticos de la empresa, información integrada para el análisis
operacional. Dicho repositorio se alimenta de los sistemas operacionales de la
organización, y puede ser enriquecido con información externa a la misma.
Un Operational Data Store puede
ser definido como una arquitectura con las siguientes características, algunas
iguales al Data Warehouse:
·
Orientado al sujeto, el ODS es diseñado y organizado alrededor de los
sujetos principales de la corporación, como el Cliente, el Producto, etc.
·
Integrado, a medida que los datos pasan de los sistemas operacionales al
ODS, los datos son transformados en un todo consistente y unificado, dando una
visión corporativa unificada.
·
Volátil, los datos en un ODS son actualizados en cada carga.
·
Evaluado actual, los datos en un ODS típicamente son actuales, en ningún
caso más viejos que unos pocos días, y su historia es
de 3 meses en el caso de
CANTV.
En resumen, los datos en un ODS sirven más para la
comunidad operacional, y de allí surge la necesidad de que sean detallados. A
medida que los datos sean un insumo para niveles más altos de la organización,
la necesidad es que los mismos sean más agregados, y surge el requerimiento de
tenerlos en un Data Warehouse.
Las áreas del negocio que se tomaron para este proyecto fueron : Facturación, Recaudación y Tráfico de llamadas.
Por último se evalúan los datos básicos del cliente.
A
continuación se definen los términos más importantes:
Un Data Warehouse es un repositorio de datos de la
organización, cuyo objetivo es proveer, a los niveles estratégicos de la
empresa, información para el análisis de la gestión y para la toma de
decisiones. Dicho repositorio se alimenta de los sistemas operacionales de la
organización, del Operational Data Store (cuyo
concepto será explicado más adelante), de información de la empresa llevada
manualmente y de información externa a la misma.
Las soluciones de Data Warehouse ofrecen en general las
siguientes ventajas:
1. Centralización y consistencia de la información útil
para toda la corporación.
2. Acceso a la data corporativa y organizacional en forma
rápida y clasificada en diversas dimensiones y en diferentes niveles de
detalle.
3. Posibilidad de combinar y formular nuevos datos a
partir de los datos existentes.
4. Proveer, además de datos, un conjunto de herramientas
para consultar, elaborar reportes, analizar y presentar información.
5. Proveer información histórica, que no necesariamente
está en los sistemas operacionales (ya que se puede mantener solo cierta
historia de las transacciones en los mismos).
6. Incorporar datos externos que complementan los
análisis del negocio, tales como lo es la información de la competencia.
Un Operational Data Store (ODS)
es un repositorio de datos de la organización, cuyo objetivo es proveer, a los
niveles tácticos de la empresa, información integrada para el análisis
operacional. Dicho repositorio se alimenta de los sistemas operacionales de la
organización, y puede ser enriquecido con información externa a la misma.
Un Operational Data Store puede
ser definido como una arquitectura con las siguientes características, algunas
iguales al Data Warehouse:
·
Orientado al
sujeto, el ODS es diseñado y organizado
alrededor de los sujetos principales de la corporación, como el Cliente, el
Producto, etc.
·
Integrado, a medida que los datos pasan de los sistemas
operacionales al ODS, los datos son transformados en un todo consistente y
unificado, dando una visión corporativa unificada.
·
Evaluado actual, los datos en un ODS típicamente son actuales, en
ningún caso más viejos que unos pocos días, y su
historia es de 3 meses en el caso de CANTV.
En resumen, los datos en un ODS sirven más para la
comunidad operacional, y de allí surge la necesidad de que sean detallados. A
medida que los datos sean un insumo para niveles más altos de la organización,
la necesidad es que los mismos sean más agregados, y surge el requerimiento de
tenerlos en un Data Warehouse.
Para poder realizar una clasificación acertada del presente
proyecto como investigación dentro del contexto científico, es necesario tener
claro el significado de las diversas formas de conocimiento científico, del
método científico, de lo que es una investigación científica y de las
características del método científico.
Sabino (1992) nos comenta: La investigación científica se
define como una actividad encaminada a la solución de problemas. Su objetivo es
hallar respuestas a preguntas mediante el empleo de procesos científicos o
también como un esfuerzo que se emprende para resolver un problema, claro está,
un problema de conocimiento. (p. 45).
De todo lo antes expuesto, se puede determinar que la
clasificación de la investigación se divide en tres formas; la primera será
según el propósito o razón de la investigación y se la clasifica como pura o
aplicada. La segunda será según el nivel de conocimiento a obtener con la
investigación y podrá ser exploratoria, descriptiva o explicativa. Por último
se la clasifica según sea la estrategia empleada por el investigador, como
documental, de campo o experimental.
Desde el punto de vista del propósito o razón de este
estudio, podemos decir que la investigación es aplicada por cuanto busca
resolver un problema concreto como es proveer información crítica del negocio a
Arias (1997) dice: ...”El nivel de la investigación esta
referido al grado de profundidad con que se trata el mismo” (p.47). El proyecto
presenta características que lo coloca como una investigación de nivel
descriptivo ya que trataremos de caracterizar la falta de efectividad y
eficacia para proveer la información crítica del negocio a los niveles
gerenciales de mercadeo y Ventas del sector empresas con la finalidad de poder
definir el proceso actual, su incompatibilidad con las demandas de la
información y así poder idear un esquema de estudio a nivel exploratorio en
función de los resultados descriptivos.
Según la estrategia empleada la investigación es netamente
de campo ya que se realizaran consultas que permitan tomar los datos de interés
directamente de la situación actual, mediante técnicas de entrevistas y
cuestionarios a personalidades involucradas en el área y los procesos en
cuestión.
Desde el punto de vista estadístico, una población o
universo puede estar referido a cualquier conjunto de elementos a indagar o
conocer sus características, o una de ellas, y para el cual serán validas las
conclusiones obtenidas en la investigación. Para poder identificar y definir la
población o universo, se requiere establecer primero las unidades de análisis,
sujetos u objetos de ser estudiados y medidos, por lo que los elementos de la
población que también puede ser instituciones, objetos físicos, etcétera.
La muestra estadística es una parte de la población; se
trata de un numero de individuos u objetos
seleccionados científicamente donde cada uno de ellos es un elemento del
universo. Balestrini (2000:126)
Una muestra es una parte representativa del universo,
seleccionada según ciertos criterios en forma estadística o aleatoria, cuyas
características deben reproducirse en ella la más exactamente posibles;
estadístico por cuanto el tamaño de la muestra debe ser suficientemente grande
como para que permita aplicar matemáticas estadísticas para su análisis y
aleatorio por cuanto debe ser seleccionado en la mayoría de los casos al azar
para que su significancia y valor no se vean viciados por el observador y así
se trate de una muestra representativa y no manipulada [32].
De aquí podemos concluir que debido a que tratamos una
propuesta de solución a un problema, nuestro universo de estudio se centra en
dos objetivos: el primero relacionada
con los procesos actuales de procesamiento de la información crítica del
negocio y el segundo orientado en el sistema de tecnología que se recomienda
para establecer la provisión de información a la gerencia.
Para el caso de la situación actual de los procesos que
generan la información crítica del negocio se realizaron los cuestionarios con
el personal involucrado. El cuestionario se dirigió a las 7 Coordinaciones que
conforman
La muestra tomada para esta investigación fue del 100%, y
es una población finita, es decir, porque se tiene plena identificación del
total de la población, por lo tanto el nivel de confianza sobre los resultados
obtenidos será del 100%.
Para el caso de la propuesta tecnológica se consideró la
experiencia de las empresas filiales en esta materia y de
A continuación se realiza el proceso comprobatorio para
obtener el tamaño de la muestra sin ajustar y la varianza.
1.- Determinar el tamaño de la muestra sin ajustar y la
varianza.
2.- Determinar la muestra real.
3.- Sustituyendo tenemos:
Todo esto no lleva a deducir que para que la investigación
se utilizará un muestra del 100%, es decir 7
coordinaciones.
Para entender mejor lo anterior podemos citar a Zorrilla y
Torres (1992) que plantean lo siguiente: “Las variables son todo aquello que se
puede medir, controlar o estudiar en una investigación. También puede afirmarse
que las variables son características, atributos, rasgos, cualidades o
propiedad que se dan en individuos, grupos u objetos. Es decir, las variables
son características observables de algo y, a la vez, son susceptibles de
cambios o variaciones.” (p. 62).
Soler (1997). Los factores que deben tenerse en cuenta en
la operacionalización de una variable, son los siguientes:
·
Definición Nominal: Es simplemente el nombre de la variable que debe
medirse.
·
Definición Operacional: Esta constituido por la dimensión que es un factor o rasgo de la
variable que debe medirse y la cual permite establecer los indicadores, estos
señalan como medir las dimensiones o rasgos de la variable; y por último el índice que es el resultado de
la combinación de valores obtenidos por un individuo o elemento en cada uno de
los indicadores propuestos para medir la variable.
Las variables se clasifican según su capacidad o nivel en
que permitan medir los objetos, es decir, dependiendo de sus propias
características o propiedades. A continuación estas se detallan:
·
Variable Continua: Se presenta cuando el fenómeno a medir puede tomar
valores cuantitativamente distintos. Ejemplos: la edad cronológica. Cuando se
dice que las variables son continuas, supone que los fenómenos que señalan los
indicadores de las variables son continuos. Las variables que se expresan
cuantitativamente por medio de puntajes se les denomina continuas.
·
Variables Discretas: Son aquellas que establecen categorías en términos
no cuantitativos entre diversos individuos o elementos.
·
Variables Individuales: Presentan las características o propiedad que
caracteriza a individuos determinados, y puede ser: Absolutas, Relacionales,
Comparativas, Contextuales.
·
Variables Colectivas: Presentan las características o propiedades que
distinguen a un grupo o colectivo determinado y puede ser: Analíticas,
Estructurales, Globales.
·
Variable antecedente: Es la que se supone como antecedente de otra, es
decir que hay variables que son antecedentes de otras. Ejemplo: para realizar
un aprendizaje se supone un grado mínimo de inteligencia. Por tanto, la
variable inteligencia es un antecedente de la variable
aprendizaje.
·
Variable Independiente: Es la variable que antecede a una variable
dependiente, la que se presenta como causa y
condición de la variable dependiente, es decir, son las condiciones
manipuladas por el investigador a fin de producir ciertos efectos.
·
Variable Dependiente: Es la variable que se presenta como consecuencia
de una variable antecedente. Es decir,
que es el efecto producido por la variable que se considera independiente, la
cual es manejada por el investigador.
·
Variable intervinientes o Alterna: Es la variable que aparece
interponiéndose entre la variable independiente y la variable dependiente y en
el momento de relacionar las variables
interviene forma notoria.
·
Variables Extrañas: Cuando existe una variable independiente no
relacionada con el propósito de estudio, pero que puede presentar efectos sobre
la variable dependiente tenemos una variable extraña.
Para analizar
cuales podrían ser las variables en estudio de la propuesta inicialmente
planteada “Proveer a
·
Información crítica del negocio que es necesaria para la toma de
decisiones de
·
Frecuencia con
·
Forma en que
Luego de identificar las variables, se procede a
operacionalizarlas o descomponerlas en todos sus aspectos o dimensiones, con el
objetivo de facilitar en el futuro la recolección de la información.
Padua (1979:38) plantea lo siguiente: “Una dimensión hace
las veces de la cara de una moneda. Una variable puede tener una o varias
facetas desde donde puede ser estudiada. El conjunto de estas facetas
constituyen los rasgos característicos de la variable en estudio.”
Una vez extraídas las dimensiones, se realizará con ellas
un proceso de descomposición similar al realizado para las variables, pero esta
vez con el objetivo de identificar los Indicadores.
Ramírez (1999:125) comenta: “Un indicador podríamos
conceptualizarlo como un referente empírico, concreto, tangible, cuya presencia
en la realidad nos revela la presencia de la dimensión de la cual se desprende
y, por ende, de la variable en estudio. Los indicadores son los aspectos mas
concretos que defines una dimensión”.
El cuadro de operacionalización para este estudio y las
variables mencionadas quedaría de la siguiente manera:
|
Nivel de la
Investigación |
Tipo de Investigación |
Muestra |
Técnica |
Instrumento |
Procedimiento para la recolección de datos |
||||||||
|
Descriptiva |
De campo |
7 Coordinaciones |
|
Cuestionario estructurado |
Aplicación del cuestionario al personal de las 7
coordinaciones. |
||||||||
|
Objetivo
General: |
Proveer a |
||||||||||||
|
Objetivo Específico |
Variable |
Dimensiones |
Indicadores |
Subindicadores |
Fuente |
Técnica |
Instrumento |
Resultado |
|||||
|
Identificar los pasos del proceso actual de consolidación de la información de áreas Facturación, Recaudación y Tráfico de llamadas de los clientes del Sector Empresas. |
Pasos |
Aspecto
Funcional |
Procesos |
Tiempo |
Áreas usuarias encuestadas |
Encuestas |
Cuestionario |
Procesos a automatizar |
|||||
|
Identificar las fuentes y el medio para la obtención de
los datos críticos de |
Obtención
de la información |
Aspecto
tecnológico |
Nombre de
las fuentes |
Ambiente o
medio de operatividad |
Sistemas |
Entrevista |
Cuestionario no estructurado |
Identificación de las fuentes del
Sistema y el medio de operatividad. |
|||||
|
Identificar los indicadores de gestión que utiliza |
Indicadores de Gestión |
Facturación,
Recaudación y Tráfico |
Montos, cant. de llamadas, Minutos facturados, de productos y servicios,
llamadas en suspenso, ajustes a la facturación. |
Clientes y cuentas |
Areas usuarias encuestadas |
Encuestas |
Cuestionario |
Indicadores de gestión |
|||||
|
Proponer la implantación de un sistema de ‘Data Warehouse’ de almacenamiento de la información estratégica, conformando un ambiente centralizado de datos con herramientas para optimizar la capacidad de análisis y la toma de decisiones del área en cuestión. |
Funcional |
Normas y Procedimientos |
Procesos |
Extracción de los datos, Reportes, Frecuencia generados |
Areas usuarias encuestadas |
Encuestas |
Cuestionario |
Detalles del proceso actual |
|||||
|
Determinar si existen otras experiencias en CANTV y sus filiales con la tecnología Data Warehouse. |
Antecedentes con la tecnología Data Warehouse |
Funcional y Técnico |
Implantación, mantemiento,
resultados, efectividad |
Detalles generales, Información actualizada |
Unidad de Corporaciones de CANTV |
Entrevista |
Cuestionario no estructurado |
Resultados del funcionamiento de otros data Warehouse
en la misma empresa. |
|||||
Según Hernández y colaboradores (1998), las hipótesis se clasifican en:
·
Hipótesis de Investigación: son proposiciones tentativas acerca de las
posibles relaciones entre dos o más variables. A su vez las hipótesis de
investigación pueden ser: Hipótesis descriptivas del valor de las variables que
se va a observar en un contexto o en la manifestación de otra variable.
Hipótesis correlacionales especifican las relaciones entre dos o más variables
y también como se asocian. Hipótesis de la diferencia entre grupos; se formulan
en investigaciones cuyo fin es comparar grupos.
·
Hipótesis Nulas: constituyen proposiciones acerca de la relación entre
variables; solo que sirven para refutar o negar lo que afirma la hipótesis de
investigación.
·
Hipótesis Alternativas: Son posibilidades alternas ante las hipótesis
de investigación y nula; ofrecen otra descripción o explicación distintas a las
que proporcionan estos tipos de hipótesis.
·
Hipótesis Estadística: se pueden formular cuando los datos de los
estudio que se van a recolectar y analizar para probar y rechazar las hipótesis
son cuantitativos (números, porcentajes, promedios). Básicamente hay tres tipos
de hipótesis estadística; de estimación, de correlación, de la diferencia de
medias u otros valores.
En el contexto de la investigación, el sistema de hipótesis
se entiende de cómo una estructura teórica explicativa del problema planteado.
En otras palabras, cuando el científico plantea un problema, supone soluciones,
y en base a ellas, lleva a cabo la investigación.
En primer lugar, la hipótesis debe ser una suposición sobre
la relación entre dos o más variables que explica relaciones en un determinado
problema. En segundo lugar, debe ser formulada claramente, como una sentencia
declarativa, y no en forma ambigua. En tercer lugar, debe ser posible someterla
a prueba, es decir, comprobar a través de los datos.
Para el trabajo que se está realizando se concluye la
siguiente hipótesis:
“La toma de decisiones de la gerencia de Mercadeo y Ventas
depende de la disponibilidad rápida y confiable de la información crítica del
negocio de facturación, Recaudación y tráfico de llamadas.”
Tal como lo comenta Tulio Ramírez en su libro “Como hacer
un proyecto de investigación”, las técnicas se refieren al procedimiento que se
va a utilizar para la recolección de los datos que serán objeto de estudio.
Estas técnicas han sido probadas en diferentes ámbitos y
muchas de ellas están estandarizadas.
Entre las principales técnicas de recolección utilizadas están:
Las mas usadas en las ciencias
sociales:
·
La observación
·
La encuesta
·
La entrevista
Las más usadas en la investigación de tipo documental:
·
El análisis de contenido
·
El análisis ideológico
·
El diferencial semántico
Las técnicas utilizadas para este proyecto, fue producto
del análisis de los resultados arrojados por el cuadro de operacionalización de
las variables. La entrevista y la encuesta.
La técnica de la entrevista la cual es un proceso de
comunicación verbal recíproca, tiene como objetivo recoger informaciones a
partir de una finalidad previamente establecida. Según Carlos Sabino (1986) la
entrevista es una forma específica de interacción social, es decir, el
investigador se sitúa frente al investigado y le formula preguntas, a partir de
cuyas respuestas habrán de surgir los datos de interés, se establece así un
diálogo asimétrico, donde una de las partes busca recoger informaciones y la
otra se nos presenta como fuente de estas informaciones, la ventaja de ésta
técnica reside en que son los mismos actores sociales quienes nos proporcionan
los datos relativos a sus conductas, opiniones, deseos, actitudes,
expectativas, etc., cosas que por su misma naturaleza es casi imposible
observar desde fuera (p.139).