CANTV, se enfrenta a un entorno dinámico y cambiante, como lo es la reciente apertura en el sector de Telecomunicaciones en Venezuela, sector donde operaba de forma única; lo cual le obliga a utilizar cualquier información actual e histórica de su negocio medular, con el fin de tomar las decisiones más oportunas y precisas, asumiendo los cambios de estrategia que les permita mantener y aumentar su posicionamiento en el mercado de las telecomunicaciones.

La recopilación de toda la información referente a la Facturación, Recaudación y Tráfico de llamadas de los clientes del sector Empresas, valiosa e indispensable para análisis de gestión, estimación de presupuestos, de comportamientos de los clientes, estrategias de mercadeo de la competencia, y todo aquello que le permite a la empresa ser más competitiva, requiere de un gran esfuerzo en tiempo para ser integrada y luego reportada, ya que proviene de muy variados sistemas y fuentes.

Con los sistemas y procesos actualmente utilizados, se convierte la integración en un proceso complejo, que necesita una dedicación especial de parte de los usuarios finales que deben verificar de forma manual la consistencia e integridad de los datos obtenidos, y al mismo tiempo arriesga oportunidades de negocio por no disponer de información clave en el momento oportuno.

2.- Formulación del Problema.

Los datos críticos de la Facturación, Recaudación y Tráfico de llamadas de clientes del sector empresas de CANTV, no pueden ser obtenidos efectiva y eficientemente para garantizar la oportuna toma de decisiones de Mercadeo y Ventas.

3.- Sistematización del Problema

¿Como se impacta la calidad de la información al obtener los datos de diferentes fuentes y de forma manual?

¿Con que periodicidad es requerida la información de Facturación, Recaudación y Tráfico de llamadas por parte de la Gerencia de Mercadeo y Ventas?

¿Que características de los datos son consideradas para el estudio y análisis de la información?

¿Como se afecta el proceso de toma de decisiones de la Gerencia de Mercadeo y Ventas, al no contar con información oportuna y consistente?

4.- Objetivo General del Problema.

Proponer la implantación de un sistema de tipo ‘Data Warehouse’ de almacenamiento de la información estratégica, conformando un ambiente centralizado de datos con herramientas para optimizar la capacidad de análisis y la toma de decisiones del área en cuestión.

5.- Objetivos Específicos

a) Identificar los elementos que causan demora en la consolidación de la información de las áreas de Facturación, Recaudación y Tráfico de llamadas de los clientes del sector Empresas, para la toma de decisión de la Gerencia de Mercadeo y Venta.

b) Identificar las fuentes y los caminos para la obtención de los datos críticos de la Facturación, Recaudación y Tráfico de llamadas de los clientes del sector Empresas.

c) Identificar cuales son los indicadores de gestión que utiliza la Gerencia de Mercadeo y Venta para la evaluación y análisis de la información

d) Realizar un estudio de factibilidad y riesgo de los procesos y de los indicadores a generar para apoyar la toma de decisiones.

6.- Justificación de la Investigación

Para que una organización sobreviva y sea exitosa, debe tener un plan estratégico que guíe sus acciones. El estratega del negocio normalmente está falto de la información necesaria para detectar comportamientos dentro del ambiente de negocios, ya que la infraestructura de la organización no puede proveérsela, porque está basada en sistemas operacionales no integrados y no sumarizados en los niveles adecuados (por ejemplo, cuando se estudia el comportamiento del mercado no se analiza lo que hace un solo cliente, sino el conjunto de clientes). Es por esto que se necesita otra clase de estructura que soporte estas necesidades, la cual hemos definido como una aplicación integrada de Data Warehouse.

Un Data Warehouse es parte de una estructura integral, la Inteligencia del Negocio, la cual podemos conceptualizar como el razonamiento acerca del negocio, para definir y ejecutar una estrategia. El Data Warehouse existe para ampliar las habilidades gerenciales para la toma de decisiones.

La tecnología en la cual se apoya esta filosofía permite que la visualización de la información se efectúe de manera flexible, rápida y en los niveles de consolidación requeridos al momento de la consulta, basada en un conjunto de datos consistentes, confiables y veraces de la organización.

Dentro del área de apoyo a la toma de decisiones, ha tomado un auge impactante la filosofía y las soluciones de Data Warehouse, apoyando e impulsando de forma acelerada el soporte a las decisiones de impacto en la gestión de las empresas del mercado.

En un Data Warehouse la información de los sistemas operacionales de la empresa se extrae, se depura y se almacena, eliminando las discrepancias que comúnmente existen entre los mismos. De esta forma, la información contenida en el repositorio logra reflejar una visión de empresa, y es especialmente útil para el análisis y toma de decisiones a diferentes niveles.

Según otros reconocido autor Michael Corvey (experto en Oracle) en su libro “Oracle Data Warehousing”,1.997. pp.3, un Data Warehouse se puede definir como una colección de información corporativa derivada directamente de los sistemas operacionales y de algunos orígenes de datos externos.

Su propósito específico es soportar la toma de decisiones en un negocio, no las operaciones de un negocio. De esto es de lo que se trata un Data Warehouse, de ayudar a un negocio a plantearse preguntas del tipo ... ¿qué pasaría si...?. Las respuestas a estas preguntas asegurarán que el negocio sea activo, y no reactivo, lo cual es una necesidad en la actual era de la información.

7.- Alcance

Las áreas del negocio que se tomaron para este proyecto fueron: Facturación, Recaudación y Tráfico de llamadas.

La Facturación comprende todo lo relacionado a la facturación de los servicios y planes que el cliente tiene contratado con CANTV. Proporciona datos como:

· Montos, llamadas y minutos facturados.

· Productos y servicios facturados.

· Llamadas en suspenso.

· Ajustes a la facturación.

· Planes de precios de facturación.

La Recaudación comprende todo lo recaudado ó cobrado a los clientes, a partir de lo facturado. Proporciona datos como:

· Análisis de deuda y monto recaudado.

El Tráfico de llamadas lleva el control de uso de las redes de Cantv para la realización de las llamadas desde ó a través de los servicios de CANTV. Proporciona datos como:

· Análisis de uso de la red por tráfico CANTV (voz).

· Análisis de uso de la red por tráfico de otras operadoras.

Por último se evalúan los datos básicos del cliente.

Entre las actividades a desarrollarse están: el análisis funcional de alto nivel en cada una de los procesos de Facturación, Recaudación y Ventas de la Gerencia de Mercadeo y Ventas, y un estudio de las diferentes aplicaciones existentes que apoyan actualmente la obtención de la información requerida por los usuarios de la Organización.

A partir del análisis realizado se generará una matriz de ponderación para definir los procesos más importantes y posteriormente desarrollar las reglas de negocio asociadas a dicha información. Posterior a la priorización de funcionalidades se llevará a cabo la factibilidad de las mismas, expresada en complejidad técnica y riesgo para garantizar su generación oportuna y su veracidad.

CAPITULO II

1.- Antecedentes

En la actualidad las industrias están a la búsqueda de nuevos procesos y herramientas que les permitan posible procesar grandes volúmenes de información analíticamente; para manipular su información actual e histórica, con el fin de enfrentar la toma decisiones con fundamento. De la misma manera estas compañías están minadas de grandes cantidades de información sin depurar debido al enfoque tecnológico adquirido desde sus inicios, ahora, un negocio que no utilice de forma efectiva la tecnología para manipular y viajar por la información, no sobrevive. El negocio que logre conseguir acceso y comprensión de su información tendrá poder, que es equivalente a tener la ventaja competitiva frente a los otros.

Una de las formas claves para gestionar la información es usar la tecnología adecuada. Así lo demuestran dos casos de grandes empresas norteamericanas que destacan este punto y que fueron comentados por Corey y Abbey (2002), cuando se refirieron a las compañías “Hertz y Victoria’s Secret, quienes pudieron gestionar los datos de sus empresas y manipular los grandes volúmenes de información gracias al Data Warehouse” (p.7). Ambas empresas llegaron a ser líderes en la industria, logrando acercarse más a sus clientes y ofrecerles un servicio de alto nivel. Pero esto solo se logra cuando se tiene información acerca de los clientes, la necesaria para batir a la competencia.

Corey y Abbey (2002), “La velocidad con que Hertz, responde a sus clientes, hace que la seleccionen sin dudar, cuando se trata de obtener el servicio de alquiler de carros, ya que ellos garantizan rapidez, seguridad y conocimiento en las gestiones que llevan a cabo con el cliente.” (p.7).

Estos ejemplos demuestran que cuando los negocios hacen buen uso de la información y logran sacar de ella todo lo que se pueda, pueden entender mejor a los clientes y en consecuencia pueden ocupar una mejor posición en el mercado. De esto precisamente se trata el Data Warehouse, de poner los datos de una corporación en un sistema que se preste para la toma de decisiones, poder hacer análisis basados en la data actual e histórica.

Para conocer otras experiencias realizadas y los resultados obtenidos a través de trabajos de investigación referentes al tópico en estudio que pudieran dar una orientación y apoyo al proyecto, se analizaron en detalle tres tesis:

Morales (1996) realizó una investigación titulada “Creación de un modelo conceptual de un Data Warehouse para el Banco Mercantil e implementación departamental”, con el objetivo de diseñar e implementar un Data Warehouse para una empresa del sector financiero. La investigación fue un trabajo de campo, de tipo descriptiva, la cual consideró una población de 15 personas equivalentes al 100%. La técnica de recolección de datos utilizada fue la entrevista y el cuestionario. La investigación arrojó como resultado la creación de un sistema que almacena la información tanto histórica como actual y que ofrece un análisis de estos datos en forma seleccionada, integrada organizada e historiada. El sistema se implementó con base a un estudio sobre las estrategias de diseño e implementación de Data Warehouse. El sistema se basó en la implementación de dos fases: construcción y análisis.

El problema planteado en esta tesis radica en que existe una descentralización de los datos requeridos por las aplicaciones de los niveles estratégicos de la organización, trayendo como consecuencia que las consultas en línea realizadas por los ejecutivos resulten muy lentas y engorrosas, ocasionando también una disminución del tiempo de respuesta de la máquina central, en donde se llevan a cabo continuamente los procesos operacionales.

En el mismo orden se analizó otra tesis elaborada por Gómez y Ochoa (1998), quien realizó una investigación titulada “Conceptualización del Data Warehouse, análisis, diseño e implementación de un prototipo”, realizado en la Oficina Central de Estadística e Información, y tuvo como objetivo integrar la data de los siguientes programas: Encuesta Anual de la Industria, Encuesta Semestral de Hogares y Encuesta Anual de Indicadores Económicos, para demostrar los alcances de la implementación de un proyecto de esta índole.

La metodología utilizada en esta investigación fue una fusión entre la propuesta por el Sr. William Inmon (1992) en su libro Building The Data Warehouse, para el análisis de modelos de datos de los sistemas origen y de la metodología propuesta por la empresa SAS llamada SAS/WA “System Management Methodology/Data Warehousing". Los resultados obtenidos permitieron a los usuarios entre otros, lo siguiente:

1. Disponer de la información integrada sobre una variable, logrando una visión más amplia del fenómeno analizado.

2. Validar los resultados obtenidos en un subsistema al cruzarlos con otras variables e indicadores asociados.

3. Permitir al investigador el planteamiento de nuevas hipótesis sobre el problema analizado.

4. Acceder a un nivel superior en el manejo de la información, contribuyendo a mejorar el proceso de toma de decisiones y la planificación de los usuarios.

5. Permitir una interrelación armónica entre distintos proyectos de producción estadística que administra la oficina central.

Esta tesis permitió conocer la metodología de sistemas empleada por el autor para el desarrollo de las diferentes etapas que conducen a la consolidación de un Data Warehouse.

La tercera tesis fue realizada en México Ydirín (2004) quien realizó una investigación sobre “Construcción de un Data Warehouse de datos del medio ambiente para la toma de decisiones: aplicación a los datos hidrológicos” y está disponible en Internet en la página: http://140.148.3.250/u_dl_a/servlet/mx.udlap. ict.tales.html., que pertenece a la Universidad de las Américas, Puebla. Esta tesis tiene igualmente características muy similares con el proyecto aquí planteado, se trata de la construcción, implementación y validación de un Data Warehouse sobre los principales ríos y presas de México con la finalidad de apoyar el análisis y toma de decisiones. El problema que se presentó en la investigación estaba relacionado con la dispersión de la información para administrar datos sobre la descripción del comportamiento de los ríos, volumen de aguas y crecimiento de presas con respecto a otras condiciones (meteorología, aspectos sociales, producción). Cada ente observaba, anotaba, manipulaba y analizaba los datos de manera diferente y no proporcionaban herramientas (reportes, gráficos, consultas) orientadas al análisis y explotación de la información. El resultado producto de la ejecución del proyecto fue la construir un soporte de almacenamiento integrado, a la consulta, al análisis, a la visualización y el mantenimiento automático de datos del medio ambiente para tomar decisiones según distintos tipos de necesidades. Este sistema recuperó información proporcionada por otras instituciones del estado para ofrecer un análisis de los datos de manera organizada, integrada, seleccionada e historiada.

En otro orden, también se debe considerar el aporte significativo que se obtuvo de la información consultada en Internet, tanto en universidades como de empresas consultoras en Data Warehouse, que tienen una gran cantidad de documentación y escritos relacionados con su diseño e implementación, tales como: http://www.techguide.com/ y http: //www.datawarehouse.com/, en cuyo sites se puede además encontrar los autores y teorías discutidas sobre el tema en cuestión.

Finalmente, las lecturas realizadas a los textos de quien fuera la primera persona que acuñó el término Data Warehouse y quien ha desarrollado muchos libros explicativos sobre técnicas y herramientas como Data Mining, W.H.Inmon. Y que desde 1990 viene trabajando con el fenómeno del Data Warehouse, fue la base fundamental para entender a través de ejemplos citados, los aspectos fundamentales del Data Warehouse y otras técnicas.

2.- Marco Teórico

Definición de Data Warehouse

Un Data Warehouse es un repositorio de datos provenientes de diversas fuentes de la empresa, que incluye tanto los datos actuales como históricos en un ambiente integrado, para satisfacer las necesidades de consultas, reportes analíticos y soportes de toma de decisiones de los usuarios finales. No se puede interpretar como un software ó hardware, sino como un conjunto de componentes y procesos que integran una arquitectura diseñados para el almacenamiento de información y para dar soporte a los procesos de acción / decisión.

El concepto universalmente aceptado de un Data Warehouse fue definido por Bill Inmon en los años 1.990, y este dice que: “Un Data Warehouse es una colección de datos integrados, no volátiles, orientados a tema y cambiante en el tiempo, que son usados para la toma de decisiones estratégicas” (p.7).

En esta definición el autor recalca la gran ventaja que el Data Warehouse tiene sobre los sistemas operacionales ó “Legacy”, que es la de hacer útil los datos a la gestión corporativa y la de garantizar su permanencia en el tiempo, permitiendo que toda la información pueda ser utilizada cuando sea requerida por los usuarios. Así mismo, cuando explica que “...es una colección de datos integrados...”, se refiere a que se puede explotar esta información obteniéndose sumarizaciones y consolidaciones de la información de acuerdo a una característica única. Otra ventaja que representa una gran diferencia con respecto a las otras filosofías de sistemas, es que la información se clasifica en base a los temas que son de interés para la empresa. Por ejemplo, en el caso de Cantv, los sistemas operacionales manejan la figura de Abonado ó servicio compuesto de un número para la central, área y número de teléfono, para el Data Warehouse se manejaría la figura del cliente (Cédula de Identidad ó Rif), con todos sus servicios asociados.

Podemos concluir que el Data Warehouse surgió de la necesidad de disponer un acceso sencillo e inmediato a determinada información de negocio estructurada y de calidad para ser utilizada por los procesos de toma decisiones.

Figura 1. Esquema de un Data Warehouse

La diferencia existente entre un sistema operacional y un Data Warehouse es la siguiente:

Base de Datos Operacional	Data Warehouse
Datos Operacionales	Datos del negocio para Información
Orientado a la aplicación	Orientado al sujeto
Actual	Actual + histórico
Detallada	Detallada + más resumida
Cambia continuamente	Estable

Figura 2 Comparación entre Base de Datos Operacional vs. DW

El ingreso de datos en el Data Warehouse viene desde el ambiente operacional en casi todos los casos. El DW es siempre un almacén de datos transformados y separados físicamente de la aplicación donde se encontraron los datos en el ambiente operacional.

Objetivos y ventajas del Data Warehouse

Un DW tiene como objetivo la centralización, integración y organización de la información de la organización.

Un DW ofrece funcionalidades como:

1. Integra bases de datos heterogéneas y de orígenes diferentes, internas y externas en una sola base de datos ó repositorio.

2. Ejecuta consultas complejas de la información, no predefinidas, con diferentes niveles de agrupamiento, totalizando datos y permitiendo su visualización de forma gráfica.

3. Tiene adaptabilidad ante los cambios dados por las necesidades del usuario.

4. Analiza los problemas en términos de diferentes dimensiones (por ejemplo, dimensión tiempo).

5. Controla la calidad de los datos para asegurar consistencia, homogeneidad y relevancia.

6. Tiene la posibilidad de combinar y formular nuevos datos a partir de los datos existentes.

7. Provee información histórica, que no necesariamente está en los sistemas operacionales (ya que se puede mantener solo cierta historia de las transacciones en los mismos).

8. Incorpora datos externos que complementan los análisis del negocio, tales como lo es la información de la competencia.

9. Su diseño es fácilmente aceptado por todos los usuarios del DW: lo importante no es construir una solución usando tecnología de punta, sino reducir los riesgos de la no-confiabilidad de los datos, facilitar la manipulación de los mismos y suplir las necesidades de información tan pronto como sea necesario.

Definición de un Operational Data Store

Un Operational Data Store (ODS) es un repositorio de datos de la organización, cuyo objetivo es proveer, a los niveles tácticos de la empresa, información integrada para el análisis operacional. Dicho repositorio se alimenta de los sistemas operacionales de la organización, y puede ser enriquecido con información externa a la misma.

Un Operational Data Store puede ser definido como una arquitectura con las siguientes características, algunas iguales al Data Warehouse:

· Orientado al sujeto, el ODS es diseñado y organizado alrededor de los sujetos principales de la corporación, como el Cliente, el Producto, etc.

· Integrado, a medida que los datos pasan de los sistemas operacionales al ODS, los datos son transformados en un todo consistente y unificado, dando una visión corporativa unificada.

· Volátil, los datos en un ODS son actualizados en cada carga.

· Evaluado actual, los datos en un ODS típicamente son actuales, en ningún caso más viejos que unos pocos días, y su historia es de 3 meses en el caso de CANTV.

· Contiene datos detallados, los datos en un ODS sirven más para la comunidad operacional, y de allí surge la necesidad de que sean detallados. A medida que los datos sean un insumo para niveles más altos de la organización, la necesidad es que los mismos sean más agregados, y surge el requerimiento de tenerlos en un Data Warehouse.

Objetivos y Ventajas de un Operational Data Store

Un Operational Data Store tiene los mismos objetivos del Data Warehouse, con la diferencia que soporta la toma de decisiones en las áreas tácticas, es decir toma de decisiones de corto a mediano plazo.

En cuanto a las ventajas de un ODS, básicamente son las mismas ventajas de un Data Warehouse, con la diferencia de que la información está a nivel operacional y dirigida a usuarios operacionales. Cabe destacar algunas desventajas que tienen los sistemas operacionales contra un ODS:

· Los sistemas operacionales, en especial los viejos o pre-fabricados, no cubren todos los requerimientos para el análisis operativo del negocio.

· Los sistemas operacionales, en muchos casos, son construidos uno a la vez, siendo la integración entre ellos débil o inexistente.

· Los sistemas operacionales tienden a ser frágiles, no soportando modificaciones o alteraciones sustanciales.

Procesos que componen un Data Warehouse

El proceso para obtener un Data Warehouse se compone por una serie de pasos que permiten lograr los objetivos planteados anteriormente.

El primer paso consiste en un proceso de extracción de los datos requeridos de los sistemas fuente de la organización, de fuentes manuales, de fuentes externas, y del Operational Data Store (prefiriéndose esta última fuente sobre las otras, ya que en ella se encuentran los datos depurados e integrados). Estos datos son almacenados en un área de trabajo (Staging Area), en la cual los datos se combinan, se depuran y se transforman mediante la aplicación de reglas de negocio y de sintaxis que permiten obtener un conjunto de datos consistentes, veraces y con sentido de negocio.

El siguiente paso consiste en un proceso de carga de los datos al repositorio central, que físicamente se puede traducir en una base de datos o un conjunto de bases de datos (relacionales), las cuales pueden ser accedidas a través de numerosas herramientas en el mercado que trabajan bajo el enfoque OLAP (Online Analytical Process, cuyo concepto es explicado más adelante). En este repositorio central, se puede almacenar los datos al más bajo nivel de detalle y consolidarlos en diferentes niveles, en función de la estrategia que se defina para la presentación de la información. El alcance de este proyecto no conlleva la implementación de herramientas OLAP enfocadas a Inteligencia de negocio, sino que propone el uso de una herramienta OLAP de visualización que facilita el análisis de los datos y provee técnicas básicas para comenzar a conocer los datos del negocio.

Con esta serie de pasos, el usuario tiene a su disposición un conjunto de información consistente, veraz y oportuna y la posibilidad de consultar de una forma muy rápida la información más solicitada, y a la vez acceso confiable a los datos de un mayor nivel de detalle.

Finalmente, el Data Warehouse suministra bases para la toma de decisiones a diversos niveles y para las distintas necesidades dentro de cualquier organización, colocando toda la información que la organización necesita disponible para quien la requiera, respetando los mecanismos apropiados de seguridad y acceso.

Procesos que componen un Operational Data Store

Similarmente al proceso del Data Warehouse, el Operational Data Store tiene un proceso de extracción de datos de los sistemas operacionales, fuentes manuales y de las fuentes externa, a los cuales también se les realiza la limpieza y transformaciones necesarias, ya sea al momento de extraerlos, o en el área en donde se almacenan temporalmente antes de pasar al ODS (Staging Area). La diferencia es que los datos extraídos estarán a un nivel de detalle mayor, y su frecuencia de extracción puede ser desde en tiempo real (en cuyo caso se tienen que implementar mecanismos en los sistemas operacionales para que transfieran los datos en tiempo real, tales como disparadores de base de datos o sistemas de mensajería) hasta extracciones una vez cada varios días.

Los datos extraídos de los sistemas operacionales y almacenados en el Staging Area, pasan al ODS de manera consistente e integrados, el cual es una base de datos relacional o un conjunto de bases de datos relacionales.

En el mercado existe una diversidad de productos y herramientas que apoyan a la implementación del Data Warehouse y del Operational Data Store. Cambridge no está asociada a ninguna en particular, por lo que el proceso de selección de la herramienta estará basada en la mayor adaptación a las necesidades y preferencias del usuario.

Glosario de Términos

A continuación se definen los términos mas importantes:

Un Data Warehouse es un repositorio de datos de la organización, cuyo objetivo es proveer, a los niveles estratégicos de la empresa, información para el análisis de la gestión y para la toma de decisiones. Dicho repositorio se alimenta de los sistemas operacionales de la organización, del Operational Data Store (cuyo concepto será explicado más adelante), de información de la empresa llevada manualmente y de información externa a la misma.

Las soluciones de Data Warehouse ofrecen en general las siguientes ventajas:

· Centralización y consistencia de la información útil para toda la corporación.

· Acceso a la data corporativa y organizacional en forma rápida y clasificada en diversas dimensiones y en diferentes niveles de detalle.

· Posibilidad de combinar y formular nuevos datos a partir de los datos existentes.

· Proveer, además de datos, un conjunto de herramientas para consultar, elaborar reportes, analizar y presentar información.

· Proveer información histórica, que no necesariamente está en los sistemas operacionales ( ya que se puede mantener solo cierta historia de las transacciones en los mismos ).

· Incorporar datos externos que complementan los análisis del negocio, tales como lo es la información de la competencia.

Un Operational Data Store puede ser definido como una arquitectura con las siguientes características, algunas iguales al Data Warehouse:

· Orientado al sujeto, el ODS es diseñado y organizado alrededor de los sujetos principales de la corporación, como el Cliente, el Producto, etc.

· Integrado, a medida que los datos pasan de los sistemas operacionales al ODS, los datos son transformados en un todo consistente y unificado, dando una visión corporativa unificada.

· Volátil, los datos en un ODS son actualizados en cada carga.

· Evaluado actual, los datos en un ODS típicamente son actuales, en ningún caso más viejos que unos pocos días, y su historia es de 3 meses en el caso de CANTV.

En resumen, los datos en un ODS sirven más para la comunidad operacional, y de allí surge la necesidad de que sean detallados. A medida que los datos sean un insumo para niveles más altos de la organización, la necesidad es que los mismos sean más agregados, y surge el requerimiento de tenerlos en un Data Warehouse.

Las áreas del negocio que se tomaron para este proyecto fueron : Facturación, Recaudación y Tráfico de llamadas.

Por último se evalúan los datos básicos del cliente.

3.- Términos Básicos

A continuación se definen los términos más importantes:

Las soluciones de Data Warehouse ofrecen en general las siguientes ventajas:

1. Centralización y consistencia de la información útil para toda la corporación.

2. Acceso a la data corporativa y organizacional en forma rápida y clasificada en diversas dimensiones y en diferentes niveles de detalle.

3. Posibilidad de combinar y formular nuevos datos a partir de los datos existentes.

4. Proveer, además de datos, un conjunto de herramientas para consultar, elaborar reportes, analizar y presentar información.

5. Proveer información histórica, que no necesariamente está en los sistemas operacionales (ya que se puede mantener solo cierta historia de las transacciones en los mismos).

6. Incorporar datos externos que complementan los análisis del negocio, tales como lo es la información de la competencia.

Un Operational Data Store puede ser definido como una arquitectura con las siguientes características, algunas iguales al Data Warehouse:

· Orientado al sujeto, el ODS es diseñado y organizado alrededor de los sujetos principales de la corporación, como el Cliente, el Producto, etc.

· Integrado, a medida que los datos pasan de los sistemas operacionales al ODS, los datos son transformados en un todo consistente y unificado, dando una visión corporativa unificada.

· Evaluado actual, los datos en un ODS típicamente son actuales, en ningún caso más viejos que unos pocos días, y su historia es de 3 meses en el caso de CANTV.

3.- Marco Metodológico

Clasificación de la investigación.

Para poder realizar una clasificación acertada del presente proyecto como investigación dentro del contexto científico, es necesario tener claro el significado de las diversas formas de conocimiento científico, del método científico, de lo que es una investigación científica y de las características del método científico.

Sabino (1992) nos comenta: La investigación científica se define como una actividad encaminada a la solución de problemas. Su objetivo es hallar respuestas a preguntas mediante el empleo de procesos científicos o también como un esfuerzo que se emprende para resolver un problema, claro está, un problema de conocimiento. (p. 45).

La Universidad Nacional Abierta (1985) expresa: ....”Considerando que la investigación científica es un proceso metódico, organizado y sistemático, las formas de conocimiento son primordiales para establecer el nivel y tipo de investigación. (p.23).

La Universidad Nacional Abierta (1985) también comenta que: Existen dos tipos generalizados de conocimientos en el mundo, estos son el conocimiento vulgar y el conocimiento científico. El primero es el que se adquiere a través del procedimiento vulgar o popular; se trata de un conocimiento adquirido por experiencia más que por un procedimiento científico, es el resultado de la vida diaria. El segundo es el conocimiento científico que se adquiere a través de procedimientos científicos basados en una investigación científica y que a su vez genera conocimiento vulgar y conocimiento científico nuevos” (p. 27).

De todo lo antes expuesto, se puede determinar que la clasificación de la investigación se divide en tres formas; la primera será según el propósito o razón de la investigación y se la clasifica como pura o aplicada. La segunda será según el nivel de conocimiento a obtener con la investigación y podrá ser exploratoria, descriptiva o explicativa. Por último se la clasifica según sea la estrategia empleada por el investigador, como documental, de campo o experimental.

Desde el punto de vista del propósito o razón de este estudio, podemos decir que la investigación es aplicada por cuanto busca resolver un problema concreto como es proveer información crítica del negocio a la Gerencia de Mercadeo y Ventas del sector Empresas. Muy por el contrario la investigación pura que genera resultados que aportan investigación al problema pero no lo resuelven directamente en la práctica.

Arias (1997) dice: ...”El nivel de la investigación esta referido al grado de profundidad con que se trata el mismo” (p.47). El proyecto presenta características que lo coloca como una investigación de nivel descriptivo ya que trataremos de caracterizar la falta de efectividad y eficacia para proveer la información crítica del negocio a los niveles gerenciales de mercadeo y Ventas del sector empresas con la finalidad de poder definir el proceso actual, su incompatibilidad con las demandas de la información y así poder idear un esquema de estudio a nivel exploratorio en función de los resultados descriptivos.

Según la estrategia empleada la investigación es netamente de campo ya que se realizaran consultas que permitan tomar los datos de interés directamente de la situación actual, mediante técnicas de entrevistas y cuestionarios a personalidades involucradas en el área y los procesos en cuestión.

Población y Muestra

Desde el punto de vista estadístico, una población o universo puede estar referido a cualquier conjunto de elementos a indagar o conocer sus características, o una de ellas, y para el cual serán validas las conclusiones obtenidas en la investigación. Para poder identificar y definir la población o universo, se requiere establecer primero las unidades de análisis, sujetos u objetos de ser estudiados y medidos, por lo que los elementos de la población que también puede ser instituciones, objetos físicos, etcétera.

La muestra estadística es una parte de la población; se trata de un numero de individuos u objetos seleccionados científicamente donde cada uno de ellos es un elemento del universo. Balestrini (2000:126)

Una muestra es una parte representativa del universo, seleccionada según ciertos criterios en forma estadística o aleatoria, cuyas características deben reproducirse en ella la más exactamente posibles; estadístico por cuanto el tamaño de la muestra debe ser suficientemente grande como para que permita aplicar matemáticas estadísticas para su análisis y aleatorio por cuanto debe ser seleccionado en la mayoría de los casos al azar para que su significancia y valor no se vean viciados por el observador y así se trate de una muestra representativa y no manipulada [32].

De aquí podemos concluir que debido a que tratamos una propuesta de solución a un problema, nuestro universo de estudio se centra en dos objetivos: el primero relacionada con los procesos actuales de procesamiento de la información crítica del negocio y el segundo orientado en el sistema de tecnología que se recomienda para establecer la provisión de información a la gerencia.

Para el caso de la situación actual de los procesos que generan la información crítica del negocio se realizaron los cuestionarios con el personal involucrado. El cuestionario se dirigió a las 7 Coordinaciones que conforman la Gerencia de Mercadeo y Ventas de la Unidad de Negocios Empresa, con el fin de identificar la necesidad de contar con una herramienta confiable y rápida para el análisis de la información y la importancia y volumen de datos que manejan.

La muestra tomada para esta investigación fue del 100%, y es una población finita, es decir, porque se tiene plena identificación del total de la población, por lo tanto el nivel de confianza sobre los resultados obtenidos será del 100%.

Para el caso de la propuesta tecnológica se consideró la experiencia de las empresas filiales en esta materia y de la Unidad de Corporaciones de CANTV, lo cual sirvió de base para la propuesta realizada. En cuyo caso se realizó una entrevista con el personal de Corporaciones que es experto en materia de Data Warehouse, y proporcionó la información obtenida en el estudio desarrollado en esa área.

A continuación se realiza el proceso comprobatorio para obtener el tamaño de la muestra sin ajustar y la varianza.

1.- Determinar el tamaño de la muestra sin ajustar y la varianza.

2.- Determinar la muestra real.

3.- Sustituyendo tenemos:

Todo esto no lleva a deducir que para que la investigación se utilizará un muestra del 100%, es decir 7 coordinaciones.

Operacionalización de Variables.

Para entender mejor lo anterior podemos citar a Zorrilla y Torres (1992) que plantean lo siguiente: “Las variables son todo aquello que se puede medir, controlar o estudiar en una investigación. También puede afirmarse que las variables son características, atributos, rasgos, cualidades o propiedad que se dan en individuos, grupos u objetos. Es decir, las variables son características observables de algo y, a la vez, son susceptibles de cambios o variaciones.” (p. 62).

Soler (1997). Los factores que deben tenerse en cuenta en la operacionalización de una variable, son los siguientes:

· Definición Nominal: Es simplemente el nombre de la variable que debe medirse.

· Definición Operacional: Esta constituido por la dimensión que es un factor o rasgo de la variable que debe medirse y la cual permite establecer los indicadores, estos señalan como medir las dimensiones o rasgos de la variable; y por último el índice que es el resultado de la combinación de valores obtenidos por un individuo o elemento en cada uno de los indicadores propuestos para medir la variable.

Las variables se clasifican según su capacidad o nivel en que permitan medir los objetos, es decir, dependiendo de sus propias características o propiedades. A continuación estas se detallan:

· Variable Continua: Se presenta cuando el fenómeno a medir puede tomar valores cuantitativamente distintos. Ejemplos: la edad cronológica. Cuando se dice que las variables son continuas, supone que los fenómenos que señalan los indicadores de las variables son continuos. Las variables que se expresan cuantitativamente por medio de puntajes se les denomina continuas.

· Variables Discretas: Son aquellas que establecen categorías en términos no cuantitativos entre diversos individuos o elementos.

· Variables Individuales: Presentan las características o propiedad que caracteriza a individuos determinados, y puede ser: Absolutas, Relacionales, Comparativas, Contextuales.

· Variables Colectivas: Presentan las características o propiedades que distinguen a un grupo o colectivo determinado y puede ser: Analíticas, Estructurales, Globales.

· Variable antecedente: Es la que se supone como antecedente de otra, es decir que hay variables que son antecedentes de otras. Ejemplo: para realizar un aprendizaje se supone un grado mínimo de inteligencia. Por tanto, la variable inteligencia es un antecedente de la variable aprendizaje.

· Variable Independiente: Es la variable que antecede a una variable dependiente, la que se presenta como causa y condición de la variable dependiente, es decir, son las condiciones manipuladas por el investigador a fin de producir ciertos efectos.

· Variable Dependiente: Es la variable que se presenta como consecuencia de una variable antecedente. Es decir, que es el efecto producido por la variable que se considera independiente, la cual es manejada por el investigador.

· Variable intervinientes o Alterna: Es la variable que aparece interponiéndose entre la variable independiente y la variable dependiente y en el momento de relacionar las variables interviene forma notoria.

· Variables Extrañas: Cuando existe una variable independiente no relacionada con el propósito de estudio, pero que puede presentar efectos sobre la variable dependiente tenemos una variable extraña.

Para analizar cuales podrían ser las variables en estudio de la propuesta inicialmente planteada “Proveer a la Gerencia de Mercadeo y Ventas de CANTV del sector Empresas, información crítica del negocio, eficaz y eficientemente, para el proceso de toma de decisiones”, analizaremos el título en cuestión y resultan 3 variables importantes :

· Información crítica del negocio que es necesaria para la toma de decisiones de la Gerencia de Mercadeo y Ventas de la Unidad Empresas de Cantv.

· Frecuencia con la Gerencia necesita la información.

· Forma en que la Gerencia necesita la información.

Luego de identificar las variables, se procede a operacionalizarlas o descomponerlas en todos sus aspectos o dimensiones, con el objetivo de facilitar en el futuro la recolección de la información.

Padua (1979:38) plantea lo siguiente: “Una dimensión hace las veces de la cara de una moneda. Una variable puede tener una o varias facetas desde donde puede ser estudiada. El conjunto de estas facetas constituyen los rasgos característicos de la variable en estudio.”

Una vez extraídas las dimensiones, se realizará con ellas un proceso de descomposición similar al realizado para las variables, pero esta vez con el objetivo de identificar los Indicadores.

Ramírez (1999:125) comenta: “Un indicador podríamos conceptualizarlo como un referente empírico, concreto, tangible, cuya presencia en la realidad nos revela la presencia de la dimensión de la cual se desprende y, por ende, de la variable en estudio. Los indicadores son los aspectos mas concretos que defines una dimensión”.

El cuadro de operacionalización para este estudio y las variables mencionadas quedaría de la siguiente manera:

CAPITULO I

1.- Planteamiento del problema.

2.- Formulación del Problema.

3.- Sistematización del Problema

4.- Objetivo General del Problema.

5.- Objetivos Específicos

6.- Justificación de la Investigación

7.- Alcance

CAPITULO II

1.- Antecedentes

2.- Marco Teórico

Definición de Data Warehouse

Objetivos y ventajas del Data Warehouse

Definición de un Operational Data Store

Objetivos y Ventajas de un Operational Data Store

Procesos que componen un Data Warehouse

Procesos que componen un Operational Data Store

Glosario de Términos

3.- Términos Básicos

3.- Marco Metodológico

Clasificación de la investigación.

Población y Muestra

Operacionalización de Variables.

Sistema de Hipotesis

Técnicas y procedimientos