Archivo
Componentes de Oracle Endeca Information Discovery (OEID)
Oracle Endeca Information Discovery
- Oracle Endeca Information Discovery Studio. Es la herramienta para la creación y explotación de aplicaciones para descubrir información. Es 100% web y con ella, los usuarios de negocio podrán ir interrogando al motor, que les irá respondiendo y descubriéndo nuevos datos o relaciones que le llevarán a nuevas preguntas, para así ir tejiendo sobre la marcha, sin reglas preestablecidas, una red de nuevos conocimientos a medida que se va descubriendo la información. Las aplicaciones están compuestas por páginas que se organizan en pestañas que contienen los diferentes componentes gráficos que ofrecen las siguientes funcionalidades: navegar o buscar datos, mostrar información detallada, mostrar gráficas y otras representaciones de datos, manipular y analizar datos, resaltar datos específicos. Como complemento para agilizar el desarrollo y dar mayor independencia a los usuarios, dispone del Provisioning Service, una herramienta que permite a los analistas de negocio subir sus propias hojas de cálculo y empezar a crear sus aplicaciones a partir de ellas. Cabe destacar también que ofrece integración SOA.
- Oracle Endeca Information Discovery Integrator. Mediante el Integrator Acquisition System (IAS) proporciona las herramientas necesarias para la adquisición (desde sistema de ficheros, gestores de contenidos, servidores Web y orígenes de datos propietarios) y enriquecimiento de datos (normalización, cleansing, extracción de tags, análisis sentimientos, descubrir ubicaciones geográficas), más próximas a un perfil de usuario de TI, con necesidades o exigencias más complejas: porque requieren una cierta orquestación o de un proceso más elaborado para su extracción.
Oracle Endeca Server (motor MDEX)
Siendo SOA nativo, articula su funcionamiento a través de diversos web services, algunos de uso interno, y otros, como los que destacamos en el gráfico, lo comunican con el exterior: el WS Data Ingest es el que recibe los datos, bien provengan de un usuario de negocio vía Provisioning Service o de un origen más complejo que haya sido procesado mediante Integrator. Como alternativa a este WS, existe también un proceso llamado Bulk Load Interface, diseñado para cargas masivas de datos desde disco. La comunicación con la capa de aplicación, se realiza a través del Conversation WS.
Conexión JDBC a SQL Server desde BI Publisher
El objetivo de este post es ilustrar con un ejemplo práctico la manera de configurar BI Publisher para acceder a cualquier motor de BD que disponga de driver JDBC.
Utilizaremos como origen de datos para el ejemplo Microsoft SQL Server Express Edition 2008 R2.
La clave de esta tarea es que BI Publisher (BIP en adelante) tenga acceso al driver JDBC. Para ello, sólo necesitamos copiarlo al directorio LIB de la instalación, teniendo en cuenta que la ubicación varía en función de la edición de BIP que tengamos instalada: en el caso de la versión server será $MIDDLEWARE_HOME\user_projects\domains\bifoundation_domain\lib, mientras que en la versión trial será un path similar a C:\Program Files\Oracle\BI Publisher Trial Edition\bip\server\domains\bipdomain\lib.
Una vez copiado el driver, es necesario reiniciar el servidor (weblogic) para que cargue el nuevo driver.
Siguiendo las instrucciones de instalación del driver JDBC de Microsoft (en este ejemplo sqljdbc_4.0.2206.100_enu.exe), obtendremos 2 archivos .jar en el directorio de instalación que hayamos seleccionado.
Deberemos tener en cuenta que si la versión de JVM que utilizamos es >= 1.6 habrá que utilizar el driver sqljdbc4.jar, evitando copiar (o eliminando si ya ha sido copiado) el archivo sqljdbc.jar (puesto que BIP cargaría ambos en memoria y podría intentar utilizar en primer lugar el driver obsoleto).
Nos aseguraremos de que SQL Server está configurado para admitir peticiones por el protocolo TCP/IP y en su puerto estándar, ya que probablemente la instalación por defecto no lo habrá habilitado.
Y… ¡Ya hemos terminado! ¿Puede ser así de sencillo?

Para verificarlo hemos creado una conexión con el tipo de driver apropiado y ejecutado el test de conexión, comprobando que se ha realizado con éxito.
Una vez definida la conexión procedemos a crear una pequeña tabla en nuestra BD de ejemplo, donde almacenaremos los nombres de nuestras BD favoritas. Seguidamente creamos un data model y un sencillo report de ejemplo que liste el contenido de la tabla.

El mismo procedimiento servirá para cualquier origen de datos que disponga de driver JDBC.
Oracle entre los líderes visionarios del segmento BI/analítico segun Gartner
De acuerdo al último Cuadrante Mágico (Magic Quadrant) de Gartner (1) para la plataforma BI y Analítica publicado el pasado 5 de febrero, una de las constantes de este segmento en 2012 fue la creciente popularización del “descubrimiento de datos” como nueva parte fundamental de la arquitectura BI y analítica. Así mismo hubo una mayor actividad en las áreas de análisis en tiempo real, de contenidos, y predictiva.
En estos momentos la mayor actividad en el segmento BI/Analítico viene de organizaciones en evolución desde el estado de un análisis descriptivo de su información a uno más maduro donde el diagnóstico es clave. Oracle, como uno de los líderes en este segmento, ha respondido a esta popularización del “descubrimiento de datos” con la adquisición de Endeca, que en combinación con la facilidad de uso de las herramientas de su suite de BI , y con sus soluciones hardware para almacenamiento y procesamiento extremos (Exalytics, Exalogic, etc.), está contribuyendo a la aceleración en la descentralización de sistemas, así como a la potenciación de soluciones BI y análisis. En definitiva, está posibilitando a un creciente número de organizaciones la realización de diagnósticos analíticos.
El cuadrante de Gartner sitúa a Oracle en el grupo de líderes visionarios:
Las fortalezas de Oracle en este segmento según Gartner son:
- Oracle Business Intelligence Foundation Suite, con su componente principal Oracle Business Intelligence Enterprise Edition (OBIEE), es una plataforma BI y analítica apropiada para despliegues a gran escala, gestionada por IT de manera centralizada, en la que las múltiples funcionalidades de BI, analíticas y CPM, así como su optimización, se basan en la pila tecnológica de Oracle. Las instalaciones de OBIEE se encuentran entre las más grandes en términos de número de usuarios, volúmenes de datos y tamaño de compañías. Un número superior a la media de los encuestados veían a OBIEE como su standard de BI.
- Los clientes que eligieron Oracle lo hicieron por la integración y optimizaciones de la Pila Tecnológica de Oracle, que es una diferencia clave en la propuesta de valor de la solución BI y analítica de Oracle, especialmente entre la base instalada de Oracle E-Business Suite (EBS), PeopleSoft, JD Edwards, Siebel, Fusion (en el propio CPD o en la nube) y otras aplicaciones Enterprise. Para estas instalaciones se ofrecen más de 80 aplicaciones analíticas, tanto para ETL, como KPI’s, reporting, etc. Adicionalmente a la optimización que proporciona la Pila Software de Oracle, el más reciente Engineered System de Oracle, Exalytics In-Memory Machine, añade una combinación de hardware y software optimizada (que incluye OBIEE, Oracle Essbase, Oracle Endeca Information Discovery, y software in-memory basado en TimesTen), diseñada para cargas analíticas grandes y complejas, incluyendo planificaciones dinámicas y análisis de escenarios what-if (qué-pasaría-si).
- Oracle tiene una larga trayectoria como líder de gestión y análisis de información estructurada (principalmente de ámbito transacciones empresariales), pero la adquisición en 2011 de Endeca (actualmente denominada Oracle Endeca Information Discovery) ha demostrado visión de producto, y compromiso con la creciente importancia y potencial valor para los clientes Oracle de incorporar, relacionar y analizar datos no estructurados, lo que se adecua a nuevas ideas o perspectivas de negocio. Endeca ha venido a llenar el vacío de este tipo de soluciones en Oracle, estando en el road map estratégico su integración dentro de la pila formada por el gestor de manejo de datos, la capa de middleware y las aplicaciones empresariales mediante las recientes EBS extensions para Oracle Endeca. Adicionalmente Oracle ha introducido Oracle Big Data Appliance para soportar NoSQL y Hadoop. Más de un 22% de los clientes de OBIEE han respondido que compran esta visión (entre los más numerosos de la encuesta) indicando tener planes de despliegue de análisis de contenidos dentro de los siguientes 12 meses.
Puede leer el artículo completo de Gartner en este enlace.
(1) Gartner Magic Quadrant (MQ) es la denominación registrada de una serie de informes de estudios de mercado publicados por Gartner Inc., una firma de los EEUU dedicada a investigación de mercado y asesoramiento.
Oracle Warehouse Builder (OWB) vs Oracle Data Integrator (ODI)
En la implementación de un Data Warehouse (DW) es imprescindible disponer de una herramienta para la extracción, transformación y carga de los datos. Este proceso se conoce por el acrónimo ETL (del inglés Extraction-Transformation-Loading).
Históricamente la herramienta ETL de Oracle ha sido Oracle Warehouse Builder (OWB). Lanzado en el 2000, OWB es el producto tradicional para la creación del esquema del DW, definición de dimensiones y medidas, mapeo de las fuentes de datos y scheduling de los procesos de carga para bases de datos Oracle.
Con la adquisición de la empresa Sunopsis en octubre 2006, Oracle lanza en el mercado otra herramienta ELT, Oracle Data Integrator (ODI). ODI introduce el concepto innovador de E-LT (Extract-Load-Transform). Las transformaciones de los datos pueden ser realizadas directamente en el sistema destino, sin necesidad de un área intermedia. Otro punto de fuerza de la nueva solución es la capacidad de conectar fuentes de datos heterogéneas, superando la limitación de OWB de utilizar la base de datos Oracle como único sistema target.
En el 2009 Oracle definió ODI y OWB como dos componentes de ODI-EE (Oracle Data Integrator Enterprise Edition) y declaró que los dos productos iban a ser fusionados en la misma plataforma de integración. La estrategia de Oracle a largo plazo es reemplazar por completo OWB con ODI.
En el momento actual, OWB y ODI siguen formando parte de la oferta de Oracle como dos productos independientes. La última versión de ODI es la 11g y está totalmente integrada en la plataforma Fusion Middleware.
OWB 11gR2 está incluido en la licencia del database 11gR2 e incluye algunas features que permitirán una migración más ágil hacia ODI. Sin embargo, todavía no existen herramientas ni Oracle ha especificado las modalidades para realizar tal migración.
Los clientes que se enfrentan a la implementación de un nuevo Data Warehouse o necesitan desarrollar un nuevo proceso de ETL tienen que elegir entre dos productos que tienen muchas características similares. Para poder asesorar el cliente en la elección de herramienta que más se ajusta a las necesidades del proyecto, vamos a analizar en la siguiente tabla los pros y los contras de las dos.
Oracle Endeca Information Discovery, una “implementación software” de Big Data
Hace unos días, comentando con un compañero sobre el concepto Big Data y las soluciones que lo implementan para su explotación (p.e. Oracle Big Data), nos dimos cuenta del paralelismo existente entre el desarrollo de un proyecto big data y la implementación de un proyecto con Oracle Endeca Information Discovery, así que nos pareció interesante compartirlo en el blog.
Principales características que definen un entorno big data:
- Volumen: Millones de registros generados por todo tipo de automatismos, aplicaciones corporativas y los innumerables internautas participando en la web y redes sociales.
- Velocidad de generación: Empezando por “todo el potencial” de las máquinas que trabajan a 24×7, hasta los más de 8Tb diarios generados por ejemplo por twitter a partir de sus mensajes de 140 caracteres.
- Variedad: Contrastando con los modelos clásicos, cada nuevo servicio añade nuevos tipos de datos no estructurados y que evolucionan rápidamente adaptándose a nuevos requerimientos.
- Valor: Aunque difícil de medir y aún más difícil de valorar, a día de hoy es innegable que entre esa cantidad ingente de datos en formatos no tradicionales, se esconde información útil.
El objetivo de toda plataforma big data es analizar toda esa información para, en combinación con la información estructurada tradicional, lograr un mayor conocimiento del negocio que permita mejorar la capacidad de decisión de la organización.
A alto nivel, sin entrar en detalles sobre el hardware y software necesario para abordar la problemática intrínseca a las características descritas, podemos decir que el proceso de implementación de una solución big data seguiría esta secuencia:
- Adquisición de datos
- Organización de datos
- Análisis de la información
Qué, curiosamente, coincide con las características de la aplicación Oracle Endeca Information Discovery, ya que:
- Combina información estructurada o desestructurada (incluso con origen en tecnologías diferentes)
- Organiza la información automáticamente (para su búsqueda y descubrimiento)
- Hace rápidamente accesible la información (a través de una herramienta de análisis)
La existencia de un paralelismo tan claro entre los dos procesos nos llevó a la conclusión de que, si bien abordar un proyecto de big data desde cero puede resultar una tarea ardua que requiera además de un presupuesto sustancioso, existe una alternativa software, de menor complejidad técnica, con menor requerimiento de infraestructuras y, por lo tanto, de menor coste y más rápida implementación.
Oracle Endeca Information Discovery está diseñado para satisfacer la misma necesidad funcional (análisis de datos) con los mismos requerimientos (múltiples orígenes, tecnologías diversas, datos no estructurados, …) pero siendo una implementación software que podría ser absolutamente satisfactoria con volumenes de datos a su alcance (ya que satisface el resto de requerimientos), y más interesante aún, como herramienta de prototipado en este tipo de proyectos.
Changed Data Capture (CDC) con Oracle Data Integrator (ODI)
En los proyectos de integración de datos, una optimización muy importante es la detección de cambios (CDC) producidos por otras aplicaciones en el origen de datos, ya que si somos capaces de aislar los registros modificados (nuevos o eliminados) podremos reducir drásticamente el volumen de datos a procesar para tener las BD de origen y destino “sincronizadas”, tratando sólo los datos realmente necesarios.
En líneas generales, un mecanismo de CDC debería:
- Detectar y registrar los cambios producidos en el origen.
- Trasladar la información modificada a la BD destino.
- Purgar el registro de cambios una vez procesados en destino.
CDC es una de las características estándar de Oracle Data Integrator (ODI), y vamos a explicar a continuación su arquitectura y funcionamiento.
ODI ofrece dos modos de registro de cambios (journalizing) en el origen de datos:
- Simple: Registra los cambios en cada tabla de manera independiente.
- Consistente: Registra los cambios en conjuntos de tablas, manteniendo la integridad referencial en el conjunto.
CDC funciona siguiendo un modelo de publicación/suscripción, en el que participan los siguientes elementos:
- Journals (registro de cambios): Una relación de registros modificados con el tipo de cambio (alta/baja/modificación).
- Procesos de captura: Son los responsables de mantener los “Journals” y pueden implementarse de diferentes maneras, condicionados principalmente por la tecnología de la BD origen. Pueden capturar los cambios mediante triggers en diversos motores de BD (método intrusivo, ya que impacta notablemente en el rendimiento de la BD origen) o analizando los logs de transacciones (siendo la manera óptima ya que su impacto es insignificante). Disponible para Oracle >= 10.2.0.4, IBM DB2/400 y mediante un conector (a licenciar) también para IBM DB2/Mainframe, IMS DB, VSAM Batch y CICS, MS-SQL Server >= 2005. Los cambios en un “Journal” sólo se capturan cuando tiene algún Suscriptor registrado.
- Suscriptores: Son las entidades (aplicaciones, procesos de integración, …) que van a consumir la información de los “Journals”. Una vez que el último suscriptor ha procesado todos los cambios registrados, éstos son purgados del “Journal”.
- Vistas del “Journal”: Son la interface de los suscriptores al contenido del “Journal”, a través de ellas se da acceso a los cambios registrados para su consumo.

El proceso básico de configuración de CDC es el siguiente:
- Configurar parámetros de CDC en el modelo de datos origen (modo de Journalizing y KM –Knowledge Module– correspondiente a la tecnología a utilizar en la captura, trigger o log, y configurar sus opciones).
- Añadir las tablas para las que se desean registrar los cambios.
- Si el modo de Journalizing elegido es el consistente, establecer el orden en qué procesar las tablas (de manera que se asegure la integridad referencial).
- Añadir suscriptores (a una tabla o a un modelo, si hemos elegido el modo consistente).
- Iniciar el Journalizing (la escucha de los procesos de captura, especificando el contexto de ejecución y el Agente que se responsabilizará de las actualizaciones).
El proceso de journalizing requiere de unas estructuras de datos, que son creadas automáticamente al iniciarlo y que se ubican en un esquema independiente a modo de staging area (diferente a la staging area del modelo destino utilizada en la integración), de manera que todos los objetos temporales necesarios son creados en ese esquema.
Únicamente en el caso de captura de cambios mediante triggers se modifica el esquema de datos origen, añadiéndole los triggers. Al eliminar el “Journal”, dichas estructuras son eliminadas también de manera automática.
Cuando existan varios contextos de ejecución, el despliegue del “Journal” en un contexto puede automatizarse en forma de paquete, y de idéntica manera, también su eliminación.
Una vez configurado el Journalizing, estará listo para ser utilizado en el desarrollo de interfaces.
De manera resumida, la utilización de CDC se traduce en la aparición en las tablas que están bajo Journalizing de atributos adicionales para su filtrado y proceso selectivo, excluyendo los registros no modificados. También contaremos con la posibilidad de utilizar las Journalizing Tools en el desarrollo de paquetes, para controlar el flujo de ejecución (y decidir si existen o no cambios para una tabla y si se debe lanzar o no su interface de carga). Al final del flujo de carga se invocará el proceso de purga del “Journal” para que elimine los cambios ya procesados, una vez concluido el tratamiento por el último suscriptor.
Integración de ODI 11g Standalone Agent con OPMN
La misión de un ODI Agent es ejecutar los procesos ETL asignados a la hora programada.
El Standalone Agent es multiplataforma y ligero, por lo que cumple muy bien con su cometido… siempre y cuando esté en ejecución!
En función de la plataforma de ejecución, iniciar un Agent puede ser tan simple como añadirlo a los scripts de inicio del sistema en Linux o a los servicios de Windows, caso en el cual necesitaremos algún software adicional que permita lanzar el proceso java del Agent como servicio.
En la versión 10g había algunas herramientas de terceros y procesos descritos y soportados por Oracle para hacerlo, pero no pasa lo mismo en la versión 11g, en la que el procedimiento soportado para iniciar los Agents como servicio es integrarlos con OPMN.
Una vez asimilado el engorro de esta instalación adicional, nos damos cuenta de sus beneficios:
- El Agent se inicia con el sistema
- OPMN monitoriza el Agent levantándolo en caso de caída
por lo que recomendamos realizar también esta integración en sistemas Linux, ya que salvo problemas permanentes que impidan la comunicación con el repositorio de ODI en el inicio, OPMN nos asegurará que el Agent se esté ejecutando después de cualquier incidencia tipo cierre de sesión, kill del proceso, etc.
La única consideración adicional es que en caso de modificación de alguno de los parámetros de configuración habitualmente ubicados en ODIPARAMS, afecte también a la configuración de OPMN.

Introducción a Oracle Endeca Information Discovery (EID)
En octubre de 2011 Oracle anunció la adquisición de Endeca. Desde finales de abril la última versión de Oracle Endeca Information Discovery (EID) ya está disponible para su descarga a través de e-Delivery, y más recientemente, la documentación en OTN. La curiosidad nos ha llevado a instalar una versión para tener una toma de contacto con el producto, tras la que podemos presentar la siguiente introducción.
¿Cómo encaja Endeca en el panorama del Business Intelligence actual de Oracle?
Endeca viene a complementar la oferta existente, entiéndase OBI, puesto que son herramientas de características diferentes, lo que permitirá a los clientes de Oracle elegir aquella que mejor se ajuste a cada necesidad. Si se busca una herramienta que permita alcanzar nuevas perspectivas y respuestas a preguntas difíciles de prever anticipadamente de manera rápida y ágil en un corto tiempo, Endeca es la herramienta. En cambio, si las necesidades de la organización están más orientadas a establecer una reglas de negocio sólidas, con definiciones consistentes almacenadas en un repositorio de metadatos corporativo, construir un sistema de scorecarding complejo, cuadros de mando corporativos o informes pixel-perfect, entonces debemos mirar hacia OBI.
Las características más destacadas de Oracle Endeca Information Discovery son:
- Rapidez en el desarrollo de proyectos
- Agilidad en la exploración de datos
- Da acceso a la información relevante
¿En qué se basa su rapidez?
- No necesita desarrollar un modelo de datos
- Tiene una interface de desarrollo rápido
- Facilidad de utilización, con una curva de aprendizaje rápido
- Alto rendimiento en la ejecución
¿Cuáles son sus características para la exploración de datos?
- Interface de usuario orientada a la búsqueda. Se apoya en el motor Endeca Server, que permite combinar las búsquedas con el análisis propio de Business Intelligence.
- Tras las búsquedas, mediante navegaciones guiadas, ayuda a ir refinando los datos encontrados hasta lograr descubrir la información relevante.
- Visualiza los resultados en formatos que facilitan la exploración de conjuntos de información (todos los elementos son clicables para continuar profundizando en la exploración).
¿Cómo explorar toda la información relevante?
- EID da acceso a cualquier tipo de información, tanto estructurada como desestructurada, permitiendo cargar y relacionar ambos tipos de información, haciéndolos accesibles en un mismo sistema.
- Enriqueciendo la información mediante la captura de datos en la red que incorpora al sistema y hace accesibles desde la interface de usuario.
Arquitectura de Endeca Information Discovery
EID está compuesta por los siguientes módulos:
- Studio: Herramienta de autoservicio que permite a los propios analistas de negocio la composición y configuración de aplicaciones, vistas y cuadros de mando.
- Oracle Endeca Server: Motor híbrido de acceso a datos que combina las capacidades de un buscador y características OLAP.
- Integration Suite: Una extensa herramienta que incluye una solución ETL corporativa, Integrator (basado en CloverETL), que incluye conectores para fuentes de información tanto estructurada como desestructurada, bibliotecas para el enriquecimiento de datos, y para el propio Endeca server.
Oracle BI Scorecards and Strategy Management
En su empresa, ¿controla sus análisis en base a sus objetivos? ¿Se basa en datos o juega a los dados? ¿Valora sus datos como un activo estratégico? ¿Establece una estrategia para cumplir su propósito? ¿Mide y controla las metas y los objetivos?
Básicamente sólo se puede gestionar lo que se puede medir. Debido a ello, ¿qué le parecería disponer de un Balanced Scorecard (BSC) dónde de una manera rápida, directa, predictiva y visual obtuviese la información que necesita su empresa?
Oracle BIEE 11g ofrece estos análisis gracias a Oracle BI Scorecards and Strategy Management, que es la solución de Oracle para la implementación de BSC´s, y que le ayudará a controlar los objetivos, metas y tendencias que necesita su empresa para poder decidir rápido y con el mínimo riesgo. A continuación mostramos un ejemplo.

Para diseñar estos análisis, la pieza fundamental es basarlos en Key Performance Indicators (KPI), que se definen a partir de objetivos y límites establecidos, y que va a determinar en qué situación se encuentra su empresa sobre la línea empresarial a seguir.

Agregar, Agregar, Agregar (o cómo acelerar un sistema de BI)
La rapidez (o lentitud) de un sistema de Business Intelligence está condicionada por diversos factores entre los que destacan el hardware disponible, el volumen de datos a analizar y el correcto diseño del data.
Supongamos (y no es poco) que hayamos conseguido la configuración óptima (!!!) de estos factores acorde a nuestro presupuesto, pero que aún así, el rendimiento del sistema no es satisfactorio.
¿Significa esto que hemos agotado nuestras posibilidades y que ha fracasado nuestro proyecto de Business Intelligence?
No. Cuando no es posible mover los datos más rápido, la mejora del rendimiento de un sistema pasa por mover menos datos.
Para reducir el tiempo de acceso a los datos, introduciremos una optimización de diseño: la creación de tablas agregadas (tablas que resumen los datos de las tablas de hechos de un datawarehouse/datamart con menor nivel de detalle, por lo que tienen menor volumen). Aunque mínimamente, estas tablas deberán ser consideradas y mantenidas tanto en las herramientas de diseño, como en la documentación y el desarrollo de los procesos de ETL, etc.
Para que este esfuerzo adicional resulte en una optimización efectiva del sistema de BI, es preciso que éste sea lo suficientemente inteligente como para que, basándose únicamente en los hechos, métricas y agregaciones utilizados por cualquier análisis, sepa escoger de manera totalmente automática y transparente al usuario, el conjunto de tablas que pueda responder de manera más eficiente a la petición. En cualquier otro caso, habrá que dar formación y soporte a los usuarios para transmitirles el conocimiento necesario sobre el modelo de datos para que sepan escoger las tablas agregadas más adecuadas a cada análisis que pretendan realizar, compromentiendo la viabilidad de la mejora.
La tecnología Oracle puede ayudarnos en la realización de la mayoría de tareas relacionadas con la construcción, mantenimiento y utilización de tablas agregadas; desde la identificación de las consultas más habituales (propósito para la que dispone de varias herramientas), pasando por los agregados que conviene crear, la sintaxis para la creación de las vistas materializadas que hayamos decidido, hasta llegar a asumir la compleja y delicada responsabilidad de elegir las tablas agregadas que pueden responder de manera más eficientemente a las consultas de análisis de los usuarios.
Vamos a centrarnos en los diferentes mecanismos que Oracle pone a nuestra disposición para sacar provecho de la agregación como recurso para acelerar la ejecución de consultas:
Agregar (durante el ETL)
Aunque sería un paso previo a la situación descrita hasta el momento, las herramientas ETL de Oracle como Data Integrator, nos pueden ayudar a agregar los datos que van a poblar el data, siempre conservando una granularidad ajustada a las necesidades de la organización, pero con menor nivel de detalle que en el sistema origen (podríamos por ejemplo, resumir todos los pedidos diarios de un cliente y un producto en el sistema transaccional, como un único registro en el data).






