Archivo

Archivo de Autor

Componentes de Oracle Endeca Information Discovery (OEID)

Para ir conociendo un poco más sobre Endeca, vamos a explicar a grandes rasgos cuáles son sus componentes y qué aporta cada uno de ellos.
En primer lugar, habrá que distinguir entre la parte cliente (Endeca Information Discovery Studio) y la parte servidor (Endeca Server), puesto que podemos utilizarlos conjuntamente, o utilizar el Server como motor de datos para otras aplicaciones.
En el gráfico a continuación, representamos cada uno de los componentes, ubicándolos en la capa funcional correspondiente.

Avanttic_Endeca_Componentes

Oracle Endeca Information Discovery

Se compone a su vez de dos productos: Studio y Integrator, que actúan de interfaces de Endeca Server tal y como veremos a continuación:
  • Oracle Endeca Information Discovery Studio. Es la herramienta para la creación y explotación de aplicaciones para descubrir información. Es 100% web y con ella, los usuarios de negocio podrán ir interrogando al motor, que les irá respondiendo y descubriéndo nuevos datos o relaciones que le llevarán a nuevas preguntas, para así ir tejiendo sobre la marcha, sin reglas preestablecidas, una red de nuevos conocimientos a medida que se va descubriendo la información. Las aplicaciones están compuestas por páginas que se organizan en pestañas que contienen los diferentes componentes gráficos que ofrecen las siguientes funcionalidades: navegar o buscar datos, mostrar información detallada, mostrar gráficas y otras representaciones de datos, manipular y analizar datos, resaltar datos específicos. Como complemento para agilizar el desarrollo y dar mayor independencia a los usuarios, dispone del Provisioning Service, una herramienta que permite a los analistas de negocio subir sus propias hojas de cálculo y empezar a crear sus aplicaciones a partir de ellas. Cabe destacar también que ofrece integración SOA.
  • Oracle Endeca Information Discovery Integrator. Mediante el Integrator Acquisition System (IAS) proporciona las herramientas necesarias para la adquisición (desde sistema de ficheros, gestores de contenidos, servidores Web y orígenes de datos propietarios) y enriquecimiento de datos (normalización, cleansing, extracción de tags, análisis sentimientos, descubrir ubicaciones geográficas), más próximas a un perfil de usuario de TI, con necesidades o exigencias más complejas: porque requieren una cierta orquestación o de un proceso más elaborado para su extracción.

Oracle Endeca Server (motor MDEX)

Es el motor de BD de búsqueda-analítico que se encarga de organizar datos complejos y variados provenientes de orígenes diversos en un modelo extremadamente flexible que reduce la necesidad de modelar los datos. Es muy escalable (puede tener múltiples nodos) y permite explorar y navegar por los datos de manera espontánea y sin restricciones, respondiendo rápidamente a las preguntas que van surgiendo tras cada nueva conclusión.
Cada aplicación cuenta con un Data Domain, el conjunto de datos y metadatos gestionado por Endeca Server. Por cada data domain existirán n procesos DGraph, que almacenan los índices creados tras la “ingesta” de información, y que serán los responsables de procesar las peticiones de los usuarios a medida que avanzan en el análisis y el descubrimiento de información.

Siendo SOA nativo, articula su funcionamiento a través de diversos web services, algunos de uso interno, y otros, como los que destacamos en el gráfico, lo comunican con el exterior: el WS Data Ingest es el que recibe los datos, bien provengan de un usuario de negocio vía Provisioning Service o de un origen más complejo que haya sido procesado mediante Integrator. Como alternativa a este WS, existe también un proceso llamado Bulk Load Interface, diseñado para cargas masivas de datos desde disco. La comunicación con la capa de aplicación, se realiza a través del Conversation WS.

Categorías:BI Etiquetas: , , ,

Conexión JDBC a SQL Server desde BI Publisher

jdbc logoEl objetivo de este post es ilustrar con un ejemplo práctico la manera de configurar BI Publisher para acceder a cualquier motor de BD que disponga de driver JDBC.
Utilizaremos como origen de datos para el ejemplo Microsoft SQL Server Express Edition 2008 R2.

La clave de esta tarea es que BI Publisher (BIP en adelante) tenga acceso al driver JDBC. Para ello, sólo necesitamos copiarlo al directorio LIB de la instalación, teniendo en cuenta que la ubicación varía en función de la edición de BIP que tengamos instalada: en el caso de la versión server será $MIDDLEWARE_HOME\user_projects\domains\bifoundation_domain\lib, mientras que en la versión trial será un path similar a C:\Program Files\Oracle\BI Publisher Trial Edition\bip\server\domains\bipdomain\lib.
Una vez copiado el driver, es necesario reiniciar el servidor (weblogic) para que cargue el nuevo driver.

Siguiendo las instrucciones de instalación del driver JDBC de Microsoft (en este ejemplo sqljdbc_4.0.2206.100_enu.exe), obtendremos 2 archivos .jar en el directorio de instalación que hayamos seleccionado.
Deberemos tener en cuenta que si la versión de JVM que utilizamos es >= 1.6 habrá que utilizar el driver sqljdbc4.jar, evitando copiar (o eliminando si ya ha sido copiado) el archivo sqljdbc.jar (puesto que BIP cargaría ambos en memoria y podría intentar utilizar en primer lugar el driver obsoleto).
Nos aseguraremos de que SQL Server está configurado para admitir peticiones por el protocolo TCP/IP y en su puerto estándar, ya que probablemente la instalación por defecto no lo habrá habilitado.

Y… ¡Ya hemos terminado! ¿Puede ser así de sencillo?

JDBC Setup

Para verificarlo hemos creado una conexión con el tipo de driver apropiado y ejecutado el test de conexión, comprobando que se ha realizado con éxito.
Una vez definida la conexión procedemos a crear una pequeña tabla en nuestra BD de ejemplo, donde almacenaremos los nombres de nuestras BD favoritas. Seguidamente creamos un data model y un sencillo report de ejemplo que liste el contenido de la tabla.

Ejemplo de report
El mismo procedimiento servirá para cualquier origen de datos que disponga de driver JDBC.

Categorías:BI Etiquetas: , , , , ,

Oracle Endeca Information Discovery, una “implementación software” de Big Data

Hace unos días, comentando con un compañero sobre el concepto Big Data y las soluciones que lo implementan para su explotación (p.e. Oracle Big Data), nos dimos cuenta del paralelismo existente entre el desarrollo de un proyecto  big data y la implementación de un proyecto con Oracle Endeca Information Discovery, así que nos pareció interesante compartirlo en el blog.

Principales características que definen un entorno big data:

  • Volumen: Millones de registros generados por todo tipo de automatismos, aplicaciones corporativas y los innumerables internautas participando en la web y redes sociales.
  • Velocidad de generación: Empezando por “todo el potencial” de las máquinas que trabajan a 24×7, hasta los más de 8Tb diarios generados por ejemplo por twitter a partir de sus mensajes de 140 caracteres.
  • Variedad: Contrastando con los modelos clásicos, cada nuevo servicio añade nuevos tipos de datos no estructurados y que evolucionan rápidamente adaptándose a nuevos requerimientos.
  • Valor: Aunque difícil de medir y aún más difícil de valorar, a día de hoy es innegable que entre esa cantidad ingente de datos en formatos no tradicionales, se esconde información útil.

El objetivo de toda plataforma big data es analizar toda esa información para, en combinación con la información estructurada tradicional, lograr un mayor conocimiento del negocio que permita mejorar la capacidad de decisión de la organización.

A alto nivel, sin entrar en detalles sobre el hardware y software necesario para abordar la problemática intrínseca a las características descritas, podemos decir que el proceso de implementación de una solución big data seguiría esta secuencia:

  1. Adquisición de datos
  2. Organización de datos
  3. Análisis de la información

Qué, curiosamente, coincide con las características de la aplicación Oracle Endeca Information Discovery, ya que:

  1. Combina información estructurada o desestructurada (incluso con origen en tecnologías diferentes)
  2. Organiza la información automáticamente (para su búsqueda y descubrimiento)
  3. Hace rápidamente accesible la información (a través de una herramienta de análisis)

OEID_BigData

La existencia de un paralelismo tan claro entre los dos procesos nos llevó a la conclusión de que, si bien abordar un proyecto de big data desde cero puede resultar una tarea ardua que requiera además de un presupuesto sustancioso, existe una alternativa software, de menor complejidad técnica, con menor requerimiento de infraestructuras y, por lo tanto, de menor coste y más rápida implementación.

Oracle Endeca Information Discovery está diseñado para satisfacer la misma necesidad funcional (análisis de datos) con los mismos requerimientos (múltiples orígenes, tecnologías diversas, datos no estructurados, …) pero siendo una implementación software que podría ser absolutamente satisfactoria con volumenes de datos a su alcance (ya que satisface el resto de requerimientos), y más interesante aún, como herramienta de prototipado en este tipo de proyectos.

Categorías:BI Etiquetas: , , ,

Changed Data Capture (CDC) con Oracle Data Integrator (ODI)

diciembre 13, 2012 1 comentario

cdc_petitEn los proyectos de integración de datos, una optimización muy importante es la detección de cambios (CDC) producidos por otras aplicaciones en el origen de datos, ya que si somos capaces de aislar los registros modificados (nuevos o eliminados) podremos reducir drásticamente el volumen de datos a procesar para tener las BD de origen y destino “sincronizadas”, tratando sólo los datos realmente necesarios.

En líneas generales, un mecanismo de CDC debería:

  • Detectar y registrar los cambios producidos en el origen.
  • Trasladar la información modificada a la BD destino.
  • Purgar el registro de cambios una vez procesados en destino.

CDC es una de las características estándar de Oracle Data Integrator (ODI), y vamos a explicar a continuación su arquitectura y funcionamiento.

ODI ofrece dos modos de registro de cambios (journalizing) en el origen de datos:

  • Simple: Registra los cambios en cada tabla de manera independiente.
  • Consistente: Registra los cambios en conjuntos de tablas, manteniendo la integridad referencial en el conjunto.

CDC funciona siguiendo un modelo de publicación/suscripción, en el que participan los siguientes elementos:

  • Journals (registro de cambios): Una relación de registros modificados con el tipo de cambio (alta/baja/modificación).
  • Procesos de captura: Son los responsables de mantener los “Journals” y pueden implementarse de diferentes maneras, condicionados principalmente por la tecnología de la BD origen. Pueden capturar los cambios mediante triggers en diversos motores de BD (método intrusivo, ya que impacta notablemente en el rendimiento de la BD origen) o analizando los logs de transacciones (siendo la manera óptima ya que su impacto es insignificante). Disponible para Oracle >= 10.2.0.4, IBM DB2/400 y mediante un conector (a licenciar) también para IBM DB2/Mainframe, IMS DB, VSAM Batch y CICS, MS-SQL Server >= 2005. Los cambios en un “Journal” sólo se capturan cuando tiene algún Suscriptor registrado.
  • Suscriptores: Son las entidades (aplicaciones, procesos de integración, …) que van a consumir la información de los “Journals”. Una vez que el último suscriptor ha procesado todos los cambios registrados, éstos son purgados del “Journal”.
  • Vistas del “Journal”: Son la interface de los suscriptores al contenido del “Journal”, a través de ellas se da acceso a los cambios registrados para su consumo.

cdc_flux

El proceso básico de configuración de CDC es el siguiente:

  • Configurar parámetros de CDC en el modelo de datos origen (modo de Journalizing y KM –Knowledge Module– correspondiente a la tecnología a utilizar en la captura, trigger o log, y configurar sus opciones).
  • Añadir las tablas para las que se desean registrar los cambios.
  • Si el modo de Journalizing elegido es el consistente, establecer el orden en qué procesar las tablas (de manera que se asegure la integridad referencial).
  • Añadir suscriptores (a una tabla o a un modelo, si hemos elegido el modo consistente).
  • Iniciar el Journalizing (la escucha de los procesos de captura, especificando el contexto de ejecución y el Agente que se responsabilizará de las actualizaciones).

El proceso de journalizing requiere de unas estructuras de datos, que son creadas automáticamente al iniciarlo y que se ubican en un esquema independiente a modo de staging area (diferente a la staging area del modelo destino utilizada en la integración), de manera que todos los objetos temporales necesarios son creados en ese esquema.

Únicamente en el caso de captura de cambios mediante triggers se modifica el esquema de datos origen, añadiéndole los triggers. Al eliminar el “Journal”, dichas estructuras son eliminadas también de manera automática.

Cuando existan varios contextos de ejecución, el despliegue del “Journal” en un contexto puede automatizarse en forma de paquete, y de idéntica manera, también su eliminación.

Una vez configurado el Journalizing, estará listo para ser utilizado en el desarrollo de interfaces.

De manera resumida, la utilización de CDC se traduce en la aparición en las tablas que están bajo Journalizing de atributos adicionales para su filtrado y proceso selectivo, excluyendo los registros no modificados. También contaremos con la posibilidad de utilizar las Journalizing Tools en el desarrollo de paquetes, para controlar el flujo de ejecución (y decidir si existen o no cambios para una tabla y si se debe lanzar o no su interface de carga). Al final del flujo de carga se invocará el proceso de purga del “Journal” para que elimine los cambios ya procesados, una vez concluido el tratamiento por el último suscriptor.

Oracle Data Modeler: Herramienta gratuita para el modelado de datos


En todo proyecto de desarrollo, independientemente de la tecnología o herramienta seleccionada para su implementación, existe la necesidad de almacenar y por lo tanto, de modelar previamente los datos.

Podemos encontrar en el mercado diversas herramientas de pago de reconocido prestigio que nos ayudarán a realizar esta tarea, pero hay también algunas herramientas gratuitas como Oracle Data Modeler capaces de satisfacer las necesidades habituales en el campo del modelado. Oracle Data Modeler lleva ya tiempo disponible y, tras varias versiones (se publicó la semana pasada la 3.1.3), consideramos que ha alcanzado ya el grado de madurez (y robustez) necesario para participar en proyectos empresariales, ayudando a mejorar la productividad, por lo que, como puede ser de utilidad en muchos supuestos, creemos que continúa siendo interesante difundir su existencia.

Oracle Data Modeler es una aplicación que puede ejecutarse de manera independiente o incorporarse como un módulo en otras herramientas como por ejemplo la también gratuita Oracle SQL Developer. Al estar desarrollada en Java, corre sobre cualquier plataforma, y a través de drivers JDBC permite trabajar con los principales motores de base de datos del mercado.


Oracle Data Modeler es fácil de instalar y no tiene coste alguno. Sus funcionalidades son tantas que la mejor manera de evaluarlo es descargarlo aquí y evaluarlo uno mismo, por lo que para animaros, introducimos a continuación algunas de sus características:

  • Los modelos se almacenan en el sistema de ficheros, bajo una estructura de directorios (por lo que son fáciles de transportar, archivar, etc.)
  • Puede trabajar con cualquier base de datos, no está restringido a Oracle
  • Permite realizar ingeniería inversa
  • Dispone de los siguientes niveles de diseño: lógico, relacional y físico, con herramientas de generación automática en ambos sentidos.
  • Cada modelo puede tener diferentes implementaciones físicas (en diferentes tecnologías)
  • Permite definir dominios de tipos de datos
  • Compara diferencias entre modelos
  • Soporte para código almacenado, vistas materializadas, etc. (no sólo tablas y vistas)
  • Versionado de objetos
  • Herramienta de diseño visual y rica en herramientas (colores personalizables, deshacer, búsqueda de objetos, etc.)
  • Múltiples opciones en la generación del DDL

Integración de ODI 11g Standalone Agent con OPMN

septiembre 26, 2012 Dejar un comentario

La misión de un ODI Agent es ejecutar los procesos ETL asignados a la hora programada.

El Standalone Agent es multiplataforma y ligero, por lo que cumple muy bien con su cometido… siempre y cuando esté en ejecución!

En función de la plataforma de ejecución, iniciar un Agent puede ser tan simple como añadirlo a los scripts de inicio del sistema en Linux o a los servicios de Windows, caso en el cual necesitaremos algún software adicional que permita lanzar el proceso java del Agent como servicio.

En la versión 10g había algunas herramientas de terceros y procesos descritos y soportados por Oracle para hacerlo, pero no pasa lo mismo en la versión 11g, en la que el procedimiento soportado para iniciar los Agents como servicio es integrarlos con OPMN.

Una vez asimilado el engorro de esta instalación adicional, nos damos cuenta de sus beneficios:

  • El Agent se inicia con el sistema
  • OPMN monitoriza el Agent levantándolo en caso de caída

por lo que recomendamos realizar también esta integración en sistemas Linux, ya que salvo problemas permanentes que impidan la comunicación con el repositorio de ODI en el inicio, OPMN nos asegurará que el Agent se esté ejecutando después de cualquier incidencia tipo cierre de sesión, kill del proceso, etc.

La única consideración adicional es que en caso de modificación de alguno de los parámetros de configuración habitualmente ubicados en ODIPARAMS, afecte también a la configuración de OPMN.

Categorías:BI Etiquetas: , , ,

Introducción a Oracle Endeca Information Discovery (EID)

En octubre de 2011 Oracle anunció la adquisición de Endeca. Desde finales de abril la última versión de Oracle Endeca Information Discovery (EID) ya está disponible para su descarga a través de e-Delivery, y más recientemente, la documentación en OTN. La curiosidad nos ha llevado a instalar una versión para tener una toma de contacto con el producto, tras la que podemos presentar la siguiente introducción.

¿Cómo encaja Endeca en el panorama del Business Intelligence actual de Oracle?

Endeca viene a complementar la oferta existente, entiéndase OBI, puesto que son herramientas de características diferentes, lo que permitirá a los clientes de Oracle elegir aquella que mejor se ajuste a cada necesidad. Si se busca una herramienta que permita alcanzar nuevas perspectivas y respuestas a preguntas difíciles de prever anticipadamente de manera rápida y ágil en un corto tiempo, Endeca es la herramienta. En cambio, si las necesidades de la organización están más orientadas a establecer una reglas de negocio sólidas, con definiciones consistentes almacenadas en un repositorio de metadatos corporativo, construir un sistema de scorecarding complejo, cuadros de mando corporativos o informes pixel-perfect, entonces debemos mirar hacia OBI.

Las características más destacadas de Oracle Endeca Information Discovery son:

  • Rapidez en el desarrollo de proyectos
  • Agilidad en la exploración de datos
  • Da acceso a la información relevante

¿En qué se basa su rapidez?

  • No necesita desarrollar un modelo de datos
  • Tiene una interface de desarrollo rápido
  • Facilidad de utilización, con una curva de aprendizaje rápido
  • Alto rendimiento en la ejecución

¿Cuáles son sus características para la exploración de datos?

  • Interface de usuario orientada a la búsqueda. Se apoya en el motor Endeca Server, que permite combinar las búsquedas con el análisis propio de Business Intelligence.
  • Tras las búsquedas, mediante navegaciones guiadas, ayuda a ir refinando los datos encontrados hasta lograr descubrir la información relevante.
  • Visualiza los resultados en formatos que facilitan la exploración de conjuntos de información (todos los elementos son clicables para continuar profundizando en la exploración).

¿Cómo explorar toda la información relevante?

  • EID da acceso a cualquier tipo de información, tanto estructurada como desestructurada, permitiendo cargar y relacionar ambos tipos de información, haciéndolos accesibles en un mismo sistema.
  • Enriqueciendo la información mediante la captura de datos en la red que incorpora al sistema y hace accesibles desde la interface de usuario.

Arquitectura de Endeca Information Discovery

EID está compuesta por los siguientes módulos:

  • Studio: Herramienta de autoservicio que permite a los propios analistas de negocio la composición y configuración de aplicaciones, vistas y cuadros de mando.
  • Oracle Endeca Server: Motor híbrido de acceso a datos que combina las capacidades de un buscador y características OLAP.
  • Integration Suite: Una extensa herramienta que incluye una solución ETL corporativa, Integrator (basado en CloverETL), que incluye conectores para fuentes de información tanto estructurada como desestructurada, bibliotecas para el enriquecimiento de datos, y para el propio Endeca server.
Categorías:BI Etiquetas: , , , ,

Agregar, Agregar, Agregar (o cómo acelerar un sistema de BI)

La rapidez (o lentitud) de un sistema de Business Intelligence está condicionada por diversos factores entre los que destacan el hardware disponible, el volumen de datos a analizar y el correcto diseño del data.
Supongamos (y no es poco) que hayamos conseguido la configuración óptima (!!!) de estos factores acorde a nuestro presupuesto, pero que aún así, el rendimiento del sistema no es satisfactorio.
¿Significa esto que hemos agotado nuestras posibilidades y que ha fracasado nuestro proyecto de Business Intelligence?
No. Cuando no es posible mover los datos más rápido, la mejora del rendimiento de un sistema pasa por mover menos datos.

Para reducir el tiempo de acceso a los datos, introduciremos una optimización de diseño: la creación de tablas agregadas (tablas que resumen los datos de las tablas de hechos de un datawarehouse/datamart con menor nivel de detalle, por lo que tienen menor volumen). Aunque mínimamente, estas tablas deberán ser consideradas y mantenidas tanto en las herramientas de diseño, como en la documentación y el desarrollo de los procesos de ETL, etc.

Para que este esfuerzo adicional resulte en una optimización efectiva del sistema de BI, es preciso que éste sea lo suficientemente inteligente como para que, basándose únicamente en los hechos, métricas y agregaciones utilizados por cualquier análisis, sepa escoger de manera totalmente automática y transparente al usuario, el conjunto de tablas que pueda responder de manera más eficiente a la petición.  En cualquier otro caso, habrá que dar formación y soporte a los usuarios para transmitirles el conocimiento necesario sobre el modelo de datos para que sepan escoger las tablas agregadas más adecuadas a cada análisis que pretendan realizar, compromentiendo la viabilidad de la mejora.

La tecnología Oracle puede ayudarnos en la realización de la mayoría de tareas relacionadas con la construcción, mantenimiento y utilización de tablas agregadas; desde la identificación de las consultas más habituales (propósito para la que dispone de varias herramientas), pasando por los agregados que conviene crear, la sintaxis para la creación de las vistas materializadas que hayamos decidido, hasta llegar a asumir la compleja y delicada responsabilidad de elegir las tablas agregadas que pueden responder de manera más eficientemente a las consultas de análisis de los usuarios.
Vamos a centrarnos en los diferentes mecanismos que Oracle pone a nuestra disposición para sacar provecho de la agregación como recurso para acelerar la ejecución de consultas:

Agregar (durante el ETL)

Aunque sería un paso previo a la situación descrita hasta el momento, las herramientas ETL de Oracle como Data Integrator, nos pueden ayudar a agregar los datos que van a poblar el data, siempre conservando una granularidad ajustada a las necesidades de la organización, pero con menor nivel de detalle que en el sistema origen (podríamos por ejemplo, resumir todos los pedidos diarios de un cliente y un producto en el sistema transaccional, como un único registro en el data).

Leer más…

Categorías:BI Etiquetas: , , ,

Oracle EXALYTICS, solución de BI para un rendimiento extremo

El artículo de hoy es una breve introducción a Oracle EXALYTICS, la primera máquina diseñada específicamente para conseguir el máximo rendimiento en el análisis de información.

Exalytics está construida sobre 3 pilares:

  • La suite para el análisis de información (OBI) Oracle Business Intelligence (versión optimizada para Exalytics)
  • Tecnología de Bases de Datos en memoria (Oracle Times Ten & Essbase)
  • Hardware estándar (interconectado a alta velocidad con infiniband) con 1 TB RAM y 40 Cores

Image

Las principales características del hardware son:

  • 1TB Ram 1033Mhz
  • 4 Intel Xeon E7-4870 (40 Cores)
  • Networking:
    • 40 Gbps InfiniBand – 2ports
    • 10 Gbps Ethernet – 2ports
    • 1 Gbps Ethernet 4-ports
    • 3.6 Tb HDD

El software para el análisis de información no podía ser otro que la Oracle BI Foundation Suite (v 11.1.1.6), integrada con versiones de Times Ten (v 11.2.2.2) y Essbase (v 11.1.1.2.2) optimizadas para Exalytics, que gestionan en memoria los datos contenidos en una base de datos externa, para sacar así el máximo partido a toda la potencia del hardware. También ofrece alta disponibilidad y escalabilidad a través de su soporte para cluster (tanto Activo/Activo como Activo/Pasivo).

Times Ten es una BD en memoria con persistencia, que dispone de algoritmos diseñados para trabajar en memoria, con interfaz de programación SQL y con optimizaciones como la compresión de columnas (reduce el consumo de memoria y aumenta el rendimiento).

Essbase es una BD analítica multidimendional (MOLAP) que ha sido optimizada para la paralelización de operaciones, el almacenamiento de datos en memoria, y en el motor de consultas MDX. Dichas optimizaciones le permiten unas mejoras de hasta 16X en la ejecución de consultas MDX y hasta 6X en writeback y operaciones de cálculo (batch inclusive), especialmente importantes para casos de uso como planificación y simulación, y con mayor capacidad de concurrencia.

Estos dos motores de datos en memoria permiten a Exalytics disponer de 4 tecnologías que es capaz de combinar para adaptarse dinámicamente a las necesidades planteadas por los diferentes escenarios de las organizaciones usuarias, ofreciendo así un óptimo rendimiento en sus respuestas:

  • Replicación de datos en memoria. No sólo permite acelerar drásticamente las consultas sobre datamarts que quepan íntegramente en memoria, sino que permite también ofrecer alta disponibilidad y escalabilidad (no sólo replica, también puede distribuir).
  • Data Marts adaptativo. Muchos desarrollos BI presentan unos patrones que concentran la actividad de las consultas en un subconjunto de datos concreto. Exalytics tiene la capacidad de identificar esos datos de acceso habitual y crear con ellos un datamarts en memoria, reduciendo drásticamente el tiempo de acceso.
  • Caché de resultados inteligente. Además de disponer de una caché de resultados en memoria, Exalytics puede utilizarla como tabla para responder a nuevas consultas cuya respuesta ya está en memoria. Dispone también de herramientas para autmotizar su “sembrado” (precargar la consultas más habituales).
  • Cubos en memoria. Son los responsables del alto rendimiento en los escenarios de modelización y simulación. Ya que no sólo ofrecen un acceso a datos multidimensional en memoria, sino que son también actualizables.

Esta versión de OBI ha sido optimizada principalmente para aprovechar los recursos ofrecidos por estos dos motores de datos, pero también se han introducido mejoras visuales en forma de nuevos tipos de gráficos, acceso desde dispositivos móviles, etc.

Todos estos elementos no son nuevos en la cartera de productos de Oracle, podrían ser adquiridos y configurados independientemente. La “gracia” está en que Oracle ha trabajado sobre versiones concretas, optimizando la comunicación entre ellas (no sólo a nivel de software, sino también de hardware) para sacar el máximo partido de cada uno de los elementos y poder ofrecer el conjunto como un producto estándar con mejoras en el rendimiento que individualmente no son alcanzables (algunas por restricciones a nivel de licencia, otras porque sólo están disponibles sobre el hardware Exalytics).

Las jornadas concluyeron con una interesante presentación sobre una prueba de concepto realizada para Deutsche Bank en la que se comparó el rendimiento de un Dashboard específico sobre el sistema actual contra el que ofrecerían diferentes escenarios en los que se combinaba con Exalytics e incluso con Exadata. Los resultados arrojaron mejoras de rendimiento en tiempo de respuesta del siguiente orden de magnitud:

Entorno

Tiempo de Respuesta (seg)

Sistema actual (OBI 10g + DB 10g)

80

Sistema actual (OBI 10g) + Exadata

12

Exalytics + DB Actual (10g)

3

Exalytics + Exadata

1.6

Categorías:Hardware Etiquetas: , , ,
Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

Únete a otros 71 seguidores