Inicio > Business Analytics > Oracle Endeca Information Discovery, una “implementación software” de Big Data

Oracle Endeca Information Discovery, una “implementación software” de Big Data

Hace unos días, comentando con un compañero sobre el concepto Big Data y las soluciones que lo implementan para su explotación (p.e. Oracle Big Data), nos dimos cuenta del paralelismo existente entre el desarrollo de un proyecto  big data y la implementación de un proyecto con Oracle Endeca Information Discovery, así que nos pareció interesante compartirlo en el blog.

Principales características que definen un entorno big data:

  • Volumen: Millones de registros generados por todo tipo de automatismos, aplicaciones corporativas y los innumerables internautas participando en la web y redes sociales.
  • Velocidad de generación: Empezando por “todo el potencial” de las máquinas que trabajan a 24×7, hasta los más de 8Tb diarios generados por ejemplo por twitter a partir de sus mensajes de 140 caracteres.
  • Variedad: Contrastando con los modelos clásicos, cada nuevo servicio añade nuevos tipos de datos no estructurados y que evolucionan rápidamente adaptándose a nuevos requerimientos.
  • Valor: Aunque difícil de medir y aún más difícil de valorar, a día de hoy es innegable que entre esa cantidad ingente de datos en formatos no tradicionales, se esconde información útil.

El objetivo de toda plataforma big data es analizar toda esa información para, en combinación con la información estructurada tradicional, lograr un mayor conocimiento del negocio que permita mejorar la capacidad de decisión de la organización.

A alto nivel, sin entrar en detalles sobre el hardware y software necesario para abordar la problemática intrínseca a las características descritas, podemos decir que el proceso de implementación de una solución big data seguiría esta secuencia:

  1. Adquisición de datos
  2. Organización de datos
  3. Análisis de la información

Qué, curiosamente, coincide con las características de la aplicación Oracle Endeca Information Discovery, ya que:

  1. Combina información estructurada o desestructurada (incluso con origen en tecnologías diferentes)
  2. Organiza la información automáticamente (para su búsqueda y descubrimiento)
  3. Hace rápidamente accesible la información (a través de una herramienta de análisis)

OEID_BigData

La existencia de un paralelismo tan claro entre los dos procesos nos llevó a la conclusión de que, si bien abordar un proyecto de big data desde cero puede resultar una tarea ardua que requiera además de un presupuesto sustancioso, existe una alternativa software, de menor complejidad técnica, con menor requerimiento de infraestructuras y, por lo tanto, de menor coste y más rápida implementación.

Oracle Endeca Information Discovery está diseñado para satisfacer la misma necesidad funcional (análisis de datos) con los mismos requerimientos (múltiples orígenes, tecnologías diversas, datos no estructurados, …) pero siendo una implementación software que podría ser absolutamente satisfactoria con volumenes de datos a su alcance (ya que satisface el resto de requerimientos), y más interesante aún, como herramienta de prototipado en este tipo de proyectos.

Categorías:Business Analytics Etiquetas: , , ,
  1. IsraAdri
    septiembre 25, 2014 en 16:26

    Buenas tardes.

    He revisado la herramienta y me parece super interesante, aunque la veo muy verde aun en relacion a otras herramientas del mercado como Qlikview o Tableau.

    Segun su opinion personal y profesional, ¿que opciones o vision de futuro le ven a esta herramienta? ¿la ven como una buena apuesta (teniendo en cuenta su estado embrionario y su alto coste de licencias)?

    Muchas gracias!

    • Joan Massegú
      octubre 13, 2014 en 10:22

      Buenos días,

      en primer lugar, gracias por el comentario.

      Entrando en materia, es difícil responder brevemente a una pregunta así, para ser objetivos deberíamos realizar una comparativa de funcionalidades y otros factores de más recorrido como el nivel de soporte, la integración …

      Pero el mensaje final es claro: Endeca es una apuesta segura pues Oracle está comprometido con ella, lo que le asegura trayectoria a largo plazo y un soporte de alto nivel. En cuanto a su coste, puede considerarse alto si comparamos únicamente las cifras al final de la oferta con otros productos, pero no es caro (caro es aquello que cuesta más de lo que vale). En más de una ocasión, tras una jornada de consultoría con un cliente que lleva invertidas muchas horas en desarrollo e integración con componentes open-source, una de las conclusiones a la que hemos llegado ha sido que habiendo adquirido las licencias del producto Oracle, tendrían mucho mejor rendimiento, mayor integración … y habrían terminado el desarrollo en bastante menos tiempo.

      Endeca es uno de los diversos casos de software adquirido por Oracle. Cuando Oracle adquiere una empresa sigue un proceso de selección que contempla desde el valor tecnológico que el producto aportará al portfolio de la compañía hasta un máximo de meses hasta que la asimilación de la estructura sea completa. La tecnología no está en absoluto en un estado embrionario (ya en los principios del producto, había una demo de cómo el departamento de policía de la ciudad de Chicago, durante una convención de la OTAN, detectaba utilizando Endeca que se estaban iniciando altercados en puntos del mapa sin presencia policial y cómo redistribuían los efectivos, reconduciendo la situación: espectacular).
      Antes de escribir esta respuesta, como no soy experto en dichos productos, he hecho una búsqueda en Google “sentiment analysis {producto mencionado}” … para Qlikview me aparecen enlaces a productos de terceros y para Tableau, parece que se fundamentan (¿únicamente?) en R. En absoluto me parece que tengan un nivel de madurez mayor que Endeca … pero sí que intuyo que la integración será menor … lo que llevaría a cuestionar otro aspecto importante como es mantenimiento del desarrollo a medio plazo.

      Espero que la respuesta te resulte útil.

      Saludos,
      Joan.

  1. No trackbacks yet.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: