¿Debe el data warehouse subirse a la nube?

La mejor noticia que llega de la primera conferencia de usuarios de Amazon Web Services, que se acaba de celebrar, es el lanzamiento del nuevo servicio de la compañía, Redshift, una herramienta data warehouse basada en la nube. Lo que justifica preguntarse si la nube es un buen lugar para situar un data warehouse.

cloud

Fuentes de la compañía aseguran que las empresas enterradas en grandes silos de datos ven en la nube  una alternativa de bajo coste para invertir en infraestructura que les permita gestionar toda su información en un solo sitio. Quizás los mayores problemas de Redshift sean los mismos problemas que acompañan a la nube pública en general, es decir, algunos no se sienten cómodos dejando información financiera o personal sensible en la nube pública de cualquiera. Y además está el problema de la transmisión de esos datos a la nube.

Estos aspectos frenan el desarrollo de este tipo de opciones, ya que a pesar de los beneficios potenciales en costes y tareas de gestión, existen dudas relacionadas con la seguridad y la transferencia de la información, lo que puede llevar a Redshift a seguir el camino de otros servicios para empresas de Amazon, según Jeff Kelly, investigador de Wikibon Project.

El data warehouse se ha definido tradicionalmente como servicios personalizados de alojamiento de datos que añaden información de muy diferentes fuentes y la conservan en una localización concreta. Y, a partir de ella, extraer informes o peticiones de datos concretos. Muchas compañías lo utilizan para compilar regularmente informes financieros o métricas de negocio. Redshift es una herramienta basada en columnas SQL diseñada para escalar desde un terabyte a múltiples petabytes.

Uno de los grandes retos del data warehouse en la nube es cómo se transfieren los datos al entorno Amazon. Hacerlo a través de la nube pública no solo conlleva problemas de seguridad sino que también consume gran ancho de banda. Amazon asegura que cuenta con conexiones de terceros, como Equinix, que enlazan directamente con su nube y que incluso muchos clientes envían sus datos en discos físicos por correo para que la compañía los vuelque en su nube con total garantía.  

Whitepaper emc-cio-it-as-a-service-wp Whitepapers