Un Data Warehouse (DWH) es una de las herramientas de ciencia de datos más importante para cualquier compañía hoy en día, ya que provee una forma de centralizar la información corporativa y desde ahí ejecutar analítica que permita mejorar la toma de decisiones.
Por flexibilidad en el crecimiento y costos las compañías actualmente estan privilegiando soluciones de Data Warehouse en la nube por sobre sistemas locales. Otra razón muy importante es que los sistemas en la nube permiten acceso seguro a través de usuarios distribuidos en diferentes locaciones geográficas y sin necesidad de incorporar tecnología adicional.

Hoy existen una gran variedad de Data Warehouse disponibles, todas ellas con diferentes características, costos y funcionalidades. Este articulo permite diferenciar a los cuatro proveedores de soluciones en la nube más populares y con mayor presencia en el mercado; Amazon, Microsoft Azure, Google y Snowflake. Estos proveedores comparten varias similitudes, pero también varias diferencias que a la hora de seleccionar una plataforma de Data Warehouse pueden generar una gran diferencia.
Contenidos del Artículo
Que es Amazon Redshift
Redshift es una solución de DWH y analítica en la nube y es parte de la plataforma de servicios cloud de Amazon Web Services (AWS). Este servicio proporciona una plataforma donde los usuarios pueden almacenar sus datos y extraer métricas que permiten mejorar la visualización del negocio. Para conocer más sobre Redshift accede a su documentación en español.
Que es Azure Synapse
Azure Synapse es la plataforma de Data Warehouse en la nube perteneciente a Microsoft, la cual permite a los usuarios crear un almacén de datos moderno y muy fácil de usar. Con Synapse usted puede consultar los datos a través de usuarios dedicados o recursos en modo Serverless a gran escala. Esta plataforma provee las tecnologías SQL de Microsoft para la creación de DWH, Data Explorer para simplificar la visualización y completa integración con otros servicios de Microsoft como AzureML, Power BI y CosmosDB. Para conocer mas sobre Azure Synpase accede a su documentación en español.
Que es Google BigQuery
BigQuery es un Data Warehouse en la nube y es parte de Google Cloud Platform. En este servicio los usuarios pueden crear reportes con ayuda del motor de datos analíticos, el cual también permite ejecutar consultas SQL sobre Pentabytes de datos y obtener resultados en minutos. Este DWH se basa en infraestructura Serverless por lo que su escalabilidad y alta disponibilidad se encuentran aseguradas. Para conocer mas sobre Google BigQuery accede a su documentación en español.
Que es Snowflake
Snowflake es un DWH con modelo Solución como Servicio (SAAS) diseñado específicamente para la nube. Con respecto a su arquitectura de datos, utiliza Azure Blob como motor de almacenamiento interno y Azure Data Lake para almacenar datos estructurados y no estructurados. Snowflake brinda seguridad a los datos por medio de controles de políticas de seguridad de AWS S3, tokens de Azure, SSO y permisos de acceso de Google cloud Storage. Para conocer mas sobre Snowflake en español accede a su documentación en español.
Continua Leyendo: Porqué utilizar la tecnología de Change Data Capture en un Data Warehouse
Arquitectura
Con respecto a la conectividad con las aplicaciones utiliza JDBC y ODBC.
Con respecto a la conectividad con las aplicaciones utiliza ADO.NET, ODBC, PHP y JDBC.
Con respecto a la conectividad con las aplicaciones utiliza ODBC y JDBC.
Con respecto a la conectividad con las aplicaciones utiliza .NET, JDBC, ODBC y PHP.
Integración
Tanto Azure Synapse, como AWS Redshift, Google BigQuery y Snowflake pueden integrarse con sistemas de bases de datos relacionales, sistemas analíticos o sistemas de big data a través de tecnología Change Data Capture, permitiendo integrar estas tecnologías en forma transaccional. Continue leyendo sobre Syniti Data Replication.
Seguridad




Gracias Alejandro, a través de tu artículo es mucho más fácil comprender lo que está ocurriendo en el mundo de los datos. ¡Muy interesante!