Desbloquea el Poder de la Gobernanza de Datos y el Aprendizaje Automático sin Código con Amazon SageMaker Canvas y Amazon DataZone

Elena Digital López

Amazon Web Services (AWS) ha anunciado dos nuevas herramientas para el manejo y análisis de datos: Amazon DataZone y Amazon SageMaker Canvas. Estas soluciones están diseñadas para facilitar la gestión, descubrimiento, compartición y gobernanza de datos, así como para capacitar a los analistas de negocios y expertos en dominio para construir y desplegar modelos de aprendizaje automático (ML) sin necesidad de codificación.

Amazon DataZone permite la creación y gestión de «zonas de datos», que son lagos de datos virtuales diseñados para almacenar y procesar información sin necesidad de una infraestructura de gestión compleja o extensiva codificación. Esto facilita el acceso y colaboración en toda la organización, permitiendo a ingenieros, científicos de datos, gerentes de producto y usuarios de negocio extraer y colaborar en pro de obtener insights basados en datos.

Por otro lado, Amazon SageMaker Canvas es una herramienta de ML sin código que simplifica la ingestión de datos de fuentes populares como Amazon S3, Amazon Redshift, Amazon Athena, Snowflake, Salesforce y Databricks. Ofrece capacidades robustas de preparación de datos a través de Amazon SageMaker Data Wrangler, construcción automatizada de modelos mediante Amazon SageMaker Autopilot, y uso de modelos de ML pre-construidos, incluidos los modelos de fundamentos de Amazon Bedrock y Amazon SageMaker Jumpstart.

Las empresas pueden utilizar estas soluciones de ML sin código para optimizar operaciones y tomar decisiones informadas sin una sobrecarga administrativa significativa. Por ejemplo, las instituciones financieras pueden usar SageMaker Canvas para la detección de fraudes, permitiendo iteraciones rápidas de modelos que mejoren la eficiencia y precisión. La gobernanza de ML es crucial para asegurar que los datos usados en estos modelos sean precisos, seguros y confiables. La integración de Amazon DataZone y Amazon SageMaker facilita la configuración de infraestructura con controles de seguridad, colaboración en proyectos de ML y gobernanza del acceso a datos y activos de ML.

Con esta integración, los usuarios pueden publicar activos de datos en Amazon DataZone y permitir que otros miembros de la misma organización los descubran y consuman, mejorando así la colaboración y eficiencia en proyectos de ML. La gobernanza de datos y la capacidad de reutilización de los modelos impulsan a las organizaciones a reducir la duplicación de esfuerzos y fomentar el intercambio de conocimientos a lo largo del ciclo de vida del ML.

En resumen, la combinación de SageMaker Canvas y Amazon DataZone proporciona una potente solución para la gobernanza de datos, colaboración y reutilización en proyectos de ML. Las organizaciones pueden aprovechar estas herramientas para casos de uso de inteligencia artificial generativa, habilitando la capacitación y adaptación de grandes modelos de lenguaje u otros modelos fundamentales con políticas de gobernanza robustas, desbloqueando todo el potencial del ML y la inteligencia artificial generativa mientras mantienen control y supervisión sobre sus activos de datos. Se invita a las empresas a explorar esta nueva integración para optimizar sus procesos de preparación de datos, ingeniería de características y construcción de modelos ML, promoviendo la reutilización y el intercambio de modelos dentro de su organización.
vía: AWS machine learning blog

Scroll al inicio