{"id":9722,"date":"2022-06-15T10:43:12","date_gmt":"2022-06-15T16:43:12","guid":{"rendered":"https:\/\/ugit.siua.ac.cr\/?p=9722"},"modified":"2022-06-17T17:17:40","modified_gmt":"2022-06-17T23:17:40","slug":"dp-900-t04-m01-exploracion-de-los-aspectos-basicos-del-almacenamiento-de-datos-moderno","status":"publish","type":"post","link":"https:\/\/sada.services\/?p=9722","title":{"rendered":"DP-900: T04\/M01: Exploraci\u00f3n de los aspectos b\u00e1sicos del almacenamiento de datos moderno"},"content":{"rendered":"\n<p><a href=\"https:\/\/docs.microsoft.com\/es-mx\/learn\/modules\/examine-components-of-modern-data-warehouse\/\">https:\/\/docs.microsoft.com\/es-mx\/learn\/modules\/examine-components-of-modern-data-warehouse\/<\/a><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 1: Introducci\u00f3n<\/h2>\n\n\n\n<p>El almacenamiento de datos moderno es un t\u00e9rmino gen\u00e9rico que describe la infraestructura y los procesos que se usan para admitir el an\u00e1lisis de datos a gran escala. Las soluciones modernas de almacenamiento de datos combinan el almacenamiento de datos convencional que se usa para admitir inteligencia empresarial (BI), que normalmente implica copiar datos de almacenes de datos transaccionales en una base de datos relacional con un esquema optimizado para consultar y crear modelos multidimensionales; esto se realiza con t\u00e9cnicas usadas para los denominados an\u00e1lisis de \u00abmacrodatos\u00bb, donde grandes vol\u00famenes de datos en varios formatos se cargan o capturan por lotes en flujos en tiempo real y se almacenan en un\u00a0<em>lago de datos<\/em>\u00a0desde el que se usan motores de procesamiento distribuido como Apache Spark para procesar los datos a escala.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 2: Descripci\u00f3n del almacenamiento de datos moderno<\/h2>\n\n\n\n<p>La arquitectura moderna de almacenamiento de datos puede variar, al igual que las tecnolog\u00edas espec\u00edficas que se usan para implementarla; de todos modos, en general, se incluyen los siguientes elementos:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img fetchpriority=\"high\" decoding=\"async\" width=\"1024\" height=\"367\" src=\"\/wp-content\/uploads\/2022\/06\/modern-data-warehousing-1024x367.png\" alt=\"\" class=\"wp-image-9725\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/modern-data-warehousing-1024x367.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/modern-data-warehousing-300x108.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/modern-data-warehousing-768x275.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/modern-data-warehousing-1536x551.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/modern-data-warehousing-2048x735.png 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ol class=\"wp-block-list\"><li><strong>Ingesta y procesamiento de datos<\/strong>: los datos de uno o varios almacenes de datos transaccionales, archivos, flujos en tiempo real u otros or\u00edgenes se cargan en un lago de datos o en un almacenamiento de datos relacional. Normalmente, la operaci\u00f3n de carga implica un proceso de\u00a0<em>extracci\u00f3n, transformaci\u00f3n y carga<\/em>\u00a0(ETL) o de\u00a0<em>extracci\u00f3n, carga y transformaci\u00f3n<\/em>\u00a0(ELT) en el que los datos se limpian, filtran y reestructuran para su an\u00e1lisis. En los procesos de ETL, los datos se transforman antes de cargarse en un almac\u00e9n anal\u00edtico, mientras que en un proceso de ELT los datos se copian en el almac\u00e9n y, posteriormente, se transforman. En cualquier caso, la estructura de datos resultante est\u00e1 optimizada para las consultas anal\u00edticas. El procesamiento de datos suele realizarse mediante sistemas distribuidos que pueden procesar grandes vol\u00famenes de datos en paralelo mediante cl\u00fasteres de varios nodos. La ingesta de datos incluye el procesamiento por lotes de datos est\u00e1ticos y el procesamiento en tiempo real de los datos de streaming.<\/li><li><strong>Almac\u00e9n de datos anal\u00edticos<\/strong>: los almacenes de datos para an\u00e1lisis a gran escala incluyen\u00a0<em>almacenamientos de datos<\/em>\u00a0relacionales,\u00a0<em>lagos de datos<\/em>\u00a0basados en sistema de archivos y arquitecturas h\u00edbridas que combinan caracter\u00edsticas de almacenes de datos y lagos de datos (a veces bajo la denominaci\u00f3n de\u00a0<em>lagos de almacenamiento de datos<\/em>\u00a0o\u00a0<em>bases de datos de lago<\/em>). Los trataremos con m\u00e1s detalle m\u00e1s adelante.<\/li><li><strong>Modelo de datos anal\u00edticos<\/strong>: aunque los analistas de datos y los cient\u00edficos de datos pueden trabajar con los datos directamente en el almac\u00e9n de datos anal\u00edticos, es habitual crear uno o varios modelos de datos que agreguen previamente los datos para facilitar la generaci\u00f3n de informes, paneles y visualizaciones interactivas. A menudo, estos modelos de datos se describen como\u00a0<em>cubos<\/em>, en los que los valores de datos num\u00e9ricos se agregan en una o varias dimensiones (por ejemplo, para determinar las ventas totales por producto y regi\u00f3n). El modelo encapsula las relaciones entre los valores de datos y las entidades dimensionales para admitir el an\u00e1lisis de tipo \u00abrastrear agrupando datos\/explorar en profundidad\u00bb.<\/li><li><strong>Visualizaci\u00f3n de datos<\/strong>: los analistas de datos consumen datos de modelos anal\u00edticos y directamente de almacenes anal\u00edticos para crear informes, paneles y otras visualizaciones. Adem\u00e1s, los usuarios de una organizaci\u00f3n, que pueden no ser profesionales de la tecnolog\u00eda, pueden realizar informes y an\u00e1lisis de datos de autoservicio. Las visualizaciones de los datos muestran tendencias, comparaciones e indicadores clave de rendimiento (KPI) para una empresa u otra organizaci\u00f3n, y pueden tomar la forma de informes impresos, diagramas y gr\u00e1ficos en documentos o presentaciones de PowerPoint, paneles basados en web y entornos interactivos en los que los usuarios pueden explorar los datos visualmente.<\/li><\/ol>\n\n\n\n<h2 class=\"wp-block-heading\">MCT: Video 4.1.1 Descripci\u00f3n de la arquitectura moderna y los flujos de data warehousing<\/h2>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Descripcio\u0301n de la arquitectura moderna y los flujos de data warehousing\" width=\"1290\" height=\"726\" src=\"https:\/\/www.youtube.com\/embed\/8iE6i6WCuuA?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Descripci\u00f3n del almacenamiento de datos moderno<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Un almacenamiento de datos recopila datos de muchos or\u00edgenes que se utilizan para el an\u00e1lisis de informes y el procesamiento anal\u00edtico en l\u00ednea<\/li><li>Los almacenamiento de datos tienen que administrar macrodatos<\/li><li>macrodatos: <ul><li>son grandes cantidades de datos recopilados<\/li><li>En vol\u00famenes escalables<\/li><li>A velocidades muy altas<\/li><li>Y una variedad de formatos<\/li><li>Pueden ser datos hist\u00f3ricos: es decir datos almacenados<\/li><li>O puede ser en tiempo real: es decir que se transmiten desde un or\u00edgen<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" width=\"801\" height=\"536\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1655.png\" alt=\"\" class=\"wp-image-9728\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1655.png 801w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1655-300x201.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1655-768x514.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1655-120x80.png 120w\" sizes=\"(max-width: 801px) 100vw, 801px\" \/><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Caracter\u00edsticas de la arquitectura moderna<\/h3>\n\n\n\n<h4 class=\"wp-block-heading\">Modular<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Se a\u00f1aden componentes <\/li><li>No hay limite de componentes que se pueden a\u00f1adir<\/li><li>Permite crecer junto al negocio, es decir se pueden quitar o agregar nuevos componentes seg\u00fan la necesidad<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large is-resized\"><img decoding=\"async\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1656-1024x551.png\" alt=\"\" class=\"wp-image-9729\" width=\"256\" height=\"138\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1656-1024x551.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1656-300x161.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1656-768x413.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1656.png 1116w\" sizes=\"(max-width: 256px) 100vw, 256px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">El\u00e1stica<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Como ejemplo una bola de ligas se pueden manipular lo componentes escalandolos o quitandolos como sea necesario<\/li><li>Incluso pausar servicios que no se est\u00e9n utilizando<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1657.png\" alt=\"\" class=\"wp-image-9730\" width=\"304\" height=\"257\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1657.png 608w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1657-300x253.png 300w\" sizes=\"(max-width: 304px) 100vw, 304px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Fluida<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Quiere decir que cualquier tipo de datos se puede a\u00f1adir<\/li><li>Los datos se a\u00f1aden de forma fluida<\/li><li>Y sin representar ning\u00fan tipo de problema ya que es en tiempo real o almacenamiento<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1658.png\" alt=\"\" class=\"wp-image-9731\" width=\"466\" height=\"280\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1658.png 932w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1658-300x180.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1658-768x461.png 768w\" sizes=\"(max-width: 466px) 100vw, 466px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">C\u00f3mo se compone esta arquitectura moderna?<\/h3>\n\n\n\n<p>Se compone de 2 caracter\u00edsticas<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Almacenamiento:<ul><li>Cuanta con el data Lake<\/li><li>M\u00e9todos de an\u00e1lisis<\/li><li>Metadatos<\/li><\/ul><\/li><li>Procesamiento<ul><li>Movimiento de datos<\/li><li>Manipulaci\u00f3n de datos<\/li><li>Recuperaci\u00f3n de datos<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"570\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1659-1024x570.png\" alt=\"\" class=\"wp-image-9732\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1659-1024x570.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1659-300x167.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1659-768x427.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1659.png 1148w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Componentes en Azure<\/h3>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Synapse Analytics:<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Es la base de datos en la nube <\/li><li>R\u00e1pida, flexible y de confianza<\/li><li>Permite escalar, procesar y almacenar de forma el\u00e1stica e independiente<\/li><li>Con una arquitectura de procesamiento paralelo y masivo<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Data Factory:<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un servicio de integraci\u00f3n de datos h\u00edbrido<\/li><li>Permite crear, programar y orquestar flujos de trabajo <\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Blob Storage:<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un almacenamiento de objetos escalable, de forma masiva para cualquier tipo de datos e im\u00e1genes<\/li><li>Principalmente se usa para datos no estructurados, como im\u00e1genes, v\u00eddeos, audios y documentos<\/li><li>Estos datos se almacenan de manera m\u00e1s sencilla y rentable<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Data Lake Storage:<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Incluye toda la funcionalidad necesaria para facilitar a los desarrolladores, cient\u00edficos de datos y analistas el almacenamiento de datos de cualquier tama\u00f1o y forma <\/li><li>Cuenta con la velocidad para llevar a cabo cualquier tipo de procesamiento y an\u00e1lisis en diferentes plataformas y lenguajes <\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Databricks:<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Es una plataforma de an\u00e1lisis r\u00e1pida, sencilla y colaborativa<\/li><li>Basada en Apache Spark<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Analysis Services:<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Es una an\u00e1lisis de nivel empresarial como servicios<\/li><li>Permite: gobernar, implementar, probar y proporcionar una soluci\u00f3n de Business Intelligence (BI) con confianza<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Power BI<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un conjunto de herramientas de an\u00e1lisis empresarial, que proporciona informaci\u00f3n detallada hacer de toda la organizaci\u00f3n <\/li><li>Conectar cientos de or\u00edgenes de datos<\/li><li>Simplifica la preparaci\u00f3n de los datos<\/li><li>realiza an\u00e1lisis<\/li><li>Permite crear informes atractivos y se pueden publicar en la organizaci\u00f3n para que se usen en la Web y dispositivos m\u00f3viles<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Cosmos DB<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Servicio de BD, m\u00faltimodelo <\/li><li>Distribuido globalmente<\/li><li>Que permite la r\u00e9plica de los datos <\/li><li>Y permite escalamiento independientes de los almacenamientos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"490\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1660-1024x490.png\" alt=\"\" class=\"wp-image-9735\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1660-1024x490.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1660-300x144.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1660-768x368.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1660.png 1232w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Arquitectura y Flujos<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Datos: <\/strong>principalmente se dividen en dos:<ul><li>Los datos de los servicios relacionales (con estructura)<\/li><li>Y los datos No relacionales (sin estructura)<\/li><\/ul><\/li><li><strong>Ingesta de datos:<\/strong> <ul><li>Los datos primero se recuperan mediante Azure Data Factory<\/li><li>Sirve tambi\u00e9n para darle formato a los datos, a este proceso se le denomina ingesta de datos<\/li><\/ul><\/li><li><strong>Almacenamiento:<\/strong><ul><li>Los datos con formato de almacenan en Azure Data Lake Storage:<\/li><li>Permite almacenar grandes vol\u00famenes de datos de forma muy r\u00e1pida y sencilla antes de analizarlos<\/li><\/ul><\/li><li>A partir de aqu\u00ed los datos pueden seguir dos caminos<ul><li><strong>Modelar y servir<\/strong><ul><li>Los datos se convierten a un formato normalizado, adecuado para su an\u00e1lisis<\/li><li>Y se almacenan mediante <strong>Azure Synapse Analytic<\/strong><\/li><\/ul><\/li><li><strong>Preparaci\u00f3n<\/strong>:<ul><li>Los datos tambi\u00e9n se pueden almacenar con  <strong>Azure Databrick<\/strong>, para aplicar otra forma de preparaci\u00f3n de datos <\/li><li>Por ejemplo es posible que se requiera transformaciones de datos adicionales o limpiar <\/li><li>Se pueden almacenar los datos limpios con <strong>Azure Synapse Analytic<\/strong> si es necesario, este funciona como un centro contenedor de datos empresariales ya limpios<\/li><li>Este puede puede revisar de manera exhaustiva los datos anal\u00edticos mediante <strong>Azure Analysis Services<\/strong><\/li><\/ul><\/li><li><strong>Power BI:<\/strong><ul><li>Puede tomar esta informaci\u00f3n y utilizarla<\/li><li>Tambi\u00e9n puede ejecutar consultas, sobre los datos procesados por <strong>Azure Databrick<\/strong><\/li><\/ul><\/li><li><strong>Azure Cosmos DB:<\/strong><ul><li>Es un opci\u00f3n que no siempre es utilizada para facilitar el almacenamiento de aplicaciones Web<\/li><\/ul><\/li><\/ul><\/li><li>NOTA: Este es un flujo propuesto sin embargo este puede cambiar seg\u00fan nuestras necesidades<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"551\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1662-1024x551.png\" alt=\"\" class=\"wp-image-9749\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1662-1024x551.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1662-300x161.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1662-768x413.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1662.png 1356w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 3: Exploraci\u00f3n de canalizaciones de ingesta de datos<\/h2>\n\n\n\n<p>Ahora que comprende un poco la arquitectura de una soluci\u00f3n de almacenamiento de datos moderna y algunas de las tecnolog\u00edas de procesamiento distribuido que se pueden usar para controlar grandes vol\u00famenes de datos, es el momento de explorar c\u00f3mo se ingieren los datos en un almac\u00e9n de datos anal\u00edticos de uno o varios or\u00edgenes.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"482\" src=\"\/wp-content\/uploads\/2022\/06\/pipeline-1024x482.png\" alt=\"\" class=\"wp-image-9751\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/pipeline-1024x482.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/pipeline-300x141.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/pipeline-768x362.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/pipeline-1536x723.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/pipeline-2048x964.png 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>En Azure, la ingesta de datos a gran escala se implementa mejor mediante la creaci\u00f3n de&nbsp;<em>canalizaciones<\/em>&nbsp;que organicen procesos de ETL. Puede crear y ejecutar canalizaciones mediante&nbsp;<a href=\"https:\/\/azure.microsoft.com\/services\/data-factory\">Azure Data Factory<\/a>, o puede usar el mismo motor de canalizaci\u00f3n en&nbsp;<a href=\"https:\/\/azure.microsoft.com\/services\/synapse-analytics\">Azure Synapse Analytics<\/a>&nbsp;si quiere administrar todos los componentes de la soluci\u00f3n de almacenamiento de datos en un \u00e1rea de trabajo unificada.<\/p>\n\n\n\n<p>En cualquier caso, las canalizaciones constan de una o varias\u00a0<em>actividades<\/em>\u00a0que operan en los datos. Un conjunto de datos de entrada proporciona los datos de origen y las actividades se pueden definir como un flujo de datos que manipula incrementalmente los datos hasta que se genera un conjunto de datos de salida. Las canalizaciones utilizan\u00a0<em>servicios vinculados<\/em>\u00a0para cargar y procesar datos, y esto le permite usar la tecnolog\u00eda adecuada para cada paso del flujo de trabajo. Por ejemplo, puede usar un servicio vinculado de Azure Blob Store para ingerir el conjunto de datos de entrada y, posteriormente, usar servicios como Azure SQL Database para ejecutar un procedimiento almacenado que busque valores de datos relacionados, antes de ejecutar una tarea de procesamiento de datos en Azure Databricks o Azure HDInsight, o aplicar l\u00f3gica personalizada mediante una funci\u00f3n de Azure. Por \u00faltimo, puede guardar el conjunto de datos de salida en un servicio vinculado, como Azure Synapse Analytics. Las canalizaciones tambi\u00e9n pueden incluir algunas actividades integradas, que no requieren un servicio vinculado.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 4: Exploraci\u00f3n de almacenes de datos anal\u00edticos<\/h2>\n\n\n\n<p>Hay dos tipos comunes de almac\u00e9n de datos anal\u00edticos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Almacenamientos de datos<\/h3>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"200\" height=\"227\" src=\"\/wp-content\/uploads\/2022\/06\/data-warehouse.png\" alt=\"\" class=\"wp-image-9791\"\/><\/figure>\n\n\n\n<p>Un\u00a0<em>almacenamiento de datos<\/em>\u00a0es una base de datos relacional en la que los datos se almacenan en un esquema optimizado para el an\u00e1lisis de datos en lugar de en cargas de trabajo transaccionales. Normalmente, los datos de un almac\u00e9n transaccional se organizan en un esquema en el que los valores num\u00e9ricos se almacenan en tablas de\u00a0<em>hechos<\/em>\u00a0centrales, que est\u00e1n relacionadas con una o varias tablas de\u00a0<em>dimensiones<\/em>\u00a0que representan entidades por las que se pueden agregar los datos. Por ejemplo, una tabla de hechos podr\u00eda contener datos de pedidos de ventas, que se pueden agregar por las dimensiones de cliente, producto, tienda y tiempo (lo que le permite, por ejemplo, encontrar f\u00e1cilmente los ingresos totales mensuales de ventas por producto para cada tienda). Este tipo de esquema de tabla de hechos y dimensiones se denomina\u00a0<em>esquema de estrella<\/em>; aunque a menudo se extiende a un\u00a0<em>esquema de copo de nieve<\/em>\u00a0mediante la adici\u00f3n de tablas adicionales relacionadas con las tablas de dimensiones para representar jerarqu\u00edas dimensionales (por ejemplo, el producto puede estar relacionado con categor\u00edas de productos). Un almacenamiento de datos es una excelente opci\u00f3n si tiene datos transaccionales que se pueden organizar en un esquema estructurado de tablas y quiere usar SQL para consultarlos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Lagos de datos<\/h3>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"200\" height=\"224\" src=\"\/wp-content\/uploads\/2022\/06\/data-lake.png\" alt=\"\" class=\"wp-image-9792\"\/><\/figure>\n\n\n\n<p>Un\u00a0<em>lago de datos<\/em>\u00a0es un almac\u00e9n de archivos, normalmente en un sistema de archivos distribuido para el acceso a datos de alto rendimiento. A menudo se usan tecnolog\u00edas como Spark o Hadoop para procesar consultas en los archivos almacenados y devolver datos para informes y an\u00e1lisis. Estos sistemas suelen aplicar un enfoque de\u00a0<em>esquema en lectura<\/em>\u00a0para definir esquemas tabulares en archivos de datos semiestructurados en el punto donde se leen los datos para su an\u00e1lisis, sin aplicar restricciones cuando se almacenan. Los lagos de datos son excelentes para admitir una combinaci\u00f3n de datos estructurados, semiestructurados e incluso no estructurados que quiere analizar sin necesidad de aplicar el esquema cuando los datos se escriben en el almac\u00e9n.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Enfoques h\u00edbridos<\/h3>\n\n\n\n<p>Puede usar un enfoque h\u00edbrido que combine caracter\u00edsticas de lagos de datos y almacenamientos de datos en una\u00a0<em>base de datos de lago<\/em>\u00a0o un\u00a0<em>lago de almacenamiento de datos<\/em>. Los datos sin procesar se almacenan como archivos en un lago de datos y una capa de almacenamiento relacional abstrae los archivos subyacentes y los expone como tablas, que se pueden consultar mediante SQL. Los grupos de SQL de Azure Synapse Analytics incluyen\u00a0<em>PolyBase<\/em>, que permite definir tablas externas basadas en archivos de un lago de datos (y otros or\u00edgenes) y consultarlas mediante SQL. Synapse Analytics tambi\u00e9n admite un enfoque de base de datos de lago en el que puede usar plantillas de base de datos para definir el esquema relacional del almacenamiento de datos, al tiempo que almacena los datos subyacentes en un almacenamiento de lago de datos, separando el almacenamiento y el proceso de la soluci\u00f3n de almacenamiento de datos. Los lagos de almacenamiento de datos son un enfoque relativamente nuevo en los sistemas basados en Spark y se habilitan mediante tecnolog\u00edas como\u00a0<em>Delta Lake<\/em>, que agrega funcionalidades de almacenamiento relacional a Spark, por lo que se pueden definir tablas que exijan esquemas y coherencia transaccional, admitan or\u00edgenes de datos de streaming y cargados por lotes y proporcionen una API de SQL para realizar consultas.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Servicios de Azure para almacenes anal\u00edticos<\/h3>\n\n\n\n<p>En Azure, hay tres servicios principales que puede usar para implementar un almac\u00e9n anal\u00edtico a gran escala<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Synapse Analytic<\/h4>\n\n\n\n<p><strong><a href=\"https:\/\/azure.microsoft.com\/services\/synapse-analytics\">Azure Synapse Analytics<\/a><\/strong>\u00a0es una soluci\u00f3n de un extremo a otro unificada para el an\u00e1lisis de datos a gran escala. Re\u00fane varias tecnolog\u00edas y funcionalidades, y esto permite combinar la integridad y la confiabilidad de los datos de un almacenamiento de datos relacional basado en SQL Server escalable y de alto rendimiento con la flexibilidad de una soluci\u00f3n Apache Spark de c\u00f3digo abierto y lago de datos. Tambi\u00e9n incluye compatibilidad nativa para el an\u00e1lisis de registros y telemetr\u00eda con grupos del Explorador de datos de Azure Synapse, as\u00ed como canalizaciones de datos integradas para la ingesta y la transformaci\u00f3n de datos. Todos los servicios de Azure Synapse Analytics se pueden administrar a trav\u00e9s de una \u00fanica interfaz de usuario interactiva denominada Azure Synapse Studio, que incluye la capacidad de crear cuadernos interactivos en los que se pueden combinar c\u00f3digo de Spark y contenido de Markdown. Synapse Analytics es una excelente opci\u00f3n cuando se quiere crear una \u00fanica soluci\u00f3n de an\u00e1lisis unificada en Azure.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Databrick<\/h4>\n\n\n\n<p><strong><a href=\"https:\/\/azure.microsoft.com\/services\/databricks\">Azure Databricks<\/a><\/strong>\u00a0es una implementaci\u00f3n de Azure de la popular plataforma Databricks. Databricks es una completa soluci\u00f3n de an\u00e1lisis de datos integrada en Apache Spark y ofrece funcionalidades nativas de SQL, as\u00ed como cl\u00fasteres de Spark optimizados para cargas de trabajo para el an\u00e1lisis de datos y la ciencia de datos. Databricks proporciona una interfaz de usuario interactiva a trav\u00e9s de la cual se puede administrar el sistema y se pueden explorar los datos en cuadernos interactivos. Debido a su uso com\u00fan en varias plataformas en la nube, es posible que quiera considerar el uso de Azure Databricks como almac\u00e9n anal\u00edtico si quiere usar la experiencia existente con la plataforma o si necesita operar en un entorno de varias nubes o admitir una soluci\u00f3n port\u00e1til en la nube.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Azure HDInsight<\/h4>\n\n\n\n<p><strong><a href=\"https:\/\/azure.microsoft.com\/services\/hdinsight\">Azure HDInsight<\/a><\/strong>\u00a0es un servicio de Azure que admite varios tipos de cl\u00fasteres de an\u00e1lisis de datos de c\u00f3digo abierto. Aunque no es tan f\u00e1cil de usar como Azure Synapse Analytics y Azure Databricks, puede ser una opci\u00f3n adecuada si la soluci\u00f3n de an\u00e1lisis se basa en varios marcos de c\u00f3digo abierto o si necesita migrar una soluci\u00f3n local existente basada en Hadoop a la nube.<\/p>\n\n\n\n<p><strong>Nota<\/strong><\/p>\n\n\n\n<p>Cada uno de estos servicios puede considerarse como un&nbsp;<em>almac\u00e9n<\/em>&nbsp;de datos anal\u00edticos, en el sentido de que proporcionan un esquema y una interfaz a trav\u00e9s de los cuales se pueden consultar los datos. Sin embargo, en muchos casos, los datos se almacenan realmente en un lago de datos y el servicio se usa para&nbsp;<em>procesar<\/em>&nbsp;los datos y ejecutar consultas. Algunas soluciones pueden incluso combinar el uso de estos servicios. Un proceso de ingesta de&nbsp;<em>extracci\u00f3n, carga y transformaci\u00f3n<\/em>&nbsp;(ELT) puede copiar datos en el lago de datos y, posteriormente, usar uno de estos servicios para transformar los datos y otro para consultarlos. Por ejemplo, una canalizaci\u00f3n puede usar un trabajo de MapReduce que se ejecuta en HDInsight o un cuaderno que se ejecuta en Azure Databricks para procesar un gran volumen de datos en el lago de datos y, posteriormente, cargarlo en tablas de un grupo de SQL en Azure Synapse Analytics.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">MCT: Video 4.1.2 Descripci\u00f3n de los servicios para el procesamiento de datos moderno<\/h2>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Descripcio\u0301n del procesamiento de datos\" width=\"1290\" height=\"726\" src=\"https:\/\/www.youtube.com\/embed\/aLTo9FotKQk?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 es Azure Data Factory?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un servicio de integraci\u00f3n de datos<\/li><li>Su prop\u00f3sito es recuperar datos de uno o m\u00e1s or\u00edgenes de datos<\/li><li>Y convertirlos a una formato que se procese <\/li><li>Los or\u00edgenes de datos pueden presentar datos de formas distintas y contener ruido que se necesita filtrar<\/li><li>Adem\u00e1s permite extraer los datos interesantes y descartar el resto<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"414\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1663-1024x414.png\" alt=\"\" class=\"wp-image-9753\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1663-1024x414.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1663-300x121.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1663-768x310.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1663.png 1227w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Es posible que los datos interesantes no est\u00e9n en un formato adecuado para que el resto de los servicios de la soluci\u00f3n de almacenamiento los procesen, as\u00ed que se pueden transformar<\/li><li>Ejemplo:<ul><li>Los datos pueden contener fechas y horas con distintos formatos en distintos or\u00edgenes de datos<\/li><li>Se puede utilizar Azure Data Factory para transformar estos datos en una \u00fanica estructura uniforme <\/li><li>Posteriormente Azure data Factory puede escribir los datos ingeridos en un almac\u00e9n de datos para su posterior procesamiento<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"505\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1664-1024x505.png\" alt=\"\" class=\"wp-image-9754\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1664-1024x505.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1664-300x148.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1664-768x379.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1664.png 1265w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>El trabajo que realiza Azure Data Factory se define como una canalizaci\u00f3n de operaciones <\/li><li>Una canalizaci\u00f3n se puede ejecutar continuamente ya que los datos se reciben desde los distintos or\u00edgenes de datos <\/li><li>Se pueden crear las canalizaciones mediante la interfaz gr\u00e1fica de usuario que proporciona Azure o escribiendo su propio c\u00f3digo <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"428\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1665-1024x428.png\" alt=\"\" class=\"wp-image-9755\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1665-1024x428.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1665-300x125.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1665-768x321.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1665.png 1161w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 es Azure Data Lake Storage?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Un lago de datos es un repositorio para una gran cantidad de datos sin procesar<\/li><li>Como los datos est\u00e1n sin procesar es muy r\u00e1pido cargarlos y actualizarlos <\/li><li>Pero los datos no tienen una estructura adecuada para realizar un an\u00e1lisis eficaz <\/li><li>Una lago de datos se puede considerar como un punto de almacenamiento provisional para los datos ingeridos, antes que se acomoden y se conviertan en un formato adecuado para realizar el an\u00e1lisis<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"483\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1666-1024x483.png\" alt=\"\" class=\"wp-image-9756\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1666-1024x483.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1666-300x142.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1666-768x362.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1666.png 1236w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Combina la sem\u00e1ntica jer\u00e1rquica  del sistema de archivos y la estructura de directorios de un sistema de archivos tradicional con la seguridad y la escalabilidad que ofrece Azure<\/li><li>B\u00e1sicamente es una extensi\u00f3n de <strong>Azure Blob Storage<\/strong> que se organiza como un sistema de archivos casi infinito <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"512\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1667-1024x512.png\" alt=\"\" class=\"wp-image-9758\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1667-1024x512.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1667-300x150.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1667-768x384.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1667.png 1230w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Las caracter\u00edsticas son:<ul><li><strong>La mejor organizaci\u00f3n de los archivos: <\/strong>organiza los archivos en directorios y subdirectorios para mejorar la organizaci\u00f3n de los archivos. Blob Storage solo puede limitar una estructura de directorio <\/li><li><strong>Permisos de POSIX:<\/strong> admite los permisos del archivo y directorio Portable Operating System Interface para habilitar  el control de acceso basado en roles <strong>RBAC<\/strong><\/li><li><strong>Compatible con HDFS:<\/strong> es compatible con el sistema de archivos distribuido de <strong>Hadoop<\/strong><ul><li>Hadoop es un servicio de an\u00e1lisis muy flexible y programable que utilizan muchas organizaciones para examinar grandes cantidades de datos. Todos los entornos de Apache Hadoop pueden acceder a los datos de Azurer Data Lake Storage a partir de la generaci\u00f3n 2 <\/li><\/ul><\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"447\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1668-1024x447.png\" alt=\"\" class=\"wp-image-9761\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1668-1024x447.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1668-300x131.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1668-768x335.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1668.png 1195w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 es Azure Databrick?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un entorno de Apache Spark que se ejecuta en Azure<\/li><li>Proporciona procesamiento de macrodatos, streaming y aprendizaje autom\u00e1tico <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"395\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1669-1024x395.png\" alt=\"\" class=\"wp-image-9762\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1669-1024x395.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1669-300x116.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1669-768x297.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1669.png 1212w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un motor de procesamiento de datos muy eficaz que puede consumir grandes cantidades de datos y procesarlos con mucha rapidez<\/li><li>Existe una considerable cantidad de bibliotecas de Spark que se pueden utilizar para realizar tareas como el procesamiento de SQL, las agregaciones, as\u00ed como compilar y entrenar modelos de Machine Learning<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"391\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1670-1024x391.png\" alt=\"\" class=\"wp-image-9763\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1670-1024x391.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1670-300x115.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1670-768x293.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1670.png 1226w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Proporciona una interfaz gr\u00e1fica de usuario en la cual se puede definir y probar el procesamiento paso a paso, antes de enviarlo como un conjunto de tareas por lotes<\/li><li>Se puede crear script&#8217;s de DataBricks y consultar datos mediante lenguajes como R, python, XXX<\/li><li>El c\u00f3digo de spark se escribe mediante cuadernos un cuaderno contiene celdas y cada una de estas incluye un bloque de c\u00f3digo independiente <\/li><li>Al ejecutar un cuaderno el c\u00f3digo de cada celda se pasa por Spark uno a uno para su ejecuci\u00f3n <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"501\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1671-1024x501.png\" alt=\"\" class=\"wp-image-9765\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1671-1024x501.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1671-300x147.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1671-768x376.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1671.png 1232w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 es Azure Synapse Analytic?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un motor de an\u00e1lisis que esta dise\u00f1o para procesar grandes cantidades de datos con mucha rapidez  <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"478\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1672-1024x478.png\" alt=\"\" class=\"wp-image-9767\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1672-1024x478.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1672-300x140.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1672-768x358.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1672.png 1147w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Se pueden ingerir datos de or\u00edgenes externos como archivos planos, Azure Data Lake u otros sistema de Administraci\u00f3n de bases de datos <\/li><li>Y despu\u00e9s se pueden transformar estos datos y agregarlos a un formato adecuado para el procesamiento de an\u00e1lisis <\/li><li>Se pueden realizar consultas complejas sobre estos datos y generar informes, grafos y gr\u00e1ficos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"526\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1673-1024x526.png\" alt=\"\" class=\"wp-image-9768\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1673-1024x526.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1673-300x154.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1673-768x395.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1673.png 1152w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>La lectura y transformaci\u00f3n de datos de un origen externo puede consumir bastantes recursos <\/li><li>Azure Synapse Analytic permite almacenar los datos que ha le\u00eddo y procesado localmente dentro del servicio<\/li><li>Este enfoque permite consultar repetidamente los mismos datos sin la sobre carga que supone capturarlos y convertirlos <\/li><li>tambi\u00e9n se pueden utilizar estos datos como la entrada para realizar un procesamiento anal\u00edtico adicional mediante <strong>Azure Analytic Service <\/strong><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"537\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1674-1-1024x537.png\" alt=\"\" class=\"wp-image-9772\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1674-1-1024x537.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1674-1-300x157.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1674-1-768x403.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1674-1.png 1212w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Azure Synapse Analytic utiliza una arquitectura de procesamiento paralelo masivo <\/li><li>Esta arquitectura incluye un nodo de control y un grupo de nodos de ejecuci\u00f3n <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"556\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1675-1-1024x556.png\" alt=\"\" class=\"wp-image-9774\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1675-1-1024x556.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1675-1-300x163.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1675-1-768x417.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1675-1.png 1157w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>El nodo de control es el cerebro de la arquitectura, es el front end que interactu\u00e1 con las aplicaciones<\/li><li>El motor se ejecuta con el nodo de control para optimizar y coordinar las consultas en paralelo <\/li><li>Cuando se env\u00eda una solicitud de procesamiento el nodo de control la transforma en solicitudes m\u00e1s peque\u00f1as que se ejecutan en distintos sub-conjuntos de datos en paralelo<\/li><li>Los nodos de ejecuci\u00f3n proporcionan la potencia computacional <\/li><li>Los datos que se van a procesar se distribuyen uniformemente entre los nodos<\/li><li>Los usuarios y las aplicaciones que env\u00edan solicitudes de procesamiento al nodo de control, este env\u00edan las solicitudes a los nodos de ejecuci\u00f3n que las ejecutan las en la porci\u00f3n de datos que ellos contienen <\/li><li>Cuando todos los nodos finalizan el procesamiento los resultados se devuelven al nodo de control, donde se combinan en un resultado global <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"534\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1676-1024x534.png\" alt=\"\" class=\"wp-image-9775\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1676-1024x534.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1676-300x157.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1676-768x401.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1676.png 1198w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 es Azure Analysis Services?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Permite compilar modelos tabulares para admitir consultas de procesamiento anal\u00edtico en linea<\/li><li>Puede combinar datos de varios or\u00edgenes como: Azure SQL Data Base, Azure Synapse Analytic, Azure Data Lake Storage ; Azure Cosmos DB y muchos otros<\/li><li>Estos or\u00edgenes de datos utilizan para compilar modelos que incorporan su conocimiento empresarial<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"489\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1677-1024x489.png\" alt=\"\" class=\"wp-image-9777\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1677-1024x489.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1677-300x143.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1677-768x367.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1677.png 1247w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Un modelo es un conjunto de consultas y expresiones que recuperan datos de los distintos or\u00edgenes datos y generan resultados<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"473\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1678-1024x473.png\" alt=\"\" class=\"wp-image-9779\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1678-1024x473.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1678-300x139.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1678-768x355.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1678.png 1354w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Los resultados se pueden copiar en la cach\u00e9, en la memoria para su uso posterior <\/li><li>o se pueden calcular din\u00e1micamente a partir de os or\u00edgenes de datos subyacentes <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"492\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1679-1024x492.png\" alt=\"\" class=\"wp-image-9780\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1679-1024x492.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1679-300x144.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1679-768x369.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1679.png 1203w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Incluye un dise\u00f1o gr\u00e1fico para ayudar a conectar or\u00edgenes de datos y definir consultar que Combinen, Filtren y Agreguen datos<\/li><li>Se pueden explorar estos datos desde Azure Analytic Services o se puede utilizar una herramienta como Microsoft Power BI<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"438\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1680-1024x438.png\" alt=\"\" class=\"wp-image-9782\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1680-1024x438.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1680-300x128.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1680-768x328.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1680.png 1350w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Comparaci\u00f3n de Analytics Services vs Synapse Analytic<\/h3>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Analysis Services<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Tiene una superposici\u00f3n funcional considerable con Azure Synpase Analytic, pero es m\u00e1s adecuado para realizar un procesamiento a una escala menor<\/li><li>Se utiliza para:<ul><li>Vol\u00famenes peque\u00f1os de datos (pocos TB)<\/li><li>varios or\u00edgenes<\/li><li>Simultaneidad de lectura elevada (miles de usuarios)<\/li><li>An\u00e1lisis detallado y exploraci\u00f3n en profundidad de los datos mediante las funciones de Power BI<\/li><li>Desarrollo r\u00e1pido de paneles a partir de datos tabulares<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"414\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1682-1024x414.png\" alt=\"\" class=\"wp-image-9784\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1682-1024x414.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1682-300x121.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1682-768x311.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1682.png 1297w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Azure Synpase Analytics<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Se utiliza para<ul><li>Vol\u00famenes de datos muy grandes desde TB a pentabytes<\/li><li>Consultas y agregaciones muy complejas <\/li><li>Exploraci\u00f3n y miner\u00eda de datos<\/li><li>Operaciones de WTL complejas<\/li><li>Simultaneidad de baja a media<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"429\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1681-1024x429.png\" alt=\"\" class=\"wp-image-9783\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1681-1024x429.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1681-300x126.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1681-768x322.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1681.png 1368w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Combinaci\u00f3n de Analytics Services con Synapse Analytic<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Si se tiene grandes cantidades de datos ingeridos que requieren procesamiento se puede utilizar Azure Synapse Analytic para leer estos datos y manipularlos en un modelo que incluya informaci\u00f3n empresarial en lugar de una gran cantidad de datos sin procesar <\/li><li>Azure Synapse Analytic permite procesar y reducir muchos TB&#8217;s de datos en un conjunto de datos concisos y m\u00e1s peque\u00f1o que resumen y agrega gran parte de estos datos<\/li><li>Posteriormente se puede utilizar Azure Analysis Service para realizar el interrogatorio detallado de esta informaci\u00f3n y visualizar los resultados de estas consultas con Power BI<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"510\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1683-1024x510.png\" alt=\"\" class=\"wp-image-9786\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1683-1024x510.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1683-300x149.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1683-768x383.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1683.png 1365w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 es Azure HDInsight?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un modelo de servicio de procesamiento de macrodatos <\/li><li>Que proporciona la plataforma para tecnolog\u00edas como Spark en un entrono de Azure<\/li><li>Implementa un modelo de cluster que distribuye el procesamiento en un conjunto de equipos <\/li><li>Este modelo es similar al que utiliza Azure Synapse Analytic<\/li><li>Pero los nodos ejecutan el modelo de procesamiento de spark en lugar de Azure SQL Database<\/li><li>Se puede utilizar Azure HDInsight junto a Azure Synapse Analytic<\/li><li>Ademas de Spark tambi\u00e9n permite tecnolog\u00edas de streaming como apache o el modelo de procesamiento de Haddop<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"516\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1684-1024x516.png\" alt=\"\" class=\"wp-image-9787\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1684-1024x516.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1684-300x151.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1684-768x387.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1684.png 1321w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 5: Ejercicio: exploraci\u00f3n de Azure Synapse Analytics<\/h2>\n\n\n\n<p>En este ejercicio, crear\u00e1 un \u00e1rea de trabajo de Azure Synapse Analytics y la usar\u00e1 para ingerir y analizar algunos datos.<\/p>\n\n\n\n<p>El ejercicio est\u00e1 dise\u00f1ado para que pueda familiarizarse con algunos elementos clave de una soluci\u00f3n moderna de almacenamiento de datos, no como una gu\u00eda completa para realizar an\u00e1lisis avanzados de datos con Azure Synapse Analytics. El ejercicio debe tardar unos 30\u00a0minutos en completarse.<\/p>\n\n\n\n<p><strong>Nota<\/strong><\/p>\n\n\n\n<p>Para completar este ejercicio, necesitar\u00e1 una suscripci\u00f3n a Microsoft\u00a0Azure. Si a\u00fan no tiene una, puede solicitar una prueba gratuita en\u00a0<a href=\"https:\/\/azure.microsoft.com\/free\">https:\/\/azure.microsoft.com\/free<\/a>. No puede usar una suscripci\u00f3n de espacio aislado de Microsoft Learn para este ejercicio.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Aprovisionar un \u00e1rea de trabajo de Azure\u00a0Synapse\u00a0Analytics<\/h3>\n\n\n\n<p>Para usar Azure Synapse Analytics, debe aprovisionar un recurso en el \u00e1rea de trabajo de Azure Synapse Analytics en la suscripci\u00f3n de Azure.<\/p>\n\n\n\n<p>Abra Azure Portal en\u00a0<a href=\"https:\/\/portal.azure.com\/\">https:\/\/portal.azure.com<\/a>\u00a0e inicie sesi\u00f3n con las credenciales asociadas con su suscripci\u00f3n de Azure.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"932\" height=\"246\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1685.png\" alt=\"\" class=\"wp-image-9795\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1685.png 932w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1685-300x79.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1685-768x203.png 768w\" sizes=\"(max-width: 932px) 100vw, 932px\" \/><\/figure>\n\n\n\n<p>En Azure Portal, en la p\u00e1gina\u00a0<strong>Inicio<\/strong>, use el icono\u00a0<strong>+ Crear<\/strong>\u00a0para recurso para crear un nuevo recurso.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"287\" height=\"187\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1686.png\" alt=\"\" class=\"wp-image-9796\"\/><\/figure>\n\n\n\n<p>Busque\u00a0<em>Azure Synapse Analytics<\/em>, y cree un recurso de\u00a0<strong>Azure Synapse Analytics<\/strong>\u00a0con la siguiente configuraci\u00f3n:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Suscripci\u00f3n<\/strong>:\u00a0<em>suscripci\u00f3n de Azure<\/em><ul><li><strong>Grupo de recursos<\/strong>:\u00a0<em>cree un grupo de recursos con un nombre apropiado, como \u00absynapse-rg\u00bb<\/em>.<\/li><li><strong>Grupo de recursos administrado<\/strong>:\u00a0<em>escriba un nombre adecuado, por ejemplo, \u00absynapse-managed-rg\u00bb<\/em>.<\/li><\/ul><\/li><li><strong>Nombre del \u00e1rea de trabajo<\/strong>:\u00a0<em>escriba un nombre \u00fanico para el \u00e1rea de trabajo, por ejemplo, \u00absynapse-ws-su_nombre\u00bb<\/em>.<\/li><li><strong>Regi\u00f3n<\/strong>:\u00a0<em>seleccione cualquiera de las siguientes regiones:<\/em><ul><li>Este de Australia<\/li><li>Centro de EE. UU.<\/li><li>Este de EE. UU. 2<\/li><li>Norte de Europa<\/li><li>Centro-sur de EE. UU.<\/li><li>Sudeste de Asia<\/li><li>Sur de Reino Unido<\/li><li>Oeste de Europa<\/li><li>Oeste de EE. UU.<\/li><li>WestUS 2<\/li><\/ul><\/li><li><strong>Seleccionar Data Lake Storage Gen\u00a02<\/strong>: en la suscripci\u00f3n.<ul><li><strong>Nombre de cuenta<\/strong>:\u00a0<em>cree una cuenta con un nombre \u00fanico, por ejemplo, \u00abdatalakeyour_name\u00bb<\/em>.<\/li><li><strong>Nombre del sistema de archivos<\/strong>:\u00a0<em>cree un sistema de archivos con un nombre \u00fanico, por ejemplo, \u00abfsyour_name\u00bb<\/em>.<\/li><\/ul><\/li><\/ul>\n\n\n\n<p><strong>\u00a0Nota<\/strong><\/p>\n\n\n\n<p class=\"has-gray-color has-text-color\">Un \u00e1rea de trabajo de Synapse Analytics requiere dos grupos de recursos en la suscripci\u00f3n de Azure; uno para los recursos creados expl\u00edcitamente y otro para los recursos administrados utilizados por el servicio. Tambi\u00e9n requiere una cuenta de almacenamiento de Data Lake en la que almacenar datos, scripts y otros artefactos.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"626\" height=\"308\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1687.png\" alt=\"\" class=\"wp-image-9798\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1687.png 626w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1687-300x148.png 300w\" sizes=\"(max-width: 626px) 100vw, 626px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"767\" height=\"699\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1688.png\" alt=\"\" class=\"wp-image-9799\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1688.png 767w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1688-300x273.png 300w\" sizes=\"(max-width: 767px) 100vw, 767px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"802\" height=\"400\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1689.png\" alt=\"\" class=\"wp-image-9800\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1689.png 802w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1689-300x150.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1689-768x383.png 768w\" sizes=\"(max-width: 802px) 100vw, 802px\" \/><\/figure>\n\n\n\n<p>Cuando haya especificado estos detalles, seleccione\u00a0<strong>Revisar y crear<\/strong>\u00a0y, a continuaci\u00f3n, seleccione\u00a0<strong>Crear<\/strong>\u00a0para crear el \u00e1rea de trabajo.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"787\" height=\"808\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1690.png\" alt=\"\" class=\"wp-image-9802\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1690.png 787w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1690-292x300.png 292w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1690-768x788.png 768w\" sizes=\"(max-width: 787px) 100vw, 787px\" \/><\/figure>\n\n\n\n<p>Espere a que se cree el \u00e1rea de trabajo; puede tardar unos cinco minutos.<\/p>\n\n\n\n<p>Una vez completada la implementaci\u00f3n, vaya al grupo de recursos que se cre\u00f3 y observe que contiene el \u00e1rea de trabajo de Synapse Analytics y una cuenta de almacenamiento de Data Lake.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"370\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1691-1024x370.png\" alt=\"\" class=\"wp-image-9804\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1691-1024x370.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1691-300x108.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1691-768x278.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1691.png 1226w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"416\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1692-1024x416.png\" alt=\"\" class=\"wp-image-9805\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1692-1024x416.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1692-300x122.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1692-768x312.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1692-1536x625.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1692.png 1901w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Seleccione el \u00e1rea de trabajo de Synapse y, en su p\u00e1gina\u00a0<strong>Informaci\u00f3n general<\/strong>, en la tarjeta\u00a0<strong>Abrir Synapse Studio<\/strong>, seleccione\u00a0<strong>Abrir<\/strong>\u00a0para abrir Synapse Studio en una nueva pesta\u00f1a del explorador. Synapse Studio es una interfaz basada en web que puede usar para trabajar con el \u00e1rea de trabajo de Synapse Analytics.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"661\" height=\"253\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1693.png\" alt=\"\" class=\"wp-image-9807\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1693.png 661w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1693-300x115.png 300w\" sizes=\"(max-width: 661px) 100vw, 661px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"447\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1694-1024x447.png\" alt=\"\" class=\"wp-image-9808\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1694-1024x447.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1694-300x131.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1694-768x335.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1694-1536x671.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1694.png 1834w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>En el lado izquierdo de Synapse Studio, use el icono\u00a0<strong>\u203a\u203a<\/strong>\u00a0para expandir el men\u00fa; esto muestra las distintas p\u00e1ginas de Synapse Studio que usar\u00e1 para administrar recursos y realizar tareas de an\u00e1lisis de datos, como se muestra aqu\u00ed:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"431\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1695-1024x431.png\" alt=\"\" class=\"wp-image-9810\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1695-1024x431.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1695-300x126.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1695-768x323.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1695-1536x646.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1695.png 1908w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"459\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1696-1024x459.png\" alt=\"\" class=\"wp-image-9811\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1696-1024x459.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1696-300x135.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1696-768x345.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1696-1536x689.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1696.png 1870w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Ingerir datos<\/h3>\n\n\n\n<p>Una de las tareas clave que puede realizar con Azure Synapse Analytics es definir\u00a0<em>canalizaciones<\/em>\u00a0que transfieran (y, si es necesario, transformen) datos de una amplia variedad de or\u00edgenes al \u00e1rea de trabajo para su an\u00e1lisis.<\/p>\n\n\n\n<p>En la p\u00e1gina\u00a0<strong>Inicio<\/strong>\u00a0de Synapse Studio, seleccione\u00a0<strong>Ingerir<\/strong>\u00a0y, despu\u00e9s, haga clic en\u00a0<strong>Built-in copy task<\/strong>\u00a0(Tarea de copia integrada) para abrir la herramienta\u00a0<strong>Copiar datos<\/strong>.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"536\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1697-1024x536.png\" alt=\"\" class=\"wp-image-9813\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1697-1024x536.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1697-300x157.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1697-768x402.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1697.png 1246w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"491\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1699-1-1024x491.png\" alt=\"\" class=\"wp-image-9815\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1699-1-1024x491.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1699-1-300x144.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1699-1-768x368.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1699-1-1536x736.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1699-1.png 1757w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>En el paso\u00a0<strong>Origen<\/strong>, en el subpaso\u00a0<strong>Conjunto de datos<\/strong>, seleccione la siguiente configuraci\u00f3n:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Tipo de origen<\/strong>: HTTP<\/li><li><strong>Conexi\u00f3n<\/strong>:\u00a0<em>cree una conexi\u00f3n con las propiedades siguientes:<\/em><ul><li><strong>Nombre<\/strong>: productos de AdventureWorks<\/li><li><strong>Descripci\u00f3n<\/strong>: lista de productos a trav\u00e9s de HTTP<\/li><li><strong>Conectar mediante Integration Runtime<\/strong>: AutoResolveIntegrationRuntime<\/li><li><strong>Direcci\u00f3n URL base<\/strong>: https:\/\/raw.githubusercontent.com\/MicrosoftLearning\/DP-900T00A-Azure-Data-Fundamentals\/master\/Azure-Synapse\/products.csv<\/li><li><strong>Validaci\u00f3n del certificado de servidor<\/strong>: habilitar<\/li><li><strong>Tipo de autenticaci\u00f3n<\/strong>: an\u00f3nimo<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"352\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1700-1024x352.png\" alt=\"\" class=\"wp-image-9816\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1700-1024x352.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1700-300x103.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1700-768x264.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1700.png 1295w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"456\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1701-1024x456.png\" alt=\"\" class=\"wp-image-9817\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1701-1024x456.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1701-300x134.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1701-768x342.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1701-1536x684.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1701.png 1902w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Despu\u00e9s de crear la conexi\u00f3n, en el subpaso\u00a0<strong>Origen\/Conjunto de datos<\/strong>, aseg\u00farese de que est\u00e1 seleccionada la siguiente configuraci\u00f3n y, a continuaci\u00f3n, seleccione\u00a0<strong>Siguiente\u00a0<\/strong>:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Direcci\u00f3n URL relativa<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><li><strong>Request method<\/strong>\u00a0(M\u00e9todo de solicitud): GET<\/li><li><strong>Encabezados adicionales<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><li><strong>Copia binaria<\/strong>:\u00a0sin\u00a0seleccionar<\/li><li><strong>Tiempo de espera de solicitud<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><li><strong>N\u00famero m\u00e1ximo de conexiones simult\u00e1neas<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"624\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1702-1024x624.png\" alt=\"\" class=\"wp-image-9818\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1702-1024x624.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1702-300x183.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1702-768x468.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1702.png 1377w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>En el paso\u00a0<strong>Origen<\/strong>, en el subpaso\u00a0<strong>Configuraci\u00f3n<\/strong>, seleccione\u00a0<strong>Vista previa de los datos<\/strong>\u00a0para obtener una vista previa de los datos del producto que la canalizaci\u00f3n va a ingerir y, a continuaci\u00f3n, cierre la vista previa.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"482\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1703-1024x482.png\" alt=\"\" class=\"wp-image-9819\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1703-1024x482.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1703-300x141.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1703-768x362.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1703.png 1225w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"555\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1704-1024x555.png\" alt=\"\" class=\"wp-image-9820\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1704-1024x555.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1704-300x163.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1704-768x416.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1704.png 1420w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Despu\u00e9s de previsualizar los datos, en el paso\u00a0<strong>Origen\/Configuraci\u00f3n<\/strong>, aseg\u00farese de que est\u00e1 seleccionada la siguiente configuraci\u00f3n y, a continuaci\u00f3n, seleccione\u00a0<strong>Siguiente\u00a0<\/strong>:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Formato de archivo<\/strong>: DelimitedText<\/li><li><strong>Delimitador de columna<\/strong>: coma (,)<\/li><li><strong>Delimitador de fila<\/strong>: avance de l\u00ednea (\\n)<\/li><li><strong>Primera fila como encabezado<\/strong>: seleccionada<\/li><li><strong>Tipo de compresi\u00f3n<\/strong>: ninguno<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"712\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1705-1024x712.png\" alt=\"\" class=\"wp-image-9821\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1705-1024x712.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1705-300x209.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1705-768x534.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1705.png 1218w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>En el paso\u00a0<strong>Destino<\/strong>, en el subpaso\u00a0<strong>Conjunto de datos<\/strong>, seleccione la siguiente configuraci\u00f3n:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Tipo de destino<\/strong>: Azure Data Lake Storage Gen\u00a02 <\/li><li><strong>Conexi\u00f3n<\/strong>:\u00a0<em>cree una conexi\u00f3n con las siguientes propiedades:<\/em><ul><li><strong>Nombre<\/strong>: Productos<\/li><li><strong>Descripci\u00f3n<\/strong>: lista de productos<\/li><li><strong>Conectar mediante Integration Runtime<\/strong>: AutoResolveIntegrationRuntime<\/li><li><strong>M\u00e9todo de autenticaci\u00f3n<\/strong>: clave de cuenta<\/li><li><strong>M\u00e9todo de selecci\u00f3n de cuenta<\/strong>: desde la suscripci\u00f3n<ul><li><strong>Suscripci\u00f3n de Azure<\/strong>:\u00a0<em>seleccione su suscripci\u00f3n<\/em><\/li><li><strong>Nombre de la cuenta de almacenamiento<\/strong>:\u00a0<em>seleccione su cuenta de almacenamiento<\/em><\/li><\/ul><\/li><li><strong>Prueba de conexi\u00f3n<\/strong>: al servicio vinculado<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"355\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1706-1024x355.png\" alt=\"\" class=\"wp-image-9822\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1706-1024x355.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1706-300x104.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1706-768x266.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1706.png 1317w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"461\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1707-1024x461.png\" alt=\"\" class=\"wp-image-9823\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1707-1024x461.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1707-300x135.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1707-768x346.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1707-1536x692.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1707.png 1891w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Despu\u00e9s de crear la conexi\u00f3n, en el paso\u00a0<strong>Destino\/Conjunto de datos<\/strong>, aseg\u00farese de que est\u00e1 seleccionada la siguiente configuraci\u00f3n y, a continuaci\u00f3n, seleccione\u00a0<strong>Siguiente\u00a0<\/strong>:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Ruta de acceso de la carpeta<\/strong>:\u00a0<em>vaya a la carpeta del sistema de archivos<\/em><\/li><li><strong>Nombre de archivo<\/strong>: products.csv<\/li><li><strong>Comportamiento de copia<\/strong>: ninguno<\/li><li><strong>N\u00famero m\u00e1ximo de conexiones simult\u00e1neas<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><li><strong>Tama\u00f1o de bloque (MB)<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"478\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1708-1024x478.png\" alt=\"\" class=\"wp-image-9825\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1708-1024x478.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1708-300x140.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1708-768x359.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1708.png 1360w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"354\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1709-1024x354.png\" alt=\"\" class=\"wp-image-9826\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1709-1024x354.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1709-300x104.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1709-768x266.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1709.png 1041w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"706\" height=\"826\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1710.png\" alt=\"\" class=\"wp-image-9827\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1710.png 706w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1710-256x300.png 256w\" sizes=\"(max-width: 706px) 100vw, 706px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"776\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1711-1024x776.png\" alt=\"\" class=\"wp-image-9828\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1711-1024x776.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1711-300x227.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1711-768x582.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1711.png 1113w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>En el paso\u00a0<strong>Destino,<\/strong>\u00a0en el subpaso\u00a0<strong>Configuraci\u00f3n<\/strong>, aseg\u00farese de que est\u00e1n seleccionadas las siguientes propiedades. Luego, seleccione\u00a0<strong>Siguiente\u00a0<\/strong>:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Formato de archivo<\/strong>: DelimitedText<\/li><li><strong>Delimitador de columna<\/strong>: coma (,)<\/li><li><strong>Delimitador de fila<\/strong>: avance de l\u00ednea (\\n)<\/li><li><strong>Agregar encabezado al archivo<\/strong>: seleccionado<\/li><li><strong>Tipo de compresi\u00f3n<\/strong>: ninguno<\/li><li><strong>N\u00famero m\u00e1ximo de filas por archivo<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><li><strong>Prefijo de nombre de archivo<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"811\" height=\"843\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1712.png\" alt=\"\" class=\"wp-image-9830\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1712.png 811w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1712-289x300.png 289w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1712-768x798.png 768w\" sizes=\"(max-width: 811px) 100vw, 811px\" \/><\/figure>\n\n\n\n<p>En el paso\u00a0<strong>Configuraci\u00f3n<\/strong>, configure las opciones siguientes y, a continuaci\u00f3n, haga clic en\u00a0<strong>Siguiente\u00a0<\/strong>:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Nombre de tarea<\/strong>: copiar productos<\/li><li><strong>Descripci\u00f3n de la tarea<\/strong>: copia de datos de productos<\/li><li><strong>Tolerancia a errores<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><li><strong>Habilitar registro<\/strong>:\u00a0sin\u00a0seleccionar<\/li><li><strong>Habilitar almacenamiento provisional<\/strong>:\u00a0sin\u00a0seleccionar<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"920\" height=\"852\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1713.png\" alt=\"\" class=\"wp-image-9832\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1713.png 920w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1713-300x278.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1713-768x711.png 768w\" sizes=\"(max-width: 920px) 100vw, 920px\" \/><\/figure>\n\n\n\n<p>En el paso\u00a0<strong>Revisar y finalizar<\/strong>, en el subpaso\u00a0<strong>Revisar<\/strong>, lea el resumen y, a continuaci\u00f3n, haga clic en\u00a0<strong>Siguiente\u00a0<\/strong>.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"756\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1714-1024x756.png\" alt=\"\" class=\"wp-image-9834\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1714-1024x756.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1714-300x222.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1714-768x567.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1714.png 1147w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>En el paso\u00a0<strong>Implementaci\u00f3n<\/strong>, espere a que se implemente la canalizaci\u00f3n y, a continuaci\u00f3n, haga clic en\u00a0<strong>Finalizar<\/strong>.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"635\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1716-1024x635.png\" alt=\"\" class=\"wp-image-9835\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1716-1024x635.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1716-300x186.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1716-768x476.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1716.png 1487w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ol class=\"wp-block-list\"><li>En Synapse Studio, seleccione la p\u00e1gina\u00a0<strong>Supervisar<\/strong>\u00a0y, en la pesta\u00f1a\u00a0<strong>Ejecuciones de canalizaciones<\/strong>, espere a que la canalizaci\u00f3n\u00a0<strong>Copy products<\/strong>\u00a0se complete con el estado\u00a0<strong>Correcto<\/strong>\u00a0(puede usar el bot\u00f3n\u00a0<strong>\u21bb Actualizar<\/strong>\u00a0de la p\u00e1gina Ejecuciones de canalizaciones para actualizar el estado).<\/li><li>En la p\u00e1gina\u00a0<strong>Datos<\/strong>, seleccione la pesta\u00f1a\u00a0<strong>Vinculado<\/strong>\u00a0y expanda la jerarqu\u00eda de\u00a0<strong>Azure Data Lake Storage Gen\u00a02<\/strong>\u00a0hasta que vea el almacenamiento de archivos para el \u00e1rea de trabajo de Synapse. A continuaci\u00f3n, seleccione el almacenamiento de archivos para comprobar que un archivo llamado\u00a0<strong>products.csv<\/strong>\u00a0se ha copiado en esta ubicaci\u00f3n, como se muestra aqu\u00ed:<\/li><\/ol>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"678\" height=\"501\" src=\"\/wp-content\/uploads\/2022\/06\/synapse-storage.png\" alt=\"\" class=\"wp-image-9836\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/synapse-storage.png 678w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/synapse-storage-300x222.png 300w\" sizes=\"(max-width: 678px) 100vw, 678px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Usar un grupo de SQL para analizar datos<\/h3>\n\n\n\n<p>Ahora que ha ingerido algunos datos en el \u00e1rea de trabajo, puede usar Synapse Analytics para consultarlos y analizarlos. Una de las formas m\u00e1s comunes de consultar datos es usar SQL y, en Synapse Analytics, puede usar un\u00a0<em>grupo de SQL<\/em>\u00a0para ejecutar c\u00f3digo SQL.<\/p>\n\n\n\n<p>En Synapse Studio, haga clic con el bot\u00f3n derecho en el archivo\u00a0<strong>products.csv<\/strong>\u00a0del almacenamiento de archivos del \u00e1rea de trabajo de Synapse, seleccione\u00a0<strong>New SQL script<\/strong>\u00a0(Nuevo script SQL) y seleccione\u00a0<strong>Seleccionar las primeras 100\u00a0filas<\/strong>.<\/p>\n\n\n\n<p>En el panel\u00a0<strong>SQL Script\u00a01<\/strong>\u00a0(Script SQL\u00a01) que se abre, revise el c\u00f3digo SQL que se ha generado, que debe ser similar al siguiente:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>-- This is auto-generated code\nSELECT\n\u202f\u202f\u202f\u202fTOP\u202f100\u202f*\nFROM\n\u202f\u202f\u202f\u202fOPENROWSET(\n\u202f\u202f\u202f\u202f\u202f\u202f\u202f\u202fBULK\u202f'https:\/\/datalakexx.dfs.core.windows.net\/fsxx\/products.csv',\n\u202f\u202f\u202f\u202f\u202f\u202f\u202f\u202fFORMAT\u202f=\u202f'CSV',\n\u202f\u202f\u202f\u202f\u202f\u202f\u202f\u202fPARSER_VERSION='2.0'\n    )\u202fAS\u202f&#91;result]<\/code><\/pre>\n\n\n\n<p>Este c\u00f3digo abre un conjunto de filas del archivo de texto que import\u00f3 y recupera las primeras 100\u00a0filas de datos.<\/p>\n\n\n\n<p>En la lista\u00a0<strong>Conectar a<\/strong>, aseg\u00farese de que\u00a0<strong>Integrado<\/strong>\u00a0est\u00e1 seleccionado: representa el grupo de SQL integrado que se cre\u00f3 con el \u00e1rea de trabajo.<\/p>\n\n\n\n<p>En la barra de herramientas, use el bot\u00f3n\u00a0<strong>\u25b7 Ejecutar<\/strong>\u00a0para ejecutar el c\u00f3digo SQL y revise los resultados, que deben tener un aspecto similar al siguiente:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>C1<\/th><th>c2<\/th><th>c3<\/th><th>c4<\/th><\/tr><\/thead><tbody><tr><td>ProductID<\/td><td>ProductName<\/td><td>Category<\/td><td>ListPrice<\/td><\/tr><tr><td>771<\/td><td>Mountain-100 Silver, 38<\/td><td>Bicicletas de monta\u00f1a<\/td><td>3399.9900<\/td><\/tr><tr><td>772<\/td><td>Mountain-100 Silver, 42<\/td><td>Bicicletas de monta\u00f1a<\/td><td>3399.9900<\/td><\/tr><tr><td>&#8230;<\/td><td>&#8230;<\/td><td>&#8230;<\/td><td>&#8230;<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>Tenga en cuenta que los resultados constan de cuatro columnas denominadas C1, C2, C3 y C4, y que la primera fila de los resultados contiene los nombres de los campos de datos. Para corregir este problema, agregue un par\u00e1metro HEADER_ROW = TRUE a la funci\u00f3n OPENROWSET tal como se muestra aqu\u00ed (reemplace\u00a0<em>datalakexx<\/em>\u00a0y\u00a0<em>fsxx<\/em>\u00a0por los nombres de la cuenta de almacenamiento del lago de datos y el sistema de archivos) y, luego, vuelva a ejecutar la consulta:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>SELECT\n\u202f\u202f\u202f\u202fTOP\u202f100\u202f*\nFROM\n\u202f\u202f\u202f\u202fOPENROWSET(\n\u202f\u202f\u202f\u202f\u202f\u202f\u202f\u202fBULK\u202f'https:\/\/datalakexx.dfs.core.windows.net\/fsxx\/products.csv',\n\u202f\u202f\u202f\u202f\u202f\u202f\u202f\u202fFORMAT\u202f=\u202f'CSV',\n\u202f\u202f\u202f\u202f\u202f\u202f\u202f\u202fPARSER_VERSION='2.0',\n        HEADER_ROW = TRUE\n    )\u202fAS\u202f&#91;result]<\/code><\/pre>\n\n\n\n<p>Ahora los resultados son similares a los siguientes:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>ProductID<\/th><th>ProductName<\/th><th>Category<\/th><th>ListPrice<\/th><\/tr><\/thead><tbody><tr><td>771<\/td><td>Mountain-100 Silver, 38<\/td><td>Bicicletas de monta\u00f1a<\/td><td>3399.9900<\/td><\/tr><tr><td>772<\/td><td>Mountain-100 Silver, 42<\/td><td>Bicicletas de monta\u00f1a<\/td><td>3399.9900<\/td><\/tr><tr><td>&#8230;<\/td><td>&#8230;<\/td><td>&#8230;<\/td><td>&#8230;<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>Modifique la consulta como se muestra a continuaci\u00f3n (reemplazando\u00a0<em>datalakexx<\/em>\u00a0y\u00a0<em>fsxx<\/em>\u00a0por los nombres de la cuenta de almacenamiento de Data Lake y del sistema de archivos):<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>SELECT\n\u202f\u202f\u202f\u202fCategory, COUNT(*) AS ProductCount\nFROM\n\u202f\u202f\u202f\u202fOPENROWSET(\n\u202f\u202f\u202f\u202f\u202f\u202f\u202f\u202fBULK\u202f'https:\/\/datalakexx.dfs.core.windows.net\/fsxx\/products.csv',\n\u202f\u202f\u202f\u202f\u202f\u202f\u202f\u202fFORMAT\u202f=\u202f'CSV',\n\u202f\u202f\u202f\u202f\u202f\u202f\u202f\u202fPARSER_VERSION='2.0',\n        HEADER_ROW = TRUE\n    )\u202fAS\u202f&#91;result]\nGROUP BY Category;<\/code><\/pre>\n\n\n\n<p>Ejecute la consulta modificada, que debe devolver un conjunto de resultados que contenga el n\u00famero de productos de cada categor\u00eda, de la siguiente forma:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Category<\/th><th>ProductCount<\/th><\/tr><\/thead><tbody><tr><td>Culotes<\/td><td>3<\/td><\/tr><tr><td>Bastidores de bicicletas<\/td><td>1<\/td><\/tr><tr><td>&#8230;<\/td><td>&#8230;<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>En el panel\u00a0<strong>Propiedades<\/strong>\u00a0de\u00a0<strong>SQL Script 1<\/strong>\u00a0(Script SQL\u00a01), cambie el\u00a0<strong>Nombre<\/strong>\u00a0a\u00a0<strong>Count Products by Category<\/strong>\u00a0(Contar productos por categor\u00eda). A continuaci\u00f3n, en la barra de herramientas, seleccione\u00a0<strong>Publicar<\/strong>\u00a0para guardar el script.<\/p>\n\n\n\n<p>Cierre el panel de scripts\u00a0<strong>Count Products by Category<\/strong>\u00a0(Contar productos por categor\u00eda).<\/p>\n\n\n\n<p>En Synapse Studio, seleccione la p\u00e1gina\u00a0<strong>Desarrollar<\/strong>\u00a0y observe que el script SQL publicado\u00a0<strong>Count Products by Category<\/strong>\u00a0(Contar productos por categor\u00eda) se ha guardado all\u00ed.<\/p>\n\n\n\n<p>Seleccione el script SQL\u00a0<strong>Count Products by Category<\/strong>\u00a0(Contar productos por categor\u00eda) para volver a abrirlo. A continuaci\u00f3n, aseg\u00farese de que el script est\u00e1 conectado al grupo de SQL\u00a0<strong>Integrado<\/strong>\u00a0y ejec\u00fatelo para obtener el recuento de productos.<\/p>\n\n\n\n<p>En el panel\u00a0<strong>Resultados<\/strong>, seleccione la vista\u00a0<strong>Gr\u00e1fico<\/strong>\u00a0y, a continuaci\u00f3n, seleccione la siguiente configuraci\u00f3n para el gr\u00e1fico:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Tipo de gr\u00e1fico<\/strong>: columna<\/li><li><strong>Columna de categor\u00eda<\/strong>: categor\u00eda<\/li><li><strong>Columnas de leyenda (serie)<\/strong>: ProductCount<\/li><li><strong>Posici\u00f3n de la leyenda<\/strong>: inferior central<\/li><li><strong>Etiqueta de leyenda (serie)<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><li><strong>Valor m\u00ednimo de leyenda (serie)<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><li><strong>Valor m\u00e1ximo de leyenda (serie)<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><li><strong>Etiqueta de categor\u00eda<\/strong>:\u00a0<em>dejar en blanco<\/em><\/li><\/ul>\n\n\n\n<p>El gr\u00e1fico resultante debe ser similar al siguiente:<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"612\" height=\"481\" src=\"\/wp-content\/uploads\/2022\/06\/column-chart.png\" alt=\"\" class=\"wp-image-9841\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/column-chart.png 612w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/column-chart-300x236.png 300w\" sizes=\"(max-width: 612px) 100vw, 612px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Usar un grupo de Spark para analizar datos<\/h3>\n\n\n\n<p>Aunque SQL es un lenguaje com\u00fan para consultar conjuntos de datos estructurados, muchos analistas de datos consideran que lenguajes como Python son \u00fatiles para explorar y preparar los datos para su an\u00e1lisis. En Azure Synapse Analytics, puede ejecutar c\u00f3digo de Python (y otro) en un\u00a0<em>Grupo de Spark<\/em>, que usa un motor de procesamiento de datos distribuido basado en Apache Spark.<\/p>\n\n\n\n<p>En Synapse Studio, seleccione la p\u00e1gina\u00a0<strong>Administrar<\/strong>.<\/p>\n\n\n\n<p>Seleccione la pesta\u00f1a\u00a0<strong>Grupos de Apache Spark<\/strong>\u00a0y, a continuaci\u00f3n, use el icono\u00a0<strong>+ Nuevo<\/strong>\u00a0para crear un nuevo grupo de Spark con la siguiente configuraci\u00f3n:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Nombre del grupo de Apache Spark<\/strong>: spark<\/li><li><strong>Familia de tama\u00f1os de nodo<\/strong>: optimizada para memoria<\/li><li><strong>Tama\u00f1o del nodo<\/strong>: peque\u00f1o (4\u00a0n\u00facleos virtuales\/32\u00a0GB)<\/li><li><strong>Escalabilidad autom\u00e1tica<\/strong>: habilitada<\/li><li><strong>N\u00famero de nodos<\/strong>: 3&#8212;-3<\/li><\/ul>\n\n\n\n<p>Revise y cree el grupo de Spark y espere a que se implemente (puede tardar unos minutos).<\/p>\n\n\n\n<p>Cuando se haya implementado el grupo de Spark, en Synapse Studio, en la p\u00e1gina\u00a0<strong>Datos<\/strong>, vaya al sistema de archivos del \u00e1rea de trabajo de Synapse. A continuaci\u00f3n, haga clic con el bot\u00f3n derecho en\u00a0<strong>products.csv<\/strong>, seleccione\u00a0<strong>Nuevo cuaderno<\/strong>\u00a0y seleccione\u00a0<strong>Cargar en DataFrame<\/strong>.<\/p>\n\n\n\n<p>En el panel\u00a0<strong>Notebook\u00a01<\/strong>\u00a0(Cuaderno\u00a01) que se abre, en la lista\u00a0<strong>Adjuntar a<\/strong>, seleccione el grupo de Spark\u00a0<strong>spark<\/strong>\u00a0creado previamente y aseg\u00farese de que la opci\u00f3n\u00a0<strong>Lenguaje<\/strong>\u00a0est\u00e1 establecida en\u00a0<strong>PySpark (Python)<\/strong>.<\/p>\n\n\n\n<p>Revise solo el c\u00f3digo de la primera celda del cuaderno, que debe tener este aspecto:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>%%pyspark\ndf = spark.read.load('abfss:\/\/fsxx@datalakexx.dfs.core.windows.net\/products.csv', format='csv'\n## If\u202fheader\u202fexists\u202funcomment\u202fline\u202fbelow\n##, header=True\n)\ndisplay(df.limit(10))<\/code><\/pre>\n\n\n\n<p>Use el icono\u00a0<strong>\u25b7<\/strong>\u00a0situado a la izquierda de la celda de c\u00f3digo para ejecutarlo y espere a obtener los resultados. La primera vez que ejecuta una celda en un cuaderno, se inicia el grupo de Spark, por lo que puede tardar m\u00e1s o menos un minuto en devolver los resultados.<\/p>\n\n\n\n<p>Nota<\/p>\n\n\n\n<p>Si se produce un error porque el kernel de Python a\u00fan no est\u00e1 disponible, vuelva a ejecutar la celda<\/p>\n\n\n\n<p>Finalmente, los resultados deben aparecer debajo de la celda y deben ser similares a estos:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th><em>c0<\/em><\/th><th><em>c1<\/em><\/th><th><em>c2<\/em><\/th><th><em>c3<\/em><\/th><\/tr><\/thead><tbody><tr><td>ProductID<\/td><td>ProductName<\/td><td>Category<\/td><td>ListPrice<\/td><\/tr><tr><td>771<\/td><td>Mountain-100 Silver, 38<\/td><td>Bicicletas de monta\u00f1a<\/td><td>3399.9900<\/td><\/tr><tr><td>772<\/td><td>Mountain-100 Silver, 42<\/td><td>Bicicletas de monta\u00f1a<\/td><td>3399.9900<\/td><\/tr><tr><td>&#8230;<\/td><td>&#8230;<\/td><td>&#8230;<\/td><td>&#8230;<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>Quite la marca de comentario de la l\u00ednea\u00a0<em>,header=True<\/em>\u00a0(porque el archivo products.csv tiene los encabezados de columna en la primera l\u00ednea), por lo que el c\u00f3digo tiene el siguiente aspecto:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>%%pyspark\ndf = spark.read.load('abfss:\/\/fsxx@datalakexx.dfs.core.windows.net\/products.csv', format='csv'\n## If\u202fheader\u202fexists\u202funcomment\u202fline\u202fbelow\n, header=True\n)\ndisplay(df.limit(10))<\/code><\/pre>\n\n\n\n<p>Vuelva a ejecutar la celda y compruebe que los resultados son similares a los siguientes:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>ProductID<\/th><th>ProductName<\/th><th>Category<\/th><th>ListPrice<\/th><\/tr><\/thead><tbody><tr><td>771<\/td><td>Mountain-100 Silver, 38<\/td><td>Bicicletas de monta\u00f1a<\/td><td>3399.9900<\/td><\/tr><tr><td>772<\/td><td>Mountain-100 Silver, 42<\/td><td>Bicicletas de monta\u00f1a<\/td><td>3399.9900<\/td><\/tr><tr><td>&#8230;<\/td><td>&#8230;<\/td><td>&#8230;<\/td><td>&#8230;<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>Tenga en cuenta que volver a ejecutar la celda tarda menos tiempo, porque el grupo de Spark ya se ha iniciado.<\/p>\n\n\n\n<p>En los resultados, use el icono\u00a0<strong>\uff0bC\u00f3digo<\/strong>\u00a0para agregar una nueva celda de c\u00f3digo al cuaderno.<\/p>\n\n\n\n<p>En la nueva celda de c\u00f3digo vac\u00eda, agregue el c\u00f3digo siguiente:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>df_counts = df.groupby(df.Category).count()\ndisplay(df_counts)<\/code><\/pre>\n\n\n\n<p>Ejecute la nueva celda de c\u00f3digo haciendo clic en su icono\u00a0<strong>\u25b7<\/strong>\u00a0y revise los resultados, que deben tener un aspecto similar al siguiente:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Category<\/th><th>count<\/th><\/tr><\/thead><tbody><tr><td>Tubos de direcci\u00f3n<\/td><td>3<\/td><\/tr><tr><td>Ruedas<\/td><td>14<\/td><\/tr><tr><td>&#8230;<\/td><td>&#8230;<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p>En la salida de resultados de la celda, seleccione la vista\u00a0<strong>Gr\u00e1fico<\/strong>. El gr\u00e1fico resultante debe ser similar al siguiente:<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"970\" height=\"388\" src=\"\/wp-content\/uploads\/2022\/06\/bar-chart.png\" alt=\"\" class=\"wp-image-9842\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/bar-chart.png 970w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/bar-chart-300x120.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/bar-chart-768x307.png 768w\" sizes=\"(max-width: 970px) 100vw, 970px\" \/><\/figure>\n\n\n\n<p>Cierre el panel\u00a0<strong>Notebook 1<\/strong>\u00a0(Cuaderno\u00a01) y descarte los cambios.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Eliminaci\u00f3n de recursos de Azure<\/h3>\n\n\n\n<p>Si ha terminado de explorar Azure Synapse Analytics, debe eliminar los recursos que ha creado para evitar costos innecesarios de Azure.<\/p>\n\n\n\n<ol class=\"wp-block-list\"><li>Cierre la pesta\u00f1a del explorador de Synapse Studio y vuelva a Azure Portal.<\/li><li>En Azure Portal, en la p\u00e1gina\u00a0<strong>Inicio<\/strong>, seleccione\u00a0<strong>Grupos de recursos<\/strong>.<\/li><li>Seleccione el grupo de recursos del \u00e1rea de trabajo de Synapse Analytics (no el grupo de recursos administrado) y compruebe que contiene el \u00e1rea de trabajo de Synapse, la cuenta de almacenamiento y el grupo de Spark del \u00e1rea de trabajo.<\/li><li>En la parte superior de la p\u00e1gina\u00a0<strong>Informaci\u00f3n general<\/strong>\u00a0del grupo de recursos, seleccione\u00a0<strong>Eliminar grupo de recursos<\/strong>.<\/li><li>Escriba el nombre del grupo de recursos para confirmar que quiere eliminarlo y seleccione\u00a0<strong>Eliminar<\/strong>.Despu\u00e9s de unos minutos, se eliminar\u00e1n el \u00e1rea de trabajo de Azure Synapse y el \u00e1rea de trabajo administrada asociada a ella.<\/li><\/ol>\n\n\n\n<h3 class=\"wp-block-heading\">MCT: Video 4.1.3 Descripci\u00f3n de Azure Synapse Analytics<\/h3>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Descripcio\u0301n de Azure Synapse Analytics\" width=\"1290\" height=\"726\" src=\"https:\/\/www.youtube.com\/embed\/MGTQ4nX63sE?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 es Azure Synapse Analytic?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un servicio que permite el almacenamiento de datos de an\u00e1lisis a gran escala <\/li><li>Es una base de datos de procesamiento paralelo masivo<\/li><li>La anal\u00edtica empresarial debe funcionar a estala masiva con cualquier tipo de dato ya sea sin procesar, refinado o altamente curados<\/li><li>Esto implica que las empresas combinen grandes datos y tecnolog\u00edas de almacenamiento<\/li><li>Este tipo de soluciones son dif\u00edciles de construir, mantener y asegurar<\/li><li>Y esta complejidad retrasa la entrega de la informaci\u00f3n que requiere la empresa<\/li><li>Azure Synapse Analytic es un servicio integrado que permite la obtenci\u00f3n de la informaci\u00f3n de los almacenes de datos y en los sistemas de Big Data<\/li><li>Re\u00fane lo mejor de las tecnolog\u00edas SQL utilizadas en los sistemas de almacenamientos empresariales<\/li><li>Tecnolog\u00edas Spark (para Big Data) \/ pipelines (para la integraci\u00f3n de datos )  \/ ETL y ELT y una integraci\u00f3n profunda con otros servicios como Power BI \/ MoseDB?? \/ Azure EndL??<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"927\" height=\"565\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1717.png\" alt=\"\" class=\"wp-image-9845\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1717.png 927w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1717-300x183.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1717-768x468.png 768w\" sizes=\"(max-width: 927px) 100vw, 927px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Elementos clave y beneficios<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>SQL tiene muchos servicios que ayudan a Azure Synapse Analytics<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Synapse SQL<\/strong><\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un sistema de consultas distribuidas para T-SQL que permite escenarios de almacenamiento y virtualizaci\u00f3n de datos para abordar escenarios de transmisi\u00f3n y aprendizaje autom\u00e1tico<\/li><li>Ofrece modelos de recursos dedicados ofreciendo opciones de consumo y facturaci\u00f3n que se adapten a las necesidades para obtener un rendimiento y costo predecibles se crean grupos SQL dedicados para reservar potencia de procesamiento para los datos almacenados  en tablas SQL<\/li><li>Se pueden utilizar las capacidades de transmisi\u00f3n , para transmitir datos de fuentes de datos en la nube a tablas SQL <\/li><li>Se puede integrar inteligencia artificial con SQL, mediante el uso de modelos de aprendizaje autom\u00e1tico para puntuar datos mediante la funci\u00f3n de SQL Predict<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"635\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1718-1024x635.png\" alt=\"\" class=\"wp-image-9865\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1718-1024x635.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1718-300x186.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1718-768x477.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1718.png 1062w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Apache Spark<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es el motor de Big Data de c\u00f3digo abierto m\u00e1s popular utilizado para la preparaci\u00f3n de datos, ingenier\u00eda de datos ETL y aprendizaje autom\u00e1tico<\/li><li>Existen modelos de aprendizaje autom\u00e1tico con algoritmos Spark ML, integraci\u00f3n con Azure ML, para Apache Spark 2.4 con compatibilidad integrada para Linux Fundation Data Lake <\/li><li>Adem\u00e1s contiene soporte integrado para .NET para Spark lo que permite utilizar la experiencia en C# y c\u00f3digo .NET<\/li><li>Hay dos forma dentro de Synapse para utilizar Spark<ul><li><strong>Spark Notebooks: <\/strong>para hacer ciencia en ingenier\u00eda de datos usando <strong>Scala<\/strong>, pipeSpark, C#, SparKSQL<\/li><li>Definici\u00f3n de trabajos Spark que utiliza lotes mediante archivos .jar <\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"994\" height=\"547\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1719.png\" alt=\"\" class=\"wp-image-9866\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1719.png 994w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1719-300x165.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1719-768x423.png 768w\" sizes=\"(max-width: 994px) 100vw, 994px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Interoperabilidad de SQL y Apache Spark en Data Lake<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Azure Synapse Analytics elimina las barreras tecnol\u00f3gicas tradicionales entre el uso conjunto de SQL y Spark  <\/li><li>Puede mezclar y combinar sin problemas seg\u00fan las necesidades y experiencias <\/li><li>Sistema de metadatos que permite que las tablas definidas en un archivo de Data Lake sen consumidas sin problemas por Spark <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"549\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1720-1024x549.png\" alt=\"\" class=\"wp-image-9868\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1720-1024x549.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1720-300x161.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1720-768x412.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1720.png 1255w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>SQL y Spark pueden explorar y analizar directamente archivos Parked???   CVS, JSON y almacenamientos de Data Lake<\/li><li>Carga y descarga r\u00e1pida<\/li><li>Escalable para datos que se trasladan entre bases de datos SQL y Spark<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 son los pipelines?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Son la forma como Azure Synapse proporciona integraci\u00f3n de datos lo que le permite mover datos entre servicios y ordenar actividades<\/li><li>Son agrupaciones l\u00f3gicas de actividades que realizan una tarea en conjunto <\/li><li>Se agrupan en 4 actividades l\u00f3gicas<ul><li><strong>Actividades:<\/strong> define acciones dentro de una canalizaci\u00f3n como copiar datos, ejecutar un cuaderno o script SQL<\/li><li><strong>Data Flow (Flujos): <\/strong>Proporciona una experiencia sin c\u00f3digo para realizar la transformaci\u00f3n de datos que utiliza Synapse-Spark <\/li><li><strong>Trigger:<\/strong> Ejecuta una canalizaci\u00f3n que se puede ejecutar de forma manual o autom\u00e1tica <\/li><li><strong>Conjunto de datos de Integraci\u00f3n:<\/strong> hacer referencia a los datos que se utilizan en una actividad como entrada y salida, pertenece a un servicio vinculado <\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"560\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1721-1024x560.png\" alt=\"\" class=\"wp-image-9869\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1721-1024x560.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1721-300x164.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1721-768x420.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1721.png 1239w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Gesti\u00f3n, supervisi\u00f3n y Seguridad unificadas<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Azure Synapse proporciona una forma \u00fanica para que las empresas administren los recursos de an\u00e1lisis, supervisen el uso, la actividad y apliquen la seguridad<\/li><li>Para esto se le asignan usuarios a roles para simplificar el acceso a los recursos de an\u00e1lisis y tambi\u00e9n un control de acceso detallado sobre los datos y c\u00f3digo<\/li><li>Y un solo panel para monitorizar los recursos, el uso y los usuarios de SQL y Spark<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"561\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1722-1024x561.png\" alt=\"\" class=\"wp-image-9871\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1722-1024x561.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1722-300x164.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1722-768x421.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1722.png 1267w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Synapse Studio<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es una interfaz Web que crea una soluci\u00f3n de an\u00e1lisis de un extremo a otro en un solo lugar<\/li><li>Con ayuda de la ingesta, exploraci\u00f3n, preparaci\u00f3n, organizaci\u00f3n y visualizaci\u00f3n<\/li><li>ofrece productividad para ingenieros de datos que escriben c\u00f3digo en SQL o Spark con ayuda de la creaci\u00f3n, depuraci\u00f3n y optimizaci\u00f3n del rendimiento<\/li><li>Integraci\u00f3n con los procesos de CI\/CD empresariales<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"621\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1723-1024x621.png\" alt=\"\" class=\"wp-image-9874\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1723-1024x621.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1723-300x182.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1723-768x466.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1723.png 1125w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">MCT: Video 4.1.4 Carga de datos en Azure Synapse Analytics<\/h2>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Carga de datos en Azure Synapse Analytics\" width=\"1290\" height=\"726\" src=\"https:\/\/www.youtube.com\/embed\/wP5kew9sJPY?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 hace Azure Synapse Analytics?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un servicio que permite el almacenamiento datos y an\u00e1lisis a gran escala<\/li><li>Aqu\u00ed se mostrar como puede usarse Azure data Factory para ingeriri datos de Azure Synapse Analytics<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"554\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1724-1024x554.png\" alt=\"\" class=\"wp-image-9875\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1724-1024x554.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1724-300x162.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1724-768x416.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1724.png 1316w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>tenemos un archivo housesproces.cvs separados por coma<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"555\" height=\"584\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1725.png\" alt=\"\" class=\"wp-image-9876\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1725.png 555w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1725-285x300.png 285w\" sizes=\"(max-width: 555px) 100vw, 555px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Paso 1: Crear cuenta de almacenamiento<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>El primer paso para cargar datos en Azure synapse Analytics es crear la cuenta de almacenamiento<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1726.png\" alt=\"\" class=\"wp-image-9877\" width=\"398\" height=\"259\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1726.png 796w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1726-300x195.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1726-768x499.png 768w\" sizes=\"(max-width: 398px) 100vw, 398px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Mas Recursos->Makert Place -> Cuenta de Alamcenamiento<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"901\" height=\"497\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1727.png\" alt=\"\" class=\"wp-image-9879\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1727.png 901w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1727-300x165.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1727-768x424.png 768w\" sizes=\"(max-width: 901px) 100vw, 901px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Agregamos los datos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"790\" height=\"759\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1728.png\" alt=\"\" class=\"wp-image-9880\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1728.png 790w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1728-300x288.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1728-768x738.png 768w\" sizes=\"(max-width: 790px) 100vw, 790px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Creamos el servicio<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"747\" height=\"985\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1729.png\" alt=\"\" class=\"wp-image-9881\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1729.png 747w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1729-228x300.png 228w\" sizes=\"(max-width: 747px) 100vw, 747px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Ingresamos al servicio -> Servicio Archivo -> Recursos compartidos de archivos->Agregar Recursos compartido de archivos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"518\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1730-1024x518.png\" alt=\"\" class=\"wp-image-9882\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1730-1024x518.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1730-300x152.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1730-768x388.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1730.png 1131w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Le asignamos un nombre &#8211; > Crear<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"648\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1731-1024x648.png\" alt=\"\" class=\"wp-image-9883\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1731-1024x648.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1731-300x190.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1731-768x486.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1731-600x380.png 600w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1731.png 1515w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>vamos al recurso que se acaba de crear<\/li><li>Le damos cargar -> Buscamos el archivo -> Cargar<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"169\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1732-1024x169.png\" alt=\"\" class=\"wp-image-9885\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1732-1024x169.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1732-300x49.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1732-768x126.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1732-1536x253.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1732.png 1864w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Se a\u00f1ade el archivo<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"650\" height=\"299\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1733.png\" alt=\"\" class=\"wp-image-9887\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1733.png 650w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1733-300x138.png 300w\" sizes=\"(max-width: 650px) 100vw, 650px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Paso 2: Crear el servicio de almacenamiento de datos<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>MarketPlace -> Azure Synapse Analytics <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"586\" height=\"268\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1734.png\" alt=\"\" class=\"wp-image-9889\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1734.png 586w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1734-300x137.png 300w\" sizes=\"(max-width: 586px) 100vw, 586px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Completamos los datos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"815\" height=\"759\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1735.png\" alt=\"\" class=\"wp-image-9890\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1735.png 815w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1735-300x279.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1735-768x715.png 768w\" sizes=\"(max-width: 815px) 100vw, 815px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Siguiente<\/li><li>Creamos un usuario  y contrase\u00f1a<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"757\" height=\"392\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1736.png\" alt=\"\" class=\"wp-image-9891\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1736.png 757w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1736-300x155.png 300w\" sizes=\"(max-width: 757px) 100vw, 757px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Validamos y le damos Crear<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"418\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1737-1024x418.png\" alt=\"\" class=\"wp-image-9893\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1737-1024x418.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1737-300x123.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1737-768x314.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1737.png 1126w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Paso 3: Crear grupo de SQL para almacenar<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Dentro del recursos ingresamos a el \u00ab\u00e1rea de trabajo synapse\u00bb<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"287\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1738-1024x287.png\" alt=\"\" class=\"wp-image-9895\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1738-1024x287.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1738-300x84.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1738-768x215.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1738-1536x431.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1738.png 1733w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Vamos a \u00abNuevo grupo de SQL dedicado\u00bb<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"967\" height=\"358\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1739.png\" alt=\"\" class=\"wp-image-9896\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1739.png 967w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1739-300x111.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1739-768x284.png 768w\" sizes=\"(max-width: 967px) 100vw, 967px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Colocamos un nombre para el nombre de grupo de SQL dedicado y en nivel de rendimiento el m\u00e1s bajo<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"778\" height=\"529\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1740.png\" alt=\"\" class=\"wp-image-9898\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1740.png 778w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1740-300x204.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1740-768x522.png 768w\" sizes=\"(max-width: 778px) 100vw, 778px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Creamos el recurso<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"806\" height=\"382\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1741.png\" alt=\"\" class=\"wp-image-9900\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1741.png 806w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1741-300x142.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1741-768x364.png 768w\" sizes=\"(max-width: 806px) 100vw, 806px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Paso 4: Crear instancia de Data Factory<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>MarketPlace -> Data Factory<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"477\" height=\"234\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1742.png\" alt=\"\" class=\"wp-image-9901\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1742.png 477w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1742-300x147.png 300w\" sizes=\"(max-width: 477px) 100vw, 477px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Completamos los datos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"746\" height=\"492\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1743-1.png\" alt=\"\" class=\"wp-image-9904\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1743-1.png 746w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1743-1-300x198.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1743-1-120x80.png 120w\" sizes=\"(max-width: 746px) 100vw, 746px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Configuraci\u00f3n Git  -> M\u00e1s tarde<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"713\" height=\"260\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1744.png\" alt=\"\" class=\"wp-image-9905\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1744.png 713w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1744-300x109.png 300w\" sizes=\"(max-width: 713px) 100vw, 713px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Revisar y Crear<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"330\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1745-1024x330.png\" alt=\"\" class=\"wp-image-9906\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1745-1024x330.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1745-300x97.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1745-768x248.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1745.png 1268w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Paso 5: Crear tabla en Synapse Analytics<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Creamos una tabla para almacenar la informaci\u00f3n<\/li><li>Ingresamos al \u00e1rea de trabajo de synapse<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"256\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1746-1024x256.png\" alt=\"\" class=\"wp-image-9908\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1746-1024x256.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1746-300x75.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1746-768x192.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1746.png 1185w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Ingresamos a Synapse Studio<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1016\" height=\"652\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1747.png\" alt=\"\" class=\"wp-image-9909\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1747.png 1016w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1747-300x193.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1747-768x493.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1747-360x230.png 360w\" sizes=\"(max-width: 1016px) 100vw, 1016px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Ingresamos a datos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"339\" height=\"224\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1748.png\" alt=\"\" class=\"wp-image-9910\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1748.png 339w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1748-300x198.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1748-120x80.png 120w\" sizes=\"(max-width: 339px) 100vw, 339px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Bases de datos -> Tablas->Acciones<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"508\" height=\"454\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1749.png\" alt=\"\" class=\"wp-image-9912\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1749.png 508w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1749-300x268.png 300w\" sizes=\"(max-width: 508px) 100vw, 508px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Nuevo script -> Nueva Tabla<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"705\" height=\"378\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1750.png\" alt=\"\" class=\"wp-image-9914\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1750.png 705w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1750-300x161.png 300w\" sizes=\"(max-width: 705px) 100vw, 705px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Creamos un script que cree la tabla<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"317\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1751-1024x317.png\" alt=\"\" class=\"wp-image-9915\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1751-1024x317.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1751-300x93.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1751-768x237.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1751.png 1488w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Y luego le damos publicar la tabla se publica para que sea accedida por Data Factory<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"625\" height=\"247\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1752.png\" alt=\"\" class=\"wp-image-9917\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1752.png 625w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1752-300x119.png 300w\" sizes=\"(max-width: 625px) 100vw, 625px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Paso 6: data Factory<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Ingresamos al servicio de data factory<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"261\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1753-1024x261.png\" alt=\"\" class=\"wp-image-9919\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1753-1024x261.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1753-300x77.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1753-768x196.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1753.png 1171w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Le damos clic en crear y supervisar<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"425\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1754-1024x425.png\" alt=\"\" class=\"wp-image-9920\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1754-1024x425.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1754-300x124.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1754-768x319.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1754.png 1299w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Podr\u00edamos crear una canalizaci\u00f3n pero data Factory tiene un asistente que lo hace autom\u00e1ticamente <\/li><li>Seleccionamos \u00abCopiar datos\u00bb<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"464\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1755-1024x464.png\" alt=\"\" class=\"wp-image-9921\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1755-1024x464.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1755-300x136.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1755-768x348.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1755.png 1136w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Primero es determinar el nombre de la tarea<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1020\" height=\"481\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1756.png\" alt=\"\" class=\"wp-image-9922\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1756.png 1020w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1756-300x141.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1756-768x362.png 768w\" sizes=\"(max-width: 1020px) 100vw, 1020px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>En la conexi\u00f3n de origen -> Crear nueva conexi\u00f3n<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"170\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1757-1024x170.png\" alt=\"\" class=\"wp-image-9923\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1757-1024x170.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1757-300x50.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1757-768x128.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1757-1536x256.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1757.png 1856w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Esto crea un servicio vinculado<\/li><li>Buscamos el servicio Azure File Storage<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"539\" height=\"479\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1758.png\" alt=\"\" class=\"wp-image-9924\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1758.png 539w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1758-300x267.png 300w\" sizes=\"(max-width: 539px) 100vw, 539px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Continuar<\/li><li>Aqu\u00ed solo buscamos el nombre de la cuenta de almacenamiento y el archivo que hemos creado<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"672\" height=\"1024\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1759-672x1024.png\" alt=\"\" class=\"wp-image-9925\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1759-672x1024.png 672w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1759-197x300.png 197w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1759.png 673w\" sizes=\"(max-width: 672px) 100vw, 672px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Como origen seleccionamos el archivo <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"666\" height=\"963\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1760.png\" alt=\"\" class=\"wp-image-9926\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1760.png 666w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1760-207x300.png 207w\" sizes=\"(max-width: 666px) 100vw, 666px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Nos carga un avista previa<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"609\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1761-1024x609.png\" alt=\"\" class=\"wp-image-9928\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1761-1024x609.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1761-300x179.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1761-768x457.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1761-1536x914.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1761.png 1600w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Siguiente<\/li><li>Ahora vamos a crear un servicio vinculado que se conecte con al \u00e1ea de trabajo de synapse<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"165\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1762-1024x165.png\" alt=\"\" class=\"wp-image-9929\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1762-1024x165.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1762-300x48.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1762-768x124.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1762-1536x248.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1762.png 1600w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li> Buscamos synapse<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"627\" height=\"380\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1763.png\" alt=\"\" class=\"wp-image-9930\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1763.png 627w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1763-300x182.png 300w\" sizes=\"(max-width: 627px) 100vw, 627px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Seleccionamos el \u00e1rea de trabajo synapse que creamos<\/li><li> La base de datos<\/li><li>Y el m\u00e9todo de conexi\u00f3n configurado \/ usuarios \/ conatrase\u00f1a<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"628\" height=\"1024\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1764-628x1024.png\" alt=\"\" class=\"wp-image-9931\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1764-628x1024.png 628w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1764-184x300.png 184w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1764.png 629w\" sizes=\"(max-width: 628px) 100vw, 628px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Crear<\/li><li>Siguiente<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large is-resized\"><img loading=\"lazy\" decoding=\"async\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1765-1024x970.png\" alt=\"\" class=\"wp-image-9932\" width=\"512\" height=\"485\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1765-1024x970.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1765-300x284.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1765-768x728.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1765.png 1032w\" sizes=\"(max-width: 512px) 100vw, 512px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Ahora vamos a pasar los datos del archivo a al base de datos de synapse <\/li><li>Primero pide la tabla<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"904\" height=\"223\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1766.png\" alt=\"\" class=\"wp-image-9933\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1766.png 904w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1766-300x74.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1766-768x189.png 768w\" sizes=\"(max-width: 904px) 100vw, 904px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"164\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1767-1024x164.png\" alt=\"\" class=\"wp-image-9934\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1767-1024x164.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1767-300x48.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1767-768x123.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1767.png 1411w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Siguiente<\/li><li>Aqu\u00ed debe definir como se asignar\u00e1n los campos del archivo cvs a la tablas (usa inteligencia artificial para determinar los nombre de las columnas con los nombres dela BD y tipos de datos)<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"612\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1768-1024x612.png\" alt=\"\" class=\"wp-image-9935\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1768-1024x612.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1768-300x179.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1768-768x459.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1768-1536x918.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1768.png 1570w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Siguiente<\/li><li>En este caso vamos a utilizar Inserci\u00f3n masiva <\/li><li>Y vamos a cargar los datos directamente por lo que deshabilitamos \u00abHabilitar almacenamiento provisional\u00bb<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"398\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1769-1024x398.png\" alt=\"\" class=\"wp-image-9936\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1769-1024x398.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1769-300x117.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1769-768x299.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1769-1536x597.png 1536w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1769.png 1667w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Siguiente<\/li><li>Validamos la tarea<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"490\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1770-1024x490.png\" alt=\"\" class=\"wp-image-9937\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1770-1024x490.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1770-300x144.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1770-768x368.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1770.png 1165w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Verificamos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"394\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1771-1024x394.png\" alt=\"\" class=\"wp-image-9938\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1771-1024x394.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1771-300x115.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1771-768x296.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1771.png 1432w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Paso 6: regresamos a Synapse para ver los datos<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Actualizamos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"595\" height=\"402\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1772.png\" alt=\"\" class=\"wp-image-9939\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1772.png 595w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1772-300x203.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1772-120x80.png 120w\" sizes=\"(max-width: 595px) 100vw, 595px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Obtenemos la primeras 100 lineas<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"829\" height=\"525\" src=\"\/wp-content\/uploads\/2022\/06\/Seleccion_1773-1.png\" alt=\"\" class=\"wp-image-9942\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1773-1.png 829w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1773-1-300x190.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1773-1-768x486.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/06\/Seleccion_1773-1-600x380.png 600w\" sizes=\"(max-width: 829px) 100vw, 829px\" \/><\/figure>\n","protected":false},"excerpt":{"rendered":"<p>https:\/\/docs.microsoft.com\/es-mx\/learn\/modules\/examine-components-of-modern-data-warehouse\/ Unidad 1: Introducci\u00f3n El almacenamiento de datos moderno es un t\u00e9rmino gen\u00e9rico que describe la infraestructura y los procesos que se usan para admitir el an\u00e1lisis de datos a gran escala. Las soluciones modernas de almacenamiento de datos combinan el almacenamiento de datos convencional que se usa para admitir inteligencia empresarial (BI), que normalmente [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[390],"tags":[398,391],"class_list":["post-9722","post","type-post","status-publish","format-standard","hentry","category-cursos","tag-dp-900","tag-microsoft-azure"],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":6}},"_links":{"self":[{"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/posts\/9722","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/sada.services\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=9722"}],"version-history":[{"count":60,"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/posts\/9722\/revisions"}],"predecessor-version":[{"id":9943,"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/posts\/9722\/revisions\/9943"}],"wp:attachment":[{"href":"https:\/\/sada.services\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=9722"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/sada.services\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=9722"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/sada.services\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=9722"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}