{"id":8629,"date":"2022-05-23T08:51:46","date_gmt":"2022-05-23T14:51:46","guid":{"rendered":"https:\/\/ugit.siua.ac.cr\/?p=8629"},"modified":"2022-05-23T16:54:11","modified_gmt":"2022-05-23T22:54:11","slug":"azure-dp-900-t01-m01-exploracion-de-los-conceptos-de-los-datos-principales","status":"publish","type":"post","link":"https:\/\/sada.services\/?p=8629","title":{"rendered":"Azure DP-900: T01\/M01: Exploraci\u00f3n de los conceptos de los datos principales"},"content":{"rendered":"\n<p><a href=\"https:\/\/docs.microsoft.com\/es-mx\/learn\/modules\/explore-core-data-concepts\/\">https:\/\/docs.microsoft.com\/es-mx\/learn\/modules\/explore-core-data-concepts\/<\/a><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 1: Introducci\u00f3n<\/h2>\n\n\n\n<p>Durante las \u00faltimas d\u00e9cadas, la cantidad de datos que generan los sistemas, las aplicaciones y los dispositivos ha aumentado considerablemente. Los datos est\u00e1n en todas partes, en una gran variedad de estructuras y formatos.<\/p>\n\n\n\n<p>Ahora los datos pueden recopilarse de manera m\u00e1s f\u00e1cil y almacenarse de forma m\u00e1s barata, lo que permite que casi todas las empresas puedan tener acceso a ellos. Las soluciones de datos incluyen tecnolog\u00edas de software y plataformas que pueden facilitar la recopilaci\u00f3n, el an\u00e1lisis y el almacenamiento de informaci\u00f3n valiosa. Todas las empresas buscan aumentar sus ingresos y obtener mayores ganancias. En este mercado competitivo, los datos son un recurso valioso. Cuando se analizan correctamente, los datos se pueden convertir en una gran cantidad de informaci\u00f3n \u00fatil que ayuda a tomar decisiones empresariales cr\u00edticas.<\/p>\n\n\n\n<p>La capacidad de capturar, almacenar y analizar datos es un requisito b\u00e1sico para todas las organizaciones del mundo. En este m\u00f3dulo, obtendr\u00e1 informaci\u00f3n sobre las opciones para representar y almacenar datos, as\u00ed como sobre las cargas de trabajo de datos t\u00edpicas. Al completar este m\u00f3dulo, establecer\u00e1 las bases para conocer mejor las t\u00e9cnicas y los servicios que se usan para trabajar con datos.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 2: Identificaci\u00f3n de los formatos de datos<\/h2>\n\n\n\n<p>Los datos son una colecci\u00f3n de elementos, como n\u00fameros, descripciones y observaciones, que se usan para registrar informaci\u00f3n. Las estructuras de datos en las que se organizan estos datos suelen representar&nbsp;<em>entidades<\/em>&nbsp;que son importantes para una organizaci\u00f3n (como clientes, productos, pedidos de ventas, etc.). Normalmente, cada entidad tiene uno o varios&nbsp;<em>atributos<\/em>&nbsp;o caracter\u00edsticas (por ejemplo, un cliente podr\u00eda tener un nombre, una direcci\u00f3n, un n\u00famero de tel\u00e9fono, etc.).<\/p>\n\n\n\n<p>Los datos se pueden clasificar en&nbsp;<em>estructurados<\/em>,&nbsp;<em>semiestructurados<\/em>&nbsp;o&nbsp;<em>no estructurados<\/em>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Datos estructurados<\/h3>\n\n\n\n<p>Los datos estructurados son aquellos que se ajustan a un&nbsp;<em>esquema<\/em>&nbsp;fijo, por lo que todos los datos tienen los mismos campos o propiedades. Normalmente, el esquema de las entidades de datos estructurados es&nbsp;<em>tabular<\/em>; es decir, los datos se representan en una o varias tablas que constan de filas para representar cada instancia de una entidad de datos y columnas para representar los atributos de la entidad. Por ejemplo, en la imagen siguiente se muestran las representaciones de datos tabulares para las entidades&nbsp;<em>Customer<\/em>&nbsp;y&nbsp;<em>Product<\/em>.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img fetchpriority=\"high\" decoding=\"async\" width=\"931\" height=\"975\" src=\"\/wp-content\/uploads\/2022\/05\/2-tabular-diagram-1.png\" alt=\"\" class=\"wp-image-8639\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/2-tabular-diagram-1.png 931w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/2-tabular-diagram-1-286x300.png 286w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/2-tabular-diagram-1-768x804.png 768w\" sizes=\"(max-width: 931px) 100vw, 931px\" \/><\/figure>\n\n\n\n<p>Los datos estructurados suelen almacenarse en una base de datos en la que varias tablas pueden hacer referencia entre s\u00ed mediante el uso de valores de clave en un modelo&nbsp;<em>relacional<\/em>, que exploraremos con m\u00e1s detalle m\u00e1s adelante.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Datos semiestructurados<\/h3>\n\n\n\n<p>Los datos&nbsp;<em>semiestructurados<\/em>&nbsp;son informaci\u00f3n que tiene cierta estructura, pero que permite alguna variaci\u00f3n entre las instancias de entidad. Por ejemplo, aunque la mayor\u00eda de los clientes pueden tener una direcci\u00f3n de correo electr\u00f3nico, algunos podr\u00edan tener varias y otros, ninguna.<\/p>\n\n\n\n<p>Un formato com\u00fan para los datos semiestructurados es la&nbsp;<em>notaci\u00f3n de objetos JavaScript<\/em>&nbsp;(JSON). En el ejemplo siguiente se muestran un par de documentos JSON que representan informaci\u00f3n de clientes. Cada documento de cliente incluye la direcci\u00f3n y la informaci\u00f3n de contacto, pero los campos espec\u00edficos var\u00edan entre los clientes.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>\/\/ Customer 1\n{\n  \"firstName\": \"Joe\",\n  \"lastName\": \"Jones\",\n  \"address\":\n  {\n    \"streetAddress\": \"1 Main St.\",\n    \"city\": \"New York\",\n    \"state\": \"NY\",\n    \"postalCode\": \"10099\"\n  },\n  \"contact\":\n  &#91;\n    {\n      \"type\": \"home\",\n      \"number\": \"555 123-1234\"\n    },\n    {\n      \"type\": \"email\",\n      \"address\": \"joe@litware.com\"\n    }\n  ]\n}\n\n\/\/ Customer 2\n{\n  \"firstName\": \"Samir\",\n  \"lastName\": \"Nadoy\",\n  \"address\":\n  {\n    \"streetAddress\": \"123 Elm Pl.\",\n    \"unit\": \"500\",\n    \"city\": \"Seattle\",\n    \"state\": \"WA\",\n    \"postalCode\": \"98999\"\n  },\n  \"contact\":\n  &#91;\n    {\n      \"type\": \"email\",\n      \"address\": \"samir@northwind.com\"\n    }\n  ]\n}<\/code><\/pre>\n\n\n\n<p>&nbsp;Nota: JSON es solo una de las muchas maneras en las que se pueden representar los datos semiestructurados. Lo importante aqu\u00ed no es proporcionar un examen detallado de la sintaxis de JSON, sino ilustrar la naturaleza flexible de las representaciones de datos semiestructurados.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Datos no estructurados<\/h3>\n\n\n\n<p>No todos los datos est\u00e1n estructurados o semiestructurados. Por ejemplo, los documentos, im\u00e1genes, datos de audio y de v\u00eddeo y archivos binarios podr\u00edan no tener una estructura espec\u00edfica. Este tipo de datos se conoce como&nbsp;<em>datos no estructurados<\/em>.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" width=\"500\" height=\"551\" src=\"\/wp-content\/uploads\/2022\/05\/2-unstructured-data-1.png\" alt=\"\" class=\"wp-image-8648\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/2-unstructured-data-1.png 500w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/2-unstructured-data-1-272x300.png 272w\" sizes=\"(max-width: 500px) 100vw, 500px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Almacenes de datos<\/h3>\n\n\n\n<p>Las organizaciones suelen almacenar los datos en formato estructurado, semiestructurado o no estructurado para registrar los detalles de entidades (por ejemplo, clientes y productos), eventos espec\u00edficos (como transacciones de ventas) u otra informaci\u00f3n en documentos, im\u00e1genes y otros formatos. Los datos almacenados se pueden recuperar para su an\u00e1lisis y la generaci\u00f3n de informes m\u00e1s adelante.<\/p>\n\n\n\n<p>Habitualmente se usan dos categor\u00edas generales de almac\u00e9n de datos:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Almacenes de archivos<\/li><li>Bases de datos<\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">MCT: <strong>Video 1.1.1: Introducci\u00f3n a las bases de datos<\/strong><\/h2>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"0.1 Introducci\u00f3n a las Bases de Datos\" width=\"1290\" height=\"726\" src=\"https:\/\/www.youtube.com\/embed\/NnqaMUz5Os8?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Datos e Informaci\u00f3n<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Datos e informaci\u00f3n no son lo mismo<\/li><li>Los datos son s\u00edmbolos como n\u00fameros, letras o signos que son empleados para representar a trav\u00e9s  de un lenguaje un hecho, una condici\u00f3n, un valor, una cantidad,etc<\/li><li>La informaci\u00f3n es el resultado ejecutar un procesamiento a un conjunto de datos d\u00e1ndole u significado o interpretaci\u00f3n<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"530\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_133-1024x530.png\" alt=\"\" class=\"wp-image-8662\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_133-1024x530.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_133-300x155.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_133-768x398.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_133.png 1340w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Por ejemplo en los datos podemos tener los siguientes n\u00fameros y caracteres sin una organizaci\u00f3n espec\u00edfica aunque para nosotros pueden tener una l\u00f3gica carecen de contexto<\/li><li>Una vez que les damos contexto podemos determinar que los datos pertenecen a informaci\u00f3n alumnos y asignaturas<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"465\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_134-1024x465.png\" alt=\"\" class=\"wp-image-8664\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_134-1024x465.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_134-300x136.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_134-768x349.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_134.png 1371w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Tipos de datos<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Los datos se pueden clasificar seg\u00fan su tipo:<ul><li>Estructurados<\/li><li>Semiestructurados<\/li><li>No Estructurados<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"500\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_135-1024x500.png\" alt=\"\" class=\"wp-image-8665\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_135-1024x500.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_135-300x146.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_135-768x375.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_135.png 1361w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Estructurados<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Suelen ser datos tabulares que se representan mediante filas y columnas en una base de datos, es usual encontrar este tipo de datos en hojas de c\u00e1lculo y cuentan con cierta organizaci\u00f3n, aunque utilizar este software como medio de almacenamiento reduce el potencial de los datos ya que no se pueden automatizar o realizar consultas complejas<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"478\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_136-1024x478.png\" alt=\"\" class=\"wp-image-8673\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_136-1024x478.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_136-300x140.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_136-768x359.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_136.png 1283w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Las bases de datos que contienen tablas de este tipo se denominan BD relacionales<\/li><li>Un servicio de Azure de este tipo es Azure SQL Database<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Semiestructurados<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Son informaci\u00f3n que no que no residen en una BD relacional pero que contienen cierta estructura<\/li><li>Por ejemplo un documento JSON<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"569\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_137-1024x569.png\" alt=\"\" class=\"wp-image-8680\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_137-1024x569.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_137-300x167.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_137-768x426.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_137.png 1286w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Este tipo de documento permite almacenar datos de una manera m\u00e1s flexible ya que se pueden guardar datos distintos para cada registro<\/li><li>Por ejemplo puede que un alumno tenga o no tel\u00e9fono<\/li><li>La estructura de un documento JSON se establece de la siguiente manera<ul><li>\u00abEstudianteID\u00bb: se le conoce como objeto ra\u00edz y contiene toda la informaci\u00f3n de este documento JSON<\/li><li>\u00abDatos Personales\u00bb: es un objeto anidado <\/li><li>\u00abAsignaturas\u00bb: es una matriz anidada<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"549\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_138-1024x549.png\" alt=\"\" class=\"wp-image-8681\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_138-1024x549.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_138-300x161.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_138-768x412.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_138.png 1296w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Existen cierto servicios que nos permiten almacenar <strong>Azure Cosmos DB<\/strong> permite almacenar este tipo de documentos<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">No estructurados<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Son datos que no cuentan con ning\u00fan tipo de estructura. Por ejemplo: archivos multimedia (audio, im\u00e1genes y v\u00eddeo) <\/li><li>Se encuentran normalmente en plataformas de streamming<\/li><li>Por ejemplo en una aplicaci\u00f3n que reproduce m\u00fasica las canciones no son un datos estructural y se pueden representar en un formato JSON , sin embargo se deben poder almacenar en alg\u00fan lugar pero no se modifican solo se consultan<\/li><li><strong>Azure Blob Storage <\/strong>es un servicio que permite almacenar este tipo de datos<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"544\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_140-1024x544.png\" alt=\"\" class=\"wp-image-8692\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_140-1024x544.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_140-300x159.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_140-768x408.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_140.png 1228w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Dise\u00f1o de Bases de Datos<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Para crear una base de datos debemos utilizar algunas herramientas que nos ayudar\u00e1n a modelar la estructura y funcionamiento de nuestra base <\/li><li>Para crear una BD se debe seguir el siguiente procedimiento secuencial<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Dise\u00f1o Conceptual:<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Es construir un modelo llamado Entidad-Relaci\u00f3n <\/li><li>Por ejemplo tenemos la entidad \u00abProducto\u00bb con los atributos: Identificador \/ Cantidad \/ Descripci\u00f3n<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"485\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_141-1024x485.png\" alt=\"\" class=\"wp-image-8703\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_141-1024x485.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_141-300x142.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_141-768x363.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_141.png 1289w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Y normalmente una BD esta constituida por m\u00e1s de una entidad que se relacionan entre s\u00ed por un contexto <\/li><li>Este modelo es independiente del sistema de administraci\u00f3n de BD <strong>(DBMS)<\/strong> donde se va a implementar y no requiere conocimientos t\u00e9cnicos para ser interpretado<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Dise\u00f1o L\u00f3gico<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Es la transformaci\u00f3n del dise\u00f1o conceptual y la base del modelo relacional <\/li><li>Es una forma est\u00e1ndar de representar las entidades, sus relaciones y los detalles t\u00e9cnicos de estas<\/li><li>Por ejemplos caracter\u00edsticas de los atributos, relaciones de los datos y los tipos de relaciones entre las entidades<\/li><li>Este tambi\u00e9n es independiente al<strong> (DBMS)<\/strong> en que se va a implementar la BD <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"614\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_142-1024x614.png\" alt=\"\" class=\"wp-image-8707\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_142-1024x614.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_142-300x180.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_142-768x460.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_142.png 1161w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">Dise\u00f1o f\u00edsico<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Se crea a partir del dise\u00f1o l\u00f3gico y la informaci\u00f3n del uso esperado de la BD, que se refiere al:<ul><li>Volumen de datos<\/li><li>Transformaciones que el sistema deber\u00e1 procesar<\/li><li>Frecuencia de uso<\/li><li>Calidad del servicio esperada<\/li><\/ul><\/li><li>Con esta informaci\u00f3n se definen las caracter\u00edsticas y configuraciones f\u00edsicas y l\u00f3gicas que la BD deber\u00e1 tener <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"606\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_143-1024x606.png\" alt=\"\" class=\"wp-image-8711\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_143-1024x606.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_143-300x177.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_143-768x454.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_143.png 1119w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Clasificaci\u00f3n de BD<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>Las BD de pueden clasificar de distintas formas, una es de acuerdo a su uso<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Por uso<\/h4>\n\n\n\n<h5 class=\"wp-block-heading\">OLTP<\/h5>\n\n\n\n<ul class=\"wp-block-list\"><li>OLTP: Online Transsaccion Processing<\/li><li>Utilizada para realizar transacciones (cambios constantes en los datos)<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"985\" height=\"601\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_144.png\" alt=\"\" class=\"wp-image-8716\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_144.png 985w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_144-300x183.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_144-768x469.png 768w\" sizes=\"(max-width: 985px) 100vw, 985px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Un ejemplo es un sistema bancario ya que constantemente se realizan como aumento y disminuci\u00f3n de saldos<\/li><li>Azure SQL Database  es de tipo OLTP<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"535\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_145-1024x535.png\" alt=\"\" class=\"wp-image-8718\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_145-1024x535.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_145-300x157.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_145-768x401.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_145.png 1229w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h5 class=\"wp-block-heading\">OLAP<\/h5>\n\n\n\n<ul class=\"wp-block-list\"><li>OLAP: Online Analytical Processing<\/li><li>Normalmente utilizada para el an\u00e1lisis ya que por lo general los datos almacenados permanecen est\u00e1ticos y sin cambios <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"892\" height=\"578\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_146.png\" alt=\"\" class=\"wp-image-8723\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_146.png 892w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_146-300x194.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_146-768x498.png 768w\" sizes=\"(max-width: 892px) 100vw, 892px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Por ejemplo: sistema de respaldos que guarda datos hist\u00f3ricos, los cuales pueden ser consultados para generar gr\u00e1ficas o informes<\/li><li>Azure table Storage nos permite utilizar este servicio <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"587\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_147-1024x587.png\" alt=\"\" class=\"wp-image-8724\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_147-1024x587.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_147-300x172.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_147-768x440.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_147.png 1051w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Tipos de An\u00e1lisis<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Realizar una mejor toma de decisiones ayuda a alcanzar una mayor grado de eficiencia y reducir costos, esto se puede lograr por medio del an\u00e1lisis que se divide de la siguiente manera <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"428\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_148-1024x428.png\" alt=\"\" class=\"wp-image-8729\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_148-1024x428.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_148-300x125.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_148-768x321.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_148.png 1385w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">An\u00e1lisis Descriptivo<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Responde a: <strong>\u00bfQu\u00e9 esta pasando?<\/strong><\/li><li>Toma los datos in procesar y proporciona informaci\u00f3n valiosa sobre el pasado<\/li><li>Estos solo indican si algo esta bien o mal<\/li><li>Por ejemplo: con base en los datos del \u00faltimo vez se puede ver que los ciberataques aumentaron 47% con respecto al mes anterior<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"551\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_149-1024x551.png\" alt=\"\" class=\"wp-image-8731\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_149-1024x551.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_149-300x161.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_149-768x413.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_149.png 1138w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">An\u00e1lisis Diagn\u00f3stico<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Responde a:  <strong>\u00bfPor qu\u00e9 est\u00e1 pasando?<\/strong><\/li><li>Es decir explica alg\u00fan suceso<\/li><li>Los datos hist\u00f3ricos pueden comenzar a medirse con otros datos para responder a la pregunta por que sucedi\u00f3 algo en el pasado<\/li><li>Es el proceso de recopilar e interpretar  diferentes conjuntos de datos para identificar anomal\u00edas, detectar patrones  y determinar relaciones<\/li><li>Por ejemplo: con ayuda de los datos hist\u00f3ricos se puede determinar que hubo un periodo de actualizaciones en los equipos de computo que no se realiz\u00f3<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"364\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_150-1024x364.png\" alt=\"\" class=\"wp-image-8733\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_150-1024x364.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_150-300x107.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_150-768x273.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_150.png 1249w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">An\u00e1lisis Predictivo<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Responde a: <strong>\u00bfQu\u00e9 pasar\u00e1?<\/strong><\/li><li>Es una categor\u00eda de inteligencia empresarial (Business Intelligence)<\/li><li>Que utiliza variables descriptivas y predictivas del pasado para analizar e identificar la probabilidad de un resultado futuro<\/li><li>Por ejemplo: si no se actualizan los equipos los ciberataques continuar\u00e1n aumentando<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"553\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_151-1024x553.png\" alt=\"\" class=\"wp-image-8737\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_151-1024x553.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_151-300x162.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_151-768x415.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_151.png 1087w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">An\u00e1lisis Prescriptivo<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Responde a: <strong>\u00bfQu\u00e9 se debe realizar?<\/strong><\/li><li>Es una combinaci\u00f3n de datos, modelos matem\u00e1ticos y reglas comerciales para determinar las acciones que influyan en los resultados futuros deseados <\/li><li>Por ejemplo: es necesario realizar la actualizaci\u00f3n y crear un mecanismo de alertas que evite que este suceso vuelva a ocurrir<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"546\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_152-1024x546.png\" alt=\"\" class=\"wp-image-8739\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_152-1024x546.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_152-300x160.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_152-768x410.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_152.png 1172w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h4 class=\"wp-block-heading\">An\u00e1lisis Cognitivo<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Puede ayudarnos a automatizar o mejorar procesos, ya que re\u00fane tecnolog\u00edas inteligentes <\/li><li>Aplicando sem\u00e1ntica, algoritmos de Inteligencia artificial y t\u00e9cnicas de aprendizaje como el aprendizaje profundo y autom\u00e1tico <\/li><li>Por ejemplo: con este an\u00e1lisis se podr\u00edan detectar amenazas en la red casi de manera inmediata al registrar  alg\u00fan comportamiento inusual incluso se podr\u00eda ejecutar acciones correctivas evitando perder tiempo que es crucial en temas de seguridad<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"527\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_153-1024x527.png\" alt=\"\" class=\"wp-image-8740\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_153-1024x527.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_153-300x154.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_153-768x395.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_153.png 1270w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 3: Exploraci\u00f3n del almacenamiento de archivos<\/h2>\n\n\n\n<p>La capacidad de almacenar datos en archivos es un elemento b\u00e1sico de cualquier sistema inform\u00e1tico. Los archivos se pueden almacenar en sistemas de archivos locales en el disco duro del equipo personal y en medios extra\u00edbles, como unidades USB, pero en la mayor\u00eda de las organizaciones los archivos de datos importantes se almacenan centralmente en alg\u00fan tipo de sistema de almacenamiento de archivos compartido. Cada vez m\u00e1s, esa ubicaci\u00f3n de almacenamiento central se hospeda en la nube, lo que permite un almacenamiento rentable, seguro y de confianza para grandes vol\u00famenes de datos.<\/p>\n\n\n\n<p>El formato de archivo espec\u00edfico que se usa para almacenar datos depende de una serie de factores, entre los que se incluyen los siguientes:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>El tipo de datos que se almacenan (estructurados, semiestructurados o no estructurados).<\/li><li>Las aplicaciones y los servicios que tendr\u00e1n que leer, escribir y procesar los datos.<\/li><li>La necesidad de que los archivos de datos sean legibles para los usuarios o est\u00e9n optimizados para un almacenamiento y procesamiento eficientes.<\/li><\/ul>\n\n\n\n<p>A continuaci\u00f3n se describen algunos formatos de archivo comunes.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Archivos de texto delimitado<\/h3>\n\n\n\n<p>A menudo, los datos se almacenan como texto sin formato con delimitadores de campo y terminadores de fila espec\u00edficos. El formato m\u00e1s com\u00fan para los datos delimitados son los valores separados por comas (CSV), en los que los campos est\u00e1n separados por comas y las filas finalizan con un retorno de carro o una nueva l\u00ednea. Opcionalmente, la primera l\u00ednea puede incluir los nombres de campo. Otros formatos comunes incluyen valores separados por tabulaciones (TSV) y delimitados por espacios (en los que se usan tabulaciones o espacios para separar los campos), as\u00ed como datos de ancho fijo en los que a cada campo se le asigna un n\u00famero fijo de caracteres. El texto delimitado es una buena opci\u00f3n para los datos estructurados a los que necesita tener acceso una amplia gama de aplicaciones y servicios en un formato legible.<\/p>\n\n\n\n<p>En el ejemplo siguiente se muestran los datos de clientes en formato delimitado por comas:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>FirstName,LastName,Email\nJoe,Jones,joe@litware.com\nSamir,Nadoy,samir@northwind.com<\/code><\/pre>\n\n\n\n<h3 class=\"wp-block-heading\">Notaci\u00f3n de objetos JavaScript (JSON)<\/h3>\n\n\n\n<p>JSON es un formato omnipresente en el que se usa un esquema de documento jer\u00e1rquico para definir entidades de datos (objetos) que tienen varios atributos. Cada atributo puede ser un objeto (o una colecci\u00f3n de objetos ), lo que hace de JSON un formato flexible adecuado tanto para datos estructurados como semiestructurados.<\/p>\n\n\n\n<p>En el ejemplo siguiente se muestra un documento JSON que contiene una colecci\u00f3n de clientes. Cada cliente tiene tres atributos (<em>firstName<\/em>,&nbsp;<em>lastName<\/em>&nbsp;y&nbsp;<em>contact<\/em>) y el atributo&nbsp;<em>contact<\/em>&nbsp;contiene una colecci\u00f3n de objetos que representan uno o varios m\u00e9todos de contacto (correo electr\u00f3nico o tel\u00e9fono). Tenga en cuenta que los objetos se incluyen entre llaves (<strong>{..}<\/strong>) y las colecciones se incluyen entre corchetes (<strong>[..]<\/strong>). Los atributos se representan mediante pares&nbsp;<em>nombre<\/em><strong>:<\/strong><em>valor<\/em>&nbsp;y se separan por comas (<strong>,<\/strong>).<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>{\n  \"customers\":\n  &#91;\n    {\n      \"firstName\": \"Joe\",\n      \"lastName\": \"Jones\",\n      \"contact\":\n      &#91;\n        {\n          \"type\": \"home\",\n          \"number\": \"555 123-1234\"\n        },\n        {\n          \"type\": \"email\",\n          \"address\": \"joe@litware.com\"\n        }\n      ]\n    },\n    {\n      \"firstName\": \"Samir\",\n      \"lastName\": \"Nadoy\",\n      \"contact\":\n      &#91;\n        {\n          \"type\": \"email\",\n          \"address\": \"samir@northwind.com\"\n        }\n      ]\n    }\n  ]\n}<\/code><\/pre>\n\n\n\n<h3 class=\"wp-block-heading\">Lenguaje de marcado extensible (XML)<\/h3>\n\n\n\n<p>XML es un formato de datos legible popular en la d\u00e9cada de 1990 y 2000. En gran medida lo ha reemplazado el formato JSON, menos detallado, pero todav\u00eda hay algunos sistemas que usan XML para representar datos. XML usa&nbsp;<em>etiquetas<\/em>&nbsp;entre corchetes angulares (<strong>..\/<\/strong>) para definir&nbsp;<em>elementos<\/em>&nbsp;y&nbsp;<em>atributos<\/em>, como se muestra en este ejemplo:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>&lt;Customers&gt;\n  &lt;Customer name=\"Joe\" lastName=\"Jones\"&gt;\n    &lt;ContactDetails&gt;\n      &lt;Contact type=\"home\" number=\"555 123-1234\"\/&gt;\n      &lt;Contact type=\"email\" address=\"joe@litware.com\"\/&gt;\n    &lt;\/ContactDetails&gt;\n  &lt;\/Customer&gt;\n  &lt;Customer name=\"Samir\" lastName=\"Nadoy\"&gt;\n    &lt;ContactDetails&gt;\n      &lt;Contact type=\"email\" address=\"samir@northwind.com\"\/&gt;\n    &lt;\/ContactDetails&gt;\n  &lt;\/Customer&gt;\n&lt;\/Customers&gt;<\/code><\/pre>\n\n\n\n<h3 class=\"wp-block-heading\">Objeto binario grande (BLOB)<\/h3>\n\n\n\n<p>En \u00faltima instancia, todos los archivos se almacenan como datos binarios (1 y 0), pero en los formatos legibles que se describen anteriormente, los bytes de datos binarios se asignan a caracteres imprimibles (normalmente a trav\u00e9s de un esquema de codificaci\u00f3n de caracteres como ASCII o Unicode). Aun as\u00ed, algunos formatos de archivo, especialmente para los datos no estructurados, almacenan los datos como datos binarios sin formato que las aplicaciones deben interpretar y representar. Los tipos comunes de datos almacenados como datos binarios incluyen im\u00e1genes, v\u00eddeo, audio y documentos espec\u00edficos de aplicaciones.<\/p>\n\n\n\n<p>Cuando trabajan con datos de este tipo, los profesionales de datos suelen hacer referencia a estos archivos de datos como&nbsp;<em>BLOB<\/em>&nbsp;(objetos binarios grandes).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Formatos de archivo optimizados<\/h3>\n\n\n\n<p>Aunque los formatos legibles para datos estructurados y semiestructurados pueden ser \u00fatiles, normalmente no est\u00e1n optimizados para el procesamiento o el espacio de almacenamiento. Con el paso del tiempo, se han desarrollado algunos formatos de archivo especializados que permiten la compresi\u00f3n, la indexaci\u00f3n y un almacenamiento y procesamiento eficientes.<\/p>\n\n\n\n<p>Entre los formatos de archivo optimizados m\u00e1s habituales que puede ver se incluyen&nbsp;<em>Avro<\/em>,&nbsp;<em>ORC<\/em>&nbsp;y&nbsp;<em>Parquet<\/em>:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><em>Avro<\/em>&nbsp;es un formato basado en filas creado por Apache. Cada registro contiene un encabezado que describe la estructura de los datos en ese registro. Este encabezado se almacena como JSON. Los datos, por su parte, se almacenan como informaci\u00f3n binaria. Una aplicaci\u00f3n usa la informaci\u00f3n del encabezado para analizar los datos binarios y extraer los campos que contienen. Avro es un formato adecuado para comprimir datos y reducir los requisitos de almacenamiento y ancho de banda de red.<\/li><li><em>ORC<\/em>&nbsp;(formato de columnas de filas optimizadas) organiza los datos en columnas en lugar de en filas. Lo desarroll\u00f3 HortonWorks para optimizar las operaciones de lectura y escritura en Apache Hive (Hive es un sistema de almacenamiento de datos que admite res\u00famenes de datos r\u00e1pidos y consultas en grandes conjuntos de datos). Un archivo ORC contiene&nbsp;<em>franjas<\/em>&nbsp;de datos. Cada franja contiene los datos de una columna o de un conjunto de columnas. Una franja contiene un \u00edndice de las filas de dicha franja, los datos de cada fila y un pie de p\u00e1gina que contiene informaci\u00f3n estad\u00edstica (count, sum, max, min, etc.) de cada columna.<\/li><li><em>Parquet<\/em>&nbsp;es otro formato de datos en columnas creado por Cloudera y Twitter. Un archivo Parquet contiene grupos de filas. Los datos de cada columna se almacenan juntos en el mismo grupo de filas. Cada grupo de filas contiene uno o varios fragmentos de datos. Un archivo Parquet incluye metadatos que describen el conjunto de filas que hay en cada fragmento. Una aplicaci\u00f3n puede usar estos metadatos para localizar r\u00e1pidamente el fragmento correcto para un conjunto determinado de filas y, a continuaci\u00f3n, para recuperar los datos de las columnas especificadas relativos a esas filas. Parquet destaca por almacenar y procesar tipos de datos anidados de forma eficaz. Admite esquemas de compresi\u00f3n y codificaci\u00f3n muy eficaces.<\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 4: Exploraci\u00f3n de bases de datos<\/h2>\n\n\n\n<p>Las bases de datos se usan para definir un sistema central en el que los datos se pueden almacenar y consultar. En un sentido simplista, el sistema de archivos en el que se almacenan los archivos es un tipo de base de datos; pero cuando usamos el t\u00e9rmino en un contexto de datos profesional, normalmente nos referimos a un sistema dedicado para administrar registros de datos en lugar de archivos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Bases de datos relacionales<\/h3>\n\n\n\n<p>Las bases de datos relacionales suelen usarse para almacenar y consultar datos estructurados. Los datos se almacenan en tablas que representan entidades, por ejemplo, clientes, productos o pedidos de ventas. A cada instancia de una entidad se le asigna una&nbsp;<em>clave principal<\/em>&nbsp;que la identifica de forma \u00fanica; estas claves se usan para hacer referencia a la instancia de entidad en otras tablas. Por ejemplo, se puede hacer referencia a la clave principal de un cliente en un registro de pedidos de ventas para indicar qu\u00e9 cliente ha realizado el pedido. Este uso de claves para hacer referencia a entidades de datos permite&nbsp;<em>normalizar<\/em>&nbsp;una base de datos relacional. En parte, esto conlleva la eliminaci\u00f3n de valores de datos duplicados para que, por ejemplo, los detalles de un cliente individual se almacenen una sola vez, no para cada pedido de ventas que realiza el cliente. Las tablas se administran y consultan mediante el Lenguaje de consulta estructurado (SQL), que se basa en un est\u00e1ndar ANSII, por lo que es similar en varios sistemas de base de datos.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"894\" height=\"365\" src=\"\/wp-content\/uploads\/2022\/05\/relational-database-1.png\" alt=\"\" class=\"wp-image-8762\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/relational-database-1.png 894w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/relational-database-1-300x122.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/relational-database-1-768x314.png 768w\" sizes=\"(max-width: 894px) 100vw, 894px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Bases de datos no relacionales<\/h3>\n\n\n\n<p>Las bases de datos no relacionales son sistemas de administraci\u00f3n de datos que no aplican un esquema relacional a los datos. Las bases de datos no relacionales suelen conocerse como bases de datos NoSQL, aunque algunas admiten una variante del lenguaje SQL.<\/p>\n\n\n\n<p>Hay cuatro tipos comunes de bases de datos no relacionales que se usan habitualmente.<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Bases de datos de clave-valor<\/strong>, en las que cada registro consta de una clave \u00fanica y un valor asociado, que puede estar en cualquier formato.<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"245\" height=\"145\" src=\"\/wp-content\/uploads\/2022\/05\/key-value-store-1.png\" alt=\"\" class=\"wp-image-8764\"\/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Bases de datos de documentos<\/strong>, que son una forma espec\u00edfica de base de datos de clave-valor, en la que el valor es un documento JSON (que el sistema est\u00e1 optimizado para analizar y consultar).<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"360\" height=\"223\" src=\"\/wp-content\/uploads\/2022\/05\/document-store-1.png\" alt=\"\" class=\"wp-image-8765\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/document-store-1.png 360w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/document-store-1-300x186.png 300w\" sizes=\"(max-width: 360px) 100vw, 360px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Bases de datos de familia de columnas<\/strong>, que almacenan datos tabulares con filas y columnas, pero con la posibilidad de dividir esas columnas en grupos, conocidos como familias de columnas. Cada familia de columnas contiene un conjunto de columnas que tienen una relaci\u00f3n l\u00f3gica entre s\u00ed.<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"407\" height=\"160\" src=\"\/wp-content\/uploads\/2022\/05\/column-family-store-1.png\" alt=\"\" class=\"wp-image-8766\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/column-family-store-1.png 407w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/column-family-store-1-300x118.png 300w\" sizes=\"(max-width: 407px) 100vw, 407px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Bases de datos de grafos<\/strong>, que almacenan entidades como nodos con v\u00ednculos para definir relaciones entre ellas.<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"284\" height=\"195\" src=\"\/wp-content\/uploads\/2022\/05\/graph-1.png\" alt=\"\" class=\"wp-image-8767\"\/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\"><\/h3>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 5: Exploraci\u00f3n del procesamiento de datos transaccionales<\/h2>\n\n\n\n<p>Un sistema de procesamiento de datos transaccional es lo que la mayor\u00eda de los usuarios considera la funci\u00f3n principal de la inform\u00e1tica empresarial. Un sistema transaccional registra las&nbsp;<em>transacciones<\/em>&nbsp;que encapsulan eventos espec\u00edficos de los que la organizaci\u00f3n quiere realizar un seguimiento. Una transacci\u00f3n podr\u00eda ser financiera, como el movimiento de dinero entre cuentas de un sistema bancario, o bien podr\u00eda formar parte de un sistema de venta al por menor y llevar un seguimiento de los pagos de bienes y servicios de los clientes. Piense en una transacci\u00f3n como una unidad de trabajo peque\u00f1a y discreta.<\/p>\n\n\n\n<p>Los sistemas transaccionales suelen ser de gran volumen; a veces, controlan muchos millones de transacciones en un solo d\u00eda. Se debe poder acceder a los datos que se procesan con mucha rapidez. El trabajo que realizan los sistemas transaccionales a menudo se conoce como procesamiento de transacciones en l\u00ednea (OLTP).<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"384\" height=\"161\" src=\"\/wp-content\/uploads\/2022\/05\/transactional-processing-1.png\" alt=\"\" class=\"wp-image-8772\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/transactional-processing-1.png 384w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/transactional-processing-1-300x126.png 300w\" sizes=\"(max-width: 384px) 100vw, 384px\" \/><\/figure>\n\n\n\n<p>Las soluciones OLTP se basan en un sistema de base de datos en el que el almacenamiento de datos est\u00e1 optimizado tanto para las operaciones de lectura como para las de escritura, con el fin de admitir cargas de trabajo transaccionales en las que se crean, recuperan, actualizan y eliminan registros de datos (a menudo denominadas operaciones&nbsp;<em>CRUD<\/em>). Estas operaciones se aplican transaccionalmente, de una forma que garantiza la integridad de los datos almacenados en la base de datos. Para ello, los sistemas OLTP aplican transacciones que admiten la denominada sem\u00e1ntica ACID:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Atomicidad<\/strong>: cada transacci\u00f3n se trata como una unidad \u00fanica, la cual se completa correctamente o produce un error general. Por ejemplo, una transacci\u00f3n que conlleve el adeudo de fondos de una cuenta y el abono de la misma cantidad en otra debe completar ambas acciones. Si alguna de las acciones no se puede completar, se debe producir un error en la otra.<\/li><li><strong>Coherencia<\/strong>: las transacciones solo pueden pasar los datos de la base de datos de un estado v\u00e1lido a otro. Para continuar con el ejemplo anterior del adeudo y el abono, el estado completado de la transacci\u00f3n debe reflejar la transferencia de fondos de una cuenta a la otra.<\/li><li><strong>Aislamiento:<\/strong>&nbsp;las transacciones simult\u00e1neas no pueden interferir entre s\u00ed y deben dar lugar a un estado coherente de la base de datos. Por ejemplo, mientras la transacci\u00f3n para transferir fondos de una cuenta a otra est\u00e1 en proceso, otra transacci\u00f3n que comprueba el saldo de las cuentas debe devolver resultados coherentes. Es decir, la transacci\u00f3n de comprobaci\u00f3n del saldo no puede recuperar un valor para una cuenta que refleje el saldo&nbsp;<em>antes<\/em>&nbsp;de la transferencia y un valor para la otra cuenta que refleje el saldo&nbsp;<em>despu\u00e9s<\/em>&nbsp;de la transferencia.<\/li><li><strong>Durabilidad<\/strong>: cuando se ha confirmado una transacci\u00f3n, permanece confirmada. Una vez que la transacci\u00f3n de transferencia de la cuenta se ha completado, los saldos revisados de las cuentas se conservan, de modo que, incluso si el sistema de base de datos se desactiva, la transacci\u00f3n confirmada se refleje cuando se vuelva a activar.<\/li><\/ul>\n\n\n\n<p>Los sistemas OLTP suelen usarse para admitir aplicaciones activas que procesan datos empresariales, a menudo denominadas aplicaciones de&nbsp;<em>l\u00ednea de negocio<\/em>&nbsp;(LOB).<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Unidad 6: Exploraci\u00f3n del procesamiento de datos anal\u00edticos<\/h2>\n\n\n\n<p>Normalmente, el procesamiento de datos anal\u00edticos usa sistemas de solo lectura (o&nbsp;<em>principalmente<\/em>&nbsp;de lectura) que almacenan grandes vol\u00famenes de datos hist\u00f3ricos o m\u00e9tricas empresariales. Los an\u00e1lisis pueden basarse en una instant\u00e1nea de los datos en un momento concreto o en una serie de instant\u00e1neas.<\/p>\n\n\n\n<p>Los detalles espec\u00edficos de un sistema de procesamiento anal\u00edtico pueden variar seg\u00fan la soluci\u00f3n, pero una arquitectura com\u00fan para el an\u00e1lisis a escala empresarial tiene el siguiente aspecto:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"336\" src=\"\/wp-content\/uploads\/2022\/05\/analytical-processing-1-1024x336.png\" alt=\"\" class=\"wp-image-8780\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/analytical-processing-1-1024x336.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/analytical-processing-1-300x98.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/analytical-processing-1-768x252.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/analytical-processing-1.png 1117w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ol class=\"wp-block-list\"><li>Los archivos de datos se pueden almacenar en un lago de datos central para analizarlos.<\/li><li>Un proceso de extracci\u00f3n, transformaci\u00f3n y carga (ETL) permite copiar datos de archivos y bases de datos OLTP en un almacenamiento de datos optimizado para la actividad de lectura. Normalmente, un esquema de almacenamiento de datos se basa en tablas de&nbsp;<em>hechos<\/em>&nbsp;que contienen valores num\u00e9ricos que quiere analizar (por ejemplo, importes de ventas), con tablas de&nbsp;<em>dimensiones<\/em>&nbsp;relacionadas que representan las entidades por las que quiere medirlas (por ejemplo, cliente o producto).<\/li><li>Los datos del almacenamiento de datos se pueden agregar y cargar en un modelo de procesamiento anal\u00edtico en l\u00ednea (OLAP) o un&nbsp;<em>cubo<\/em>. Los valores num\u00e9ricos agregados (<em>medidas<\/em>) de las tablas de hechos se calculan para intersecciones de&nbsp;<em>dimensiones<\/em>&nbsp;a partir de tablas de dimensiones. Por ejemplo, los ingresos de ventas podr\u00edan sumarse por fecha, cliente y producto.<\/li><li>Los datos del lago de datos, el almacenamiento de datos y el modelo anal\u00edtico se pueden consultar para generar informes, visualizaciones y paneles.<\/li><\/ol>\n\n\n\n<p><em>Los lagos de datos<\/em>&nbsp;son comunes en escenarios de procesamiento anal\u00edtico de datos modernos, en los que se debe recopilar y analizar un gran volumen de datos basados en archivos.<\/p>\n\n\n\n<p><em>Los almacenamientos de datos<\/em>&nbsp;son un recurso establecido para almacenar datos en un esquema relacional optimizado para operaciones de lectura, principalmente consultas para admitir informes y visualizaci\u00f3n de datos. El esquema de almacenamiento de datos puede requerir alguna desnormalizaci\u00f3n de los datos en un origen de datos OLTP (que introduce cierta duplicaci\u00f3n para que las consultas se lleven a cabo con mayor rapidez).<\/p>\n\n\n\n<p>Un modelo OLAP es un tipo agregado de almacenamiento de datos optimizado para cargas de trabajo anal\u00edticas. Las agregaciones de datos se encuentran en diferentes dimensiones y distintos niveles, lo que permite&nbsp;<em>rastrear agrupando datos y explorar en profundidad<\/em>&nbsp;las agregaciones en varios niveles jer\u00e1rquicos; por ejemplo, para buscar el total de ventas por regi\u00f3n, por ciudad o por una direcci\u00f3n individual. Dado que los datos de OLAP se agregan previamente, las consultas para devolver los res\u00famenes que contiene se pueden ejecutar r\u00e1pidamente.<\/p>\n\n\n\n<p>Los diferentes tipos de usuario pueden llevar a cabo el trabajo anal\u00edtico de datos en distintas fases de la arquitectura general. Por ejemplo:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Los cient\u00edficos de datos pueden trabajar directamente con archivos de datos en un lago de datos para explorar los datos y crear modelos a partir de estos.<\/li><li>Los analistas de datos pueden consultar tablas directamente en el almacenamiento de datos para generar informes y visualizaciones complejos.<\/li><li>Los usuarios profesionales pueden consumir datos agregados previamente en un modelo anal\u00edtico como informes o paneles.<\/li><\/ul>\n\n\n\n<hr class=\"wp-block-separator\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">MCT: <strong>Video 1.1.2: Descripci\u00f3n de los datos por lotes (Batch Data)<\/strong><\/h2>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Descripci\u00f3n de datos por lotes (batch data)\" width=\"1290\" height=\"726\" src=\"https:\/\/www.youtube.com\/embed\/pVGRVKPPIe8?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Datos por lotes (Batch Data)<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es un m\u00e9todo de ejecuci\u00f3n de tareas repetitivas, de gran volumen que permite a los usuarios procesar datos cuando se disponga de recursos inform\u00e1ticos con poco o nula interacci\u00f3n del usuario<\/li><li>Use Azure Batch para ejecutar aplicaciones de inform\u00e1tica de alto rendimiento (HPC) en paralelo y a gran escala, de manera eficaz en Azure.<\/li><li>Azure Batch permite crear y administrar un conjunto de nodos de proceso (m\u00e1quinas virtuales), instalar las aplicaciones que desea ejecutar y programar trabajos para que se ejecuten en los nodos.\u00a0<\/li><li>Los desarrolladores pueden usar Batch como un servicio de plataforma para compilar aplicaciones SaaS o aplicaciones cliente en las que se requiere una ejecuci\u00f3n a gran escala.\u00a0<\/li><li>Por ejemplo, puede compilar un servicio con Batch para que ejecute una simulaci\u00f3n de riesgo Monte Carlo para una empresa de servicios financieros o un servicio que procese muchas im\u00e1genes.<\/li><li>Batch funciona bien con cargas de trabajo intr\u00ednsecamente paralelas (a veces llamadas \u00abembarazosamente paralelas\u00bb).<\/li><li>Estas cargas de trabajo tienen aplicaciones que se pueden ejecutar de manera independiente y donde cada instancia completa una parte del trabajo.<\/li><\/ul>\n\n\n\n<p>A continuaci\u00f3n puede ver algunos ejemplos de cargas de trabajo intr\u00ednsecamente paralelas con las que puede trabajar en Batch:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>Modelado de riesgos financieros mediante simulaciones Monte Carlo<\/li><li>Representaci\u00f3n de im\u00e1genes VFX y 3D<\/li><li>An\u00e1lisis y procesamiento de im\u00e1genes<\/li><li>Transcodificaci\u00f3n de elementos multimedia<\/li><li>An\u00e1lisis de secuencia gen\u00e9tica<\/li><li>Reconocimiento \u00f3ptico de caracteres (OCR)<\/li><li>Ingesta, procesamiento, extracci\u00f3n, transformaci\u00f3n y carga de datos<\/li><li>Ejecuci\u00f3n de pruebas de software<\/li><\/ul>\n\n\n\n<p>Tambi\u00e9n puede usar Batch para&nbsp;<a href=\"https:\/\/docs.microsoft.com\/es-es\/azure\/batch\/batch-mpi\">ejecutar cargas de trabajo estrechamente acopladas<\/a>&nbsp;donde las aplicaciones que se ejecutan necesitan comunicarse entre s\u00ed, en lugar de hacerlo de forma independiente. Las aplicaciones estrechamente acopladas normalmente utilizan Message Passing Interface (MPI) API. Puede ejecutar cargas de trabajo estrechamente acopladas con Batch mediante&nbsp;<a href=\"https:\/\/docs.microsoft.com\/es-ES\/message-passing-interface\/microsoft-mpi\">Microsoft MPI<\/a>&nbsp;o Intel MPI. Mejore el rendimiento de la aplicaci\u00f3n con&nbsp;<a href=\"https:\/\/docs.microsoft.com\/es-es\/azure\/virtual-machines\/sizes-hpc\">inform\u00e1tica de alto rendimiento<\/a>&nbsp;especializada y tama\u00f1os de m\u00e1quina virtual&nbsp;<a href=\"https:\/\/docs.microsoft.com\/es-es\/azure\/virtual-machines\/sizes-gpu\">optimizados para GPU<\/a>.<\/p>\n\n\n\n<p>Estos son algunos ejemplos de cargas de trabajo estrechamente acopladas:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>An\u00e1lisis de elementos finitos<\/li><li>Din\u00e1mica de fluidos<\/li><li>Aprendizaje de inteligencia artificial multinodo<\/li><\/ul>\n\n\n\n<p>Batch admite&nbsp;<a href=\"https:\/\/docs.microsoft.com\/es-es\/azure\/batch\/batch-rendering-service\">cargas de trabajo de representaci\u00f3n a gran escala<\/a>&nbsp;con herramientas de representaci\u00f3n que incluyen Autodesk Maya, 3ds Max, Arnold, y V-Ray.<\/p>\n\n\n\n<p>Azure Batch tambi\u00e9n se puede ejecutar como parte de un flujo de trabajo mayor de Azure para transformar datos, administrado mediante herramientas como&nbsp;<a href=\"https:\/\/docs.microsoft.com\/es-es\/azure\/data-factory\/transform-data-using-dotnet-custom-activity\">Azure Data Factory<\/a>.<\/p>\n\n\n\n<p id=\"how-it-works\">El siguiente diagrama muestra los pasos de un flujo de trabajo com\u00fan de Batch, con una aplicaci\u00f3n cliente o un servicio hospedado usando Batch para ejecutar una carga de trabajo paralela.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"760\" height=\"708\" src=\"\/wp-content\/uploads\/2022\/05\/tech_overview_03.png\" alt=\"\" class=\"wp-image-8866\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/tech_overview_03.png 760w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/tech_overview_03-300x279.png 300w\" sizes=\"(max-width: 760px) 100vw, 760px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"899\" height=\"513\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_154.png\" alt=\"\" class=\"wp-image-8785\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_154.png 899w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_154-300x171.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_154-768x438.png 768w\" sizes=\"(max-width: 899px) 100vw, 899px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Par\u00e1metros esenciales<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Quien env\u00eda la tarea<\/li><li>Que programa se ejecutar\u00e1<\/li><li>Ubicaci\u00f3n de archivos de entrada y salida<\/li><li>Cuando se debe ejecutar la tarea<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"392\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_155-1024x392.png\" alt=\"\" class=\"wp-image-8786\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_155-1024x392.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_155-300x115.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_155-768x294.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_155.png 1289w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Tipos de datos y su almacenamiento<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Los datos se pueden clasificar de muchas maneras diferentes entre ellas:<ul><li>Como est\u00e1n estructurados<\/li><li>Y como se usan<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"871\" height=\"452\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_156-1.png\" alt=\"\" class=\"wp-image-8789\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_156-1.png 871w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_156-1-300x156.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_156-1-768x399.png 768w\" sizes=\"(max-width: 871px) 100vw, 871px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Caracter\u00edsticas de los datos relacionales y no relacionales<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>Las BD relacionales proporcionan el modelo de BD m\u00e1s sencillo de almacenamiento de datos<\/li><li>Las estructura de filas y columnas facilitan el uso inicial, sin embargo esta forma puede provocar errores en como se relacionan los datos <\/li><li>Por ejemplo que pasa si un cliente tiene m\u00e1s de una tarjeta de cr\u00e9dito para realizar los pagos <\/li><li>Estos problemas se pueden resolver con la normalizaci\u00f3n, que hace que los datos se dividan en un gran nuevo de tablas, con pocas columnas y bien definidas<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"532\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_157-1024x532.png\" alt=\"\" class=\"wp-image-8791\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_157-1024x532.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_157-300x156.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_157-768x399.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_157.png 1297w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Las bases de datos no relacionales permiten almacenar los datos en un formato que coincide m\u00e1s con la estructura original<\/li><li>Si dos clientes tienen la misma direcci\u00f3n en una BD relacional solo se almacena la direcci\u00f3n  una \u00fanica vez, pero en una BD no relacional o de documentos la direcci\u00f3n se duplicar\u00e1, esto aumenta el tama\u00f1o del almacenamiento y har\u00e1 que el mantenimiento de los datos sea m\u00e1s complejo ya que si la direcci\u00f3n cambia se debe modificar en 2 documentos<\/li><li><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"440\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_158-1024x440.png\" alt=\"\" class=\"wp-image-8792\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_158-1024x440.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_158-300x129.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_158-768x330.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_158.png 1353w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Cargas de trabajo transaccionales<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>Una transacci\u00f3n es una secuencia de operaciones at\u00f3micas<\/li><li>Esto significa que todas las operaciones de la secuencia se deben completar correctamente<\/li><li>O si ocurre un error se deben revertir todas las operaciones<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"484\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_159-1024x484.png\" alt=\"\" class=\"wp-image-8794\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_159-1024x484.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_159-300x142.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_159-768x363.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_159.png 1329w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Cada transacci\u00f3n de BD tiene un punto inicial definido, seguidos de los pasos para modificar los datos de la BD<\/li><li>Al final BD confirma los cambios para que estos sean permanentes o los revierte al punto inicial<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"570\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_160-1024x570.png\" alt=\"\" class=\"wp-image-8796\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_160-1024x570.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_160-300x167.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_160-768x427.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_160.png 1175w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">ACID<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Una BD transaccional tiene las propiedades ACID, para garantizar que la BD sigue siendo coherente mientras se procesan las transacciones<\/li><li>Atomicidad: garantiza que cada transacci\u00f3n se trata como una unidad \u00fanica, donde se completa correctamente o produce un error<\/li><li>Coherencia: garantiza que una transacci\u00f3n solo puede pasar de un estado valido a otro<\/li><li>Aislamiento: garantiza que la ejecuci\u00f3n simultanea de transacciones deja la BD como si estas se ejecutar\u00e1n de manera secuencial<\/li><li>Durabilidad: garantiza que una vez confirmada la transacci\u00f3n permanecer\u00e1 confirmada incluso se se produce un error en el sistema<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"598\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_161-1024x598.png\" alt=\"\" class=\"wp-image-8800\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_161-1024x598.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_161-300x175.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_161-768x448.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_161.png 1199w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Cargas de trabajo anal\u00edticas<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>Son sistemas de solo lectura <\/li><li>Que almacenan grandes vol\u00famenes de datos hist\u00f3ricos o de m\u00e9tricas empresariales<\/li><li>Por ejemplo: Rendimientos de ventas o niveles de inventario<\/li><li>Se utilizan para analizar datos y tomar decisiones<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"515\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_162-1024x515.png\" alt=\"\" class=\"wp-image-8804\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_162-1024x515.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_162-300x151.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_162-768x386.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_162.png 1121w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Los an\u00e1lisis pueden basarse en una instancia de los datos en un momento espec\u00edfico, o en una serie de instancias  <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"482\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_163-1024x482.png\" alt=\"\" class=\"wp-image-8805\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_163-1024x482.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_163-300x141.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_163-768x361.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_163.png 1216w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">MCT: Video 1.1.3: Descripci\u00f3n de Streaming Data<\/h2>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Descripci\u00f3n de streaming data\" width=\"1290\" height=\"726\" src=\"https:\/\/www.youtube.com\/embed\/qCzUP33-0N0?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Streaming data<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>Los sistemas de streaming poseen una arquitectura orientada a manejar eventos individualmente, para que los datos de puedan procesar tan pronto como se genera el evento <\/li><li>Los casos de uso:<ul><li>Donde se requiere respuesta activa de los usuarios tan pronto ocurran los eventos<\/li><li>Por ejemplo: el monitoreo de datos provenientes de sensores, redes sociales, servidores, aplicaciones, etc<\/li><\/ul><\/li><li>Esta arquitectura puede tener problemas de accesibilidad y calidad de datos <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"386\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_164-1024x386.png\" alt=\"\" class=\"wp-image-8812\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_164-1024x386.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_164-300x113.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_164-768x290.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_164.png 1360w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 es Streaming?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Es la tecnolog\u00eda de transmisi\u00f3n de datos por Internet que pueden ser accedidos por los usuarios sin la necesidad de la descarga previa<\/li><li>La carga del contenido publicado en este formato se realiza mientras el archivo esta siendo accedido, lo que disminuye el tiempo de espera de los usuarios, permitiendo el acceso casi instant\u00e1neo <\/li><li>Con streaming se puede transmitir contenido en vivo o grabados anteriormente, sin que los datos tengan que ser almacenados en computadoras u otro dispositivo<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"466\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_165-1024x466.png\" alt=\"\" class=\"wp-image-8813\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_165-1024x466.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_165-300x136.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_165-768x349.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_165.png 1269w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\u00bfQu\u00e9 son los datos de Streaming?<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Son datos que se generan constantemente a partir de muchas fuentes de datos, que env\u00edan los datos simult\u00e1neamente en conjuntos de datos peque\u00f1os <\/li><li>Estos datos <strong>deben procesarse de manera secuencial<\/strong> de registro por registro o en ventanas graduales <\/li><li>Se utilizan para diferentes tipos de an\u00e1lisis como correccionales, agregaciones, filtrado y muestreo<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"475\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_166-1024x475.png\" alt=\"\" class=\"wp-image-8815\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_166-1024x475.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_166-300x139.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_166-768x356.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_166.png 1333w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Ventajas<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Tiene ventaja cuando se generan datos nuevos y din\u00e1micos en forma constante<\/li><li>Se basa en procesar transmisiones, para realizar acciones sencillas como respuesta<\/li><li>Por ejemplo emitir alertas cuando se supera cierto umbral<\/li><li>Y con el tiempo pueden realizar an\u00e1lisis m\u00e1s sofisticados, como algoritmos de aprendizaje autom\u00e1tico <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"559\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_167-1-1024x559.png\" alt=\"\" class=\"wp-image-8817\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_167-1-1024x559.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_167-1-300x164.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_167-1-768x419.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_167-1.png 1280w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Ejemplos<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Sensores de veh\u00edculos de transporte<\/li><li>Datos multimedia en redes sociales<ul><li>Con la entrada se cargan los datos a un servicio de streaming <\/li><li>Este servicio ingiere y almacena los feed&#8217;s de las redes sociales para para su procesamiento<\/li><li>El procesamiento de SQL est\u00e1ndar genera datos de HashTag en tiempo real<\/li><li>Se ejecuta el c\u00f3digo solo cuando es necesario<\/li><li>Y se escala autom\u00e1ticamente <\/li><li>Se escriben los datos a un BD No SQL<\/li><li>Aqu\u00ed se almacenan las tendencias de las redes sociales<\/li><li>Ya se pueden visualizar los resultados<\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"396\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_168-1024x396.png\" alt=\"\" class=\"wp-image-8819\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_168-1024x396.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_168-300x116.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_168-768x297.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_168.png 1360w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">MCT: Video1.1.4: Descripci\u00f3n de las diferencias entre procesamiento por lotes y streaming<\/h2>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Descripci\u00f3n la diferencia entre lotes (batch) y streaming data\" width=\"1290\" height=\"726\" src=\"https:\/\/www.youtube.com\/embed\/vAs6SA9pQ10?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">El procesamiento de datos<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>El procesamiento de datos es la conversi\u00f3n datos a informaci\u00f3n significativa<\/li><li>En funci\u00f3n de como llegan los datos al sistemas se pueden clasificar en<ul><li>Streaming:<ul><li>Donde se procesan cada uno de los datos seg\u00fan como llegan<\/li><\/ul><\/li><li>Procesamiento por lotes:<ul><li>Se pueden almacenar el el bufer de datos sin procesar y procesarlos en grupos<\/li><\/ul><\/li><\/ul><\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"478\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_169-1024x478.png\" alt=\"\" class=\"wp-image-8825\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_169-1024x478.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_169-300x140.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_169-768x359.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_169.png 1344w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Procesamiento por lotes<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>En el procesamiento por lotes los alimentos de datos se recopilan en un grupo conforme van llegando<\/li><li>Despu\u00e9s todo el grupo se procesa m\u00e1s adelante como un lote<\/li><li>La forma en como se procesa cada grupo se puede determinar de varias maneras<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"485\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_170-1024x485.png\" alt=\"\" class=\"wp-image-8827\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_170-1024x485.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_170-300x142.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_170-768x363.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_170.png 1287w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Ventajas<\/li><li>Se pueden procesar grandes vol\u00famenes de datos en un momento determinado y se pueden programar en la noche o momento de poca actividad<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"533\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_171-1024x533.png\" alt=\"\" class=\"wp-image-8829\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_171-1024x533.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_171-300x156.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_171-768x400.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_171.png 1311w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>Desventajas<\/li><li>El tiempo de retardo entre la ingesta de datos y la obtenci\u00f3n de los resultados<\/li><li>Todos los datos deben estar listos para poder procesar un lote, es decir los datos deben comprobarse con cuidado<\/li><li>Los problemas que se dan con los datos, errores y bloqueos de los programas que se dan mientras se realiza la carga de los datos <\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Procesamiento de datos de streaming y en tiempo real<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>En el procesamiento en streaming cada nuevo fragmento de datos se procesa cuando llega<\/li><li>Trata los datos en tiempo real<\/li><li>Ejemplos:<\/li><li>Instituci\u00f3n financiera: seguimiento en tiempo real de la bolsa de valores<\/li><li>V\u00eddeo juegos en linea: registra las acciones de los jugadores<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"386\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_172-1-1024x386.png\" alt=\"\" class=\"wp-image-8831\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_172-1-1024x386.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_172-1-300x113.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_172-1-768x289.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_172-1.png 1361w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Diferencias entre los datos de streaming y por lotes<\/h2>\n\n\n\n<figure class=\"wp-block-table\"><table><tbody><tr><td><\/td><td>Lote<\/td><td>Streaming<\/td><\/tr><tr><td>\u00c1mbito de los datos<\/td><td>puede procesar todos los datos del conjunto de datos<\/td><td>Solo tiene los \u00faltimos datos<\/td><\/tr><tr><td>Tama\u00f1o<\/td><td>Puede procesar grandes conjuntos de datos de manera eficaz<\/td><td>Esta dise\u00f1ado para registros individuales o microlotes que constan de pocos registros<\/td><\/tr><tr><td>Rendimiento<\/td><td>La latencia es de unas horas<\/td><td>Es casi inmediato, lantencia de segundos o milisegundos<\/td><\/tr><tr><td>An\u00e1lisis<\/td><td>Para an\u00e1lisis complejos <\/td><td>Para an\u00e1lisis de respuestas simples, agregaciones o c\u00e1lculos, como la media acumulada<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">MCT: Video 1.1.5: Descripci\u00f3n de los datos relacionales<\/h2>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe title=\"Descripci\u00f3n las caracter\u00edsticas de datos relacional\" width=\"1290\" height=\"726\" src=\"https:\/\/www.youtube.com\/embed\/iURbVZGcn8c?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">Descripci\u00f3n las caracter\u00edsticas de datos relacional<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>En una BD relacional las colecciones de entidades del mundo real se modelan en forma de tablas<\/li><li>Una entidad se define como: \u00bfQu\u00e9 informaci\u00f3n debe conocerse o conservarse?<\/li><li>Las filas de una tabla tienen 1 o m\u00e1s columnas que definen las propiedades de la entidad<\/li><li>Por ejemplo: nombre del cliente o ID del producto<\/li><li>Todas las filas tienen las mismas columnas<\/li><li>Algunas columnas se utilizan para mantener la relaci\u00f3n entre las tablas, de aqu\u00ed proviene el nombre de modelo relacional<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"453\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_173-1024x453.png\" alt=\"\" class=\"wp-image-8839\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_173-1024x453.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_173-300x133.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_173-768x339.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_173.png 1360w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Caracter\u00edsticas de una BD relacional<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Todos los datos son tabulares<\/li><li>Las entidades se modelan como tablas<\/li><li>Cada instancia de la entidad es una fila de la tabla y cada propiedad se define como una columna<\/li><li>Todas las filas tienen las mismas columnas<\/li><li>Una tabla puede tener cualquier n\u00famero de filas<\/li><li>La clave principal identifica de forma exclusiva cada fila de la tabla<\/li><li>La clave externa hace referencia a las filas de otra tabla relacionada<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"510\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_174-1024x510.png\" alt=\"\" class=\"wp-image-8841\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_174-1024x510.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_174-300x150.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_174-768x383.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_174.png 1280w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\"><li>La mayor\u00eda de la bases de datos relacionales admiten el Lenguaje de Consulta Estructurado (SQL) <\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"447\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_175-1024x447.png\" alt=\"\" class=\"wp-image-8842\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_175-1024x447.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_175-300x131.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_175-768x336.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_175.png 1316w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Casos de uso de una BD relacional<\/h3>\n\n\n\n<ul class=\"wp-block-list\"><li>Las aplicaciones OLTP se centran en transacciones, que procesan un gran n\u00famero de interacciones por minuto<\/li><li>Admiten operaciones de inserci\u00f3n, actualizaci\u00f3n y eliminaci\u00f3n <\/li><li> Ejemplos: Bancos \/ Comercios en linea \/ Reserva de vuelos \/ etc<\/li><\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"519\" src=\"\/wp-content\/uploads\/2022\/05\/Seleccion_176-1024x519.png\" alt=\"\" class=\"wp-image-8844\" srcset=\"https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_176-1024x519.png 1024w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_176-300x152.png 300w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_176-768x390.png 768w, https:\/\/sada.services\/wp-content\/uploads\/2022\/05\/Seleccion_176.png 1299w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n","protected":false},"excerpt":{"rendered":"<p>https:\/\/docs.microsoft.com\/es-mx\/learn\/modules\/explore-core-data-concepts\/ Unidad 1: Introducci\u00f3n Durante las \u00faltimas d\u00e9cadas, la cantidad de datos que generan los sistemas, las aplicaciones y los dispositivos ha aumentado considerablemente. Los datos est\u00e1n en todas partes, en una gran variedad de estructuras y formatos. Ahora los datos pueden recopilarse de manera m\u00e1s f\u00e1cil y almacenarse de forma m\u00e1s barata, lo que [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[390],"tags":[398,391],"class_list":["post-8629","post","type-post","status-publish","format-standard","hentry","category-cursos","tag-dp-900","tag-microsoft-azure"],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":6}},"_links":{"self":[{"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/posts\/8629","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/sada.services\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=8629"}],"version-history":[{"count":58,"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/posts\/8629\/revisions"}],"predecessor-version":[{"id":8870,"href":"https:\/\/sada.services\/index.php?rest_route=\/wp\/v2\/posts\/8629\/revisions\/8870"}],"wp:attachment":[{"href":"https:\/\/sada.services\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=8629"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/sada.services\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=8629"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/sada.services\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=8629"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}