Curso: Microsoft Azure INA. Tema03: Módulo 06: Elección del mejor servicio de supervisión para visibilidad, información y mitigación de interrupciones

https://docs.microsoft.com/es-mx/learn/modules/monitoring-fundamentals/

Unidad 01: Introducción

Los sistemas de software modernos que se ejecutan en la nube son complejos, por lo que conocer el estado y el rendimiento de su entorno de hospedaje de aplicaciones —con todos sus niveles de servicios— supone todo un reto. Afortunadamente, Microsoft ofrece varias soluciones que pueden ayudarle a reaccionar rápidamente ante interrupciones, investigar problemas intermitentes, optimizar el uso y mantener una actitud proactiva en el control de los tiempos de inactividad planeados.

Tailwind Traders, un minorista con tiendas físicas tradicionales, ahora está experimentando un crecimiento explosivo al vender productos en línea. La empresa pretende reforzar y aplicar el control de su entorno en la nube. Se enfrenta a varios desafíos, desde la necesidad de optimizar el gasto en la nube y la posición de seguridad, hasta el seguimiento de problemas intermitentes y el planeamiento anticipado de interrupciones futuras. No obstante, la empresa necesita ayuda para elegir el producto adecuado para cada uno de estos escenarios.

En este módulo, obtendrá información sobre las diferentes soluciones de supervisión de Microsoft y analizará los criterios de decisión que los expertos usan para seleccionar el servicio adecuado para un escenario determinado.

Unidad 2: Identificación de las opciones de productos

A todas las empresas que usan la nube les surgen varias inquietudes o preguntas básicas.

  • ¿Usamos la nube correctamente? ¿Podemos aumentar el rendimiento sin incrementar el gasto en la nube?
  • ¿Gastamos más de lo necesario?
  • ¿Protegemos correctamente nuestros sistemas?
  • ¿Qué resistencia tienen nuestros recursos? Si experimentamos una interrupción en la región, ¿podríamos conmutar por error a otra región?
  • ¿Cómo se pueden diagnosticar y corregir los problemas que se producen de forma intermitente?
  • ¿Cómo podemos determinar rápidamente la causa de una interrupción?
  • ¿Cómo podemos aprender a planear el tiempo de inactividad?

Video

  • Las organizaciones confían que sus aplicaciones y infraestructura subyacente esta habilitada y responde a sus clientes
  • Para esto utilizan varias herramientas de motorización para visualizar y percibir posibles problemas y apagones
  • Existe bastante información que puede ser monitorizada aún en pequeñas nubes
  • El administrador de la nube supervisa los servicios que brinda
  • El administrador supervisa interrupciones, errores y bajos rendimientos
  • Por ejemplo, hay un apagón en la región, donde tenemos servicios?
  • O existe una interrupción para un servicio específico?
  • Ocurrió una interrupción temporal que afecto a los usuarios?
  • Existe una interrupción planificada
  • Los arquitectos de la nube quieren monitorizar el uso y rendimiento de varios recursos como MV, para determinar si quieren escalar
  • DevOps ingenieros quieren monitorizar el éxito de sus publicaciones, incluyendo advertencias y mensajes generados por los pipelines de CI/CD
  • Desarrolladores quieren supervisar las excepciones de las aplicaciones o medir el rendimiento de partes cruciales de la aplicación
  • O tal vez quieren recolectar datos sobre el uso de una característica
  • Expertos de seguridad quieren supervisar las actividades, redes y aplicaciones de posibles ataques o de un intento fraudulento
  • Administradores y financieros quieren supervisar los gastos y ser notificados cuando los servicios se pueden apagar para reducir los gastos o crear proyecciones de futuros usos
  • Azure ofrece varias herramientas para supervisión, sistemas de notificación y de respuesta de interrupciones

Afortunadamente, con una combinación de soluciones de supervisión en Azure, puede:

  • Obtener respuestas, información y alertas para asegurarse de que ha optimizado el uso de la nube.
  • Determinar la causa principal de los problemas no planeados.
  • Prepararse de antemano para interrupciones planeadas.

Opciones de productos

A nivel general, hay tres ofertas principales de supervisión de Azure, cada una de las cuales tiene como objetivo una audiencia y un caso de uso específicos, y proporcionan un conjunto diverso de herramientas, servicios, API de programación, etc

Video

  • Azure ofrece herramientas para supervisar y mantener la salud y rendimiento de su ambiente de nube, alerta acerca del rendimiento del sistema y prepararse para interrupciones planeadas
  • Existen 3 principales servicios de Supervisión

Azure Advisor

  • Analiza el uso y la configuración de sus recursos y ofrece recomendaciones para optimizar la confiabilidad, seguridad, rendimiento y costos
  • Azure Advisor envia notificaciones cuando detecta nuevas oportunidades y te suguiere acciones a tomar
  • Si busca recomendaciones para reducir costos o para optimizar su nube utilize Azure Advisor

Azure Monitor

  • Es una plataforma de recolección, análisis, visualización y potenciales acciones a tomar basado en la métricas y log’s de datos tanto de su ambiente en la nube como en local
  • Le permite buscar y identificar la causa del problema
  • Si quiere rastrear sus servicios y rendimientos de Azure y diagnosticar problemas utilice Azure Monitor

Azure Service Health

  • Provee una interfaz personalizable de la salud de servicios de Azure, Regiones y recursos, así como un historial de análisis de las causas que puede compartir con los patrocinadores
  • Si quiere supervisar el estado de los servicios de Azure y planear interrupciones planeadas use Azure Service Health
  • Puede que el software corriendo en la nube sea complejo pero tenerlo supervisado en salud y rendimiento no lo tiene que ser!

Azure Advisor

Azure Advisor evalúa los recursos de Azure y hace recomendaciones que contribuyen a mejorar la confiabilidad, la seguridad y el rendimiento, lograr la excelencia operativa y reducir los costos. Advisor está diseñado para ayudarle a ahorrar tiempo en la optimización en la nube. El servicio de recomendaciones sugiere medidas que puede adoptar de inmediato, posponer o descartar.

Las recomendaciones están disponibles con Azure Portal y la API. Además, es posible configurar notificaciones para estar al tanto de las nuevas recomendaciones.

El panel Advisor de Azure Portal muestra recomendaciones personalizadas para todas las suscripciones, y los filtros permiten seleccionar recomendaciones para suscripciones, grupos de recursos o servicios específicos. Las recomendaciones se dividen en cinco categorías:

  • Confiabilidad: se usa para garantizar y mejorar la continuidad de las aplicaciones críticas para la empresa.
  • Seguridad: se usa para detectar amenazas y vulnerabilidades que podrían dar lugar a infracciones de seguridad.
  • Rendimiento: se usa para mejorar la velocidad de las aplicaciones.
  • Costos: se usan para optimizar y reducir el gasto general de Azure.
  • Excelencia operativa: se usa para conseguir procedimientos recomendados de eficiencia en procesos y flujos de trabajo, manejabilidad de los recursos e implementación.

Azure Monitor

Azure Monitor es una plataforma que permite recopilar, analizar y mostrar datos, así como llevar a cabo acciones en función de las métricas y los datos registrados en todo el entorno local y de Azure.

El diagrama siguiente muestra lo completo que es Azure Monitor.

  • A la izquierda aparece una lista de los orígenes de los datos de métricas y registros, que pueden recopilarse en cada nivel de la arquitectura de aplicaciones, desde la aplicación hasta el sistema operativo y la red.
  • En el centro, puede ver cómo se almacenan los datos de registro y métricas en los repositorios centrales.
  • A la derecha, los datos se usan de diversas formas. Puede ver el rendimiento histórico y en tiempo real de cada nivel de la arquitectura, o bien consultar información combinada y detallada. Los datos se muestran en diferentes niveles para distintas audiencias. Puede ver informes de alto nivel en el panel de Azure Monitor o crear vistas personalizadas mediante consultas de Power BI y Kusto.

Además, puede usar los datos para ayudarle a reaccionar ante eventos críticos en tiempo real gracias a las alertas enviadas a los equipos por SMS, correo electrónico, etc. También hay la opción de usar umbrales que, en caso de aumento o disminución de la demanda, desencadenen la funcionalidad de escalado automático.

Algunos productos populares, como Azure Application Insights, un servicio que envía información de telemetría desde el código fuente de la aplicación a Azure, usan Azure Monitor en segundo plano. Con Application Insights, los desarrolladores de aplicaciones pueden aprovechar la eficaz plataforma de análisis de datos de Azure Monitor para proporcionar información detallada sobre las operaciones de una aplicación y diagnosticar errores sin tener que esperar a que un usuario informe de ellos.

Azure Service Health

Azure Service Health proporciona una vista personalizada del estado de los servicios, regiones y recursos de Azure en los que se basa su infraestructura. El sitio web status.azure.com, que muestra solo los principales problemas que afectan de manera generalizada a los clientes de Azure, no refleja el panorama completo. Sin embargo, Azure Service Health muestra los problemas detectados de mayor y menor importancia que le afectan. Los problemas del servicio son poco frecuentes, pero es importante estar preparado para lo inesperado. Por ello, puede configurar alertas que le ayuden a evaluar las interrupciones y el mantenimiento planeado. Después de una interrupción, Service Health proporciona informes de incidentes oficiales, llamados análisis de la causa principal (RCA), que puede compartir con las partes interesadas.

Service Health le ayuda a supervisar varios tipos de eventos:

  • Los problemas de servicio son problemas de Azure, como las interrupciones, que le afectan en este momento. Puede profundizar en los servicios y las regiones afectados, así como en las actualizaciones de los equipos de ingeniería, a fin de encontrar la manera de compartir la información más reciente y realizar un seguimiento de esta.
  • Mantenimiento planeado: este tipo de eventos pueden afectar a la disponibilidad. Puede profundizar en los servicios, las regiones y los detalles afectados para mostrar cómo influirá un evento y qué debe hacer. La mayoría de estos eventos se producen sin que tengan ningún impacto en el usuario y no se mostrarán aquí. En el caso excepcional de que se requiera un reinicio, Service Health le permitirá elegir cuándo realizar el mantenimiento para minimizar el tiempo de inactividad.
  • Avisos de estado: son problemas que exigen actuar para evitar la interrupción del servicio, e incluyen retiradas del servicio y cambios importantes. Los avisos de estado se anuncian con mucha antelación para que pueda planear su respuesta.

Unidad 3: Análisis de los criterios de decisión

En esta unidad, analizará los criterios que emplean los expertos para elegir un servicio de supervisión de Azure para una determinada necesidad empresarial. Comprender estos criterios puede ayudar a evaluar mejor las diferencias entre los productos.

¿Necesita analizar cómo usa Azure para reducir los costos, mejorar la resistencia o reforzar la seguridad?

Elija Azure Advisor si quiere realizar un análisis de los recursos implementados. Azure Advisor analiza la configuración y el uso de los recursos, y ofrece sugerencias sobre cómo optimizar la confiabilidad, la seguridad, el rendimiento, los costos y las operaciones según los procedimientos recomendados por los expertos.

¿Quiere supervisar los servicios de Azure o el uso de Azure?

Si quiere mantener un control de Azure, especialmente de los servicios y regiones de los que dependa, debe elegir Azure Service Health. Puede ver el estado actual de los servicios de Azure de los que depende, las próximas interrupciones planeadas y los próximos servicios que se lanzarán. Puede configurar alertas que le permitan estar al día de incidentes y tiempos de inactividad futuros sin tener que visitar el panel con regularidad.

No obstante, si quiere hacer un seguimiento del rendimiento o de los problemas relacionados con la máquina virtual o las instancias de contenedor, las bases de datos, las aplicaciones, etc., le conviene visitar Azure Monitor y crear informes y notificaciones que le ayuden a comprender el rendimiento de los servicios o a diagnosticar problemas relacionados con su uso de Azure.

¿Quiere medir eventos personalizados junto con otras métricas de uso?

Elija Azure Monitor si quiere medir eventos personalizados y otros datos de telemetría recopilados. Los eventos personalizados, como los agregados al código fuente de las aplicaciones de software, pueden ayudar a identificar y diagnosticar la razón por la que la aplicación se comporta de una manera determinada.

¿Necesita configurar alertas para las interrupciones o para cuando el escalado automático está a punto de implementar nuevas instancias?

De nuevo, use Azure Monitor para configurar alertas de eventos clave relacionados con sus recursos específicos.

Unidad 4: Uso de Azure Advisor

En Tailwind Traders quieren optimizar su gasto en la nube. Además, la organización está preocupada por las vulneraciones de seguridad, ya que la información de sus clientes y los datos del historial de compras están almacenados en bases de datos en la nube. A medida que aumentan los conocimientos de la organización sobre la nube, quiere comprender mejor el uso que hace de ella, conocer los procedimientos recomendados e identificar soluciones fáciles que permitan ajustar el gasto en la nube y reforzar sus prácticas de seguridad.

¿Qué servicio debe elegir?

La primera pregunta que debemos hacernos en este escenario es: ¿Tailwind Traders necesita analizar su uso de Azure en aras de la optimización? Sí. En Tailwind Traders creen que gastan demasiado y están preocupados por sus prácticas de seguridad. Por tanto, les gustaría analizar su uso de la nube cotejándolo con los procedimientos recomendados del sector. Por lo tanto, Azure Advisor es la opción perfecta para este escenario.

Aunque ya hayamos encontrado el producto adecuado, vamos a seguir analizando los criterios de decisión para este escenario.

La segunda pregunta que debemos hacernos es: ¿Tailwind Traders quiere supervisar el estado de los servicios de Azure que afectan a todos los clientes o a los recursos implementados en Azure? En este escenario, las operaciones no son importantes. No obstante, Azure Advisor analiza y proporciona recomendaciones para lograr la excelencia operativa.

La tercera pregunta es: ¿Tailwind Traders quiere medir los eventos personalizados junto con otras métricas de uso? La respuesta es no; la medición de eventos personalizados no se menciona como requisito y no se considera en este escenario.

Y la cuarta pregunta: ¿Tailwind Traders quiere configurar alertas para cuando se produzca una interrupción o el escalado automático esté a punto de implementar nuevas instancias? De nuevo, las operaciones no son importantes en este escenario. No obstante, Azure Advisor analiza y proporciona recomendaciones para lograr la excelencia operativa.

Azure Advisor es la opción de producto adecuada para ayudar a Tailwind Traders a optimizar y entender mejor su gasto y su postura de seguridad en la nube. Además, puede resultarles útil en otras áreas del uso que hacen de la nube.

Unidad 5: Uso de Azure Monitor

El sitio web de comercio electrónico de Tailwind Traders está experimentando errores intermitentes, y el equipo desconoce el motivo. Dada la naturaleza de los errores, el equipo sospecha que se trata de un problema de la base de datos o del almacenamiento en caché. ¿Cuáles son las circunstancias que rodean los errores? ¿Solo sucede durante las horas máximo tráfico? ¿Cuál es el estado de la instancia de Azure SQL del equipo? ¿Cuál es el estado de su servidor de almacenamiento en caché de Redis? ¿Cómo puede hacer un seguimiento de los problemas hasta su causa principal?

¿Qué servicio debe elegir?

La primera pregunta que debemos hacernos en este escenario es: ¿Tailwind Traders necesita analizar su uso de Azure en aras de la optimización? No, la optimización no es el objetivo del equipo en este escenario, por lo que Azure Advisor no es un candidato adecuado.

La segunda pregunta que debemos hacernos en este escenario es: ¿Tailwind Traders quiere supervisar el estado de los servicios de Azure que afectan a todos los clientes o a los recursos implementados en Azure? Dado que este problema se produce de forma intermitente, es poco probable que afecte a todo un servicio o a toda una región de Azure. Es más probable que haya un problema de lógica en alguna parte del código del sitio web de comercio electrónico u otro problema que provoque errores en la base de datos o bloqueos de almacenamiento en caché. En este escenario, el equipo podría usar Azure Monitor para identificar una sesión de usuario específica y examinar el rendimiento de cada servicio implicado en el problema.

La tercera pregunta es: ¿Tailwind Traders quiere medir los eventos personalizados junto con otras métricas de uso? Sí. Los desarrolladores de software pueden enviar información adicional sobre el estado de la aplicación web mediante Application Insights para ayudar a localizar la causa principal del problema. Application Insights se basa en la plataforma de Azure Monitor para almacenar información de eventos personalizados.

Y la cuarta pregunta: ¿Tailwind Traders quiere configurar alertas para cuando se produzca una interrupción o el escalado automático esté a punto de implementar nuevas instancias? No, las alertas no son su objetivo en este escenario.

Azure Monitor es la mejor opción para que Tailwind Traders realice un seguimiento de este problema intermitente. El equipo puede usar una gran cantidad de herramientas para obtener información detallada sobre el rendimiento de la aplicación en un nivel alto y profundizar en los problemas específicos.

Unidad 6: Uso de Azure Service Health

Tailwind Traders quiere que su entorno en la nube sea operativo. En concreto, su equipo de operaciones de la nube quiere que las partes interesadas conozcan de antemano cuándo se producirá el próximo tiempo de inactividad planeado. El equipo también quiere que sus arquitectos de soluciones estén al tanto de cuáles son los servicios que Microsoft planea retirar, de manera que puedan rediseñar sus productos de software en consecuencia.

Cuando se producen interrupciones, el equipo quiere averiguar rápidamente si el problema es específico de sus servicios o si se trata de una interrupción del servicio que afecta a muchos clientes de Azure. También quiere que las principales partes interesadas reciban informes en los que se explique cómo y por qué se ha producido el incidente, entre otra información.

¿Qué servicio debe elegir?

La primera pregunta que debemos hacernos en este escenario es: ¿Tailwind Traders necesita analizar su uso de Azure en aras de la optimización? No, Azure Advisor no es un candidato para este escenario.

La segunda pregunta que debemos hacernos es: ¿Tailwind Traders quiere supervisar el estado de los servicios de Azure que afectan a todos los clientes o a los recursos implementados en Azure? En este escenario, el requisito es estar al tanto de cuándo se producirá el próximo tiempo de inactividad planeado. Además, el equipo desea capturar informes de incidentes oficiales. Por esta razón, Azure Service Health es la opción más sólida para este escenario.

Aunque es probable que se elija Azure Service Health, vamos a seguir evaluando los criterios de decisión restantes.

La tercera pregunta es: ¿Tailwind Traders quiere medir los eventos personalizados junto con otras métricas de uso? La respuesta es no; la medición de eventos personalizados no se menciona como requisito y no se considera en este escenario.

Y la cuarta pregunta: ¿Tailwind Traders quiere configurar alertas para cuando se produzca una interrupción o el escalado automático esté a punto de implementar nuevas instancias? La configuración de alertas para interrupciones es un requisito en este escenario, pero la creación de alertas para otros eventos, como el escalado automático, no está dentro de los objetivos. Use Azure Service Health para configurar alertas específicas para interrupciones de Azure que afecten a todos los clientes de Azure. Use Azure Monitor para configurar alertas para interrupciones y otros eventos que solo afectan a sus recursos específicos.

En este escenario, Azure Service Health es la elección correcta.

Video 3.6.1: Servicios para monitoreo y mitigación de interrupciones

  • En Azure es posible llevar una supervisión de los servicios con 3 servicios

Azure Advisor

  • básicamente evalua los recursos y hacer recomendaciones de confiabilidad, seguridad y rendimiento de los servicios para optimizar el servicio y reducir costos
  • Esta diseñado para ayudarlo a reducir tiempos de configuración de la nube
  • El servicio primero analiza los recursos y te da recomendaciones que puede o no adoptar, luego conforme se continua utilizan los servicios y se recolecte mayor información le puede hacer nuevas recomendaciones
  • Se basa en 5 recomendaciones Costo / Seguridad / Confiabilidad / Excelencia operativa / Rendimiento
  • Tiene una sección donde puede configurar cuales recursos puede supervisar

Azure Monitor

  • Es plataforma que permite recuperar , analizar y mostrar datos y tomar acciones con base en esa información esto para entorno Azure como locales
  • Permite dar un seguimiento a los recursos a través de gráficos, noticias, últimas actualizaciones y tutoriales
  • Así como un registros de todas las actividades realizadas dentro del portal
  • Permite definir alertas para comportamientos anormales de recursos o sobrepasar las métricas establecidas para él
  • Y análisis de log’s

Azure Service Health

  • Supervisa la salud de los recursos y servicios que han sidos desplegados en Azure
  • Permite tener un panorama completo sobre los recursos
  • Así como de los problemas que han sido detectados con su grado de importancia basados en colores y agrupados por recursos
  • Estos problemas son pocos frecuentes pero debemos estar preparados por si suceden
  • Por esto es importante configurar alertas que no notifiquen sobre interrupciones planeadas por regiones o suscripciones