Project tardigrade protege sus vms contra fallas de host

Tabla de contenido:

Video: Evita que intrusos dañen tus clases y reuniones en ZOOM 2024

Video: Evita que intrusos dañen tus clases y reuniones en ZOOM 2024
Anonim

Después de múltiples cambios de Azure y mejoras de seguridad en los últimos meses, Microsoft presenta Project Tardigrade como su último intento de hacer que Azure sea más confiable.

Project Tardigrade previene fallas en la plataforma

Project Tardigrade es un nuevo servicio que tiene como objetivo mejorar la resistencia de Azure. Incluye estrategias de mitigación que protegen las máquinas virtuales de Azure contra fallas de la plataforma.

Así es como Mark Russinovich, Director de Tecnología de Microsoft Azure, describe el trabajo actual en Azure:

Nuestro objetivo es capacitar a las organizaciones para ejecutar sus cargas de trabajo de manera confiable en Azure. Con esto como nuestro principio rector, estamos continuamente invirtiendo en la evolución de la plataforma Azure para que sea resistente a fallas, no solo para aumentar la productividad del negocio sino también para proporcionar una experiencia de cliente perfecta.

Para evitar el impacto en sus cargas de trabajo, el servicio permite que los componentes se auto curan y se recuperen rápidamente de posibles fallas, incluso en fallas críticas del host.

¿Cómo funciona el Proyecto Tardigrade?

Aquí hay un ejemplo de cómo funciona el flujo de trabajo de recuperación de Tardigrade:

  • Fase 1: este paso no tiene ningún impacto para ejecutar máquinas virtuales de clientes. Simplemente recicla todos los servicios que se ejecutan en el host. En el raro caso de que el servicio defectuoso no se reinicie correctamente, procedemos a la Fase 2.
  • Fase 2: nuestro servicio de diagnóstico se ejecuta en el host para recopilar todos los registros / volcados relevantes de forma sistemática, para garantizar que podamos diagnosticar a fondo el motivo del fallo en la Fase 1. Este análisis exhaustivo nos permite 'causar la causa' del problema y, por lo tanto, evitar que vuelvan a ocurrir en el futuro.
  • Fase 3: a un alto nivel, restablecemos el sistema operativo en un estado saludable con un impacto mínimo en el cliente para mitigar el problema del host. Durante esta fase, preservamos los estados de cada VM a RAM, después de lo cual comenzamos a restablecer el sistema operativo en un estado saludable. Si bien el sistema operativo se restablece rápidamente debajo, las aplicaciones en todas las máquinas virtuales alojadas en el servidor se "congelan" brevemente a medida que la CPU se suspende temporalmente. Esta experiencia es similar a una conexión de red perdida temporalmente pero que se reanuda rápidamente debido a la lógica de reintento. Después de que el sistema operativo se reinicia correctamente, las máquinas virtuales consumen su estado almacenado y reanudan su actividad normal, evitando así cualquier posible reinicio de la máquina virtual.

Con esto en mente, Project Tardigrade se asegurará de que la falla de cualquier componente en el host no afecte a todo el sistema. Como tal, las máquinas virtuales del cliente no se verán afectadas por fallas del host.

Microsoft está trabajando arduamente para mejorar y expandir los diferentes escenarios de falla del host para asegurarse de que su plataforma de computación en la nube sea más confiable que nunca.

Espere nuevos desarrollos y otras implementaciones de confiabilidad en el futuro cercano.

Project tardigrade protege sus vms contra fallas de host