Tarea 2

Políticas de Mantenimiento y Recuperación ante Fallos

Resumen sobre las políticas, procedimientos de mantenimiento preventivo y correctivo, y las estrategias de recuperación ante fallos en sistemas operativos Windows Server y Windows 10.

Tipos de Mantenimiento

El mantenimiento de un SO se clasifica según el momento de intervención y su objetivo.

🛡️ Mantenimiento Preventivo

Acciones programadas para evitar fallos antes de que ocurran. Reduce el tiempo de inactividad no planificado.

  • Actualizaciones periódicas del SO
  • Instalación de parches de seguridad
  • Limpieza de archivos temporales
  • Desfragmentación de disco (HDD)
  • Revisión de registros de eventos
  • Respaldos programados
  • Monitoreo proactivo de recursos

🔧 Mantenimiento Correctivo

Intervención para resolver fallos ya ocurridos. Restaura el sistema al estado operativo.

  • Restauración de sistema desde punto de restauración
  • Reparación de archivos del sistema (sfc /scannow)
  • Reinstalación de controladores defectuosos
  • Recuperación desde copia de seguridad
  • Análisis y eliminación de malware
  • Corrección de errores de disco (chkdsk)

🔄 Mantenimiento Predictivo

Anticipa fallos mediante el análisis de tendencias y datos de rendimiento histórico.

  • Análisis de logs de eventos del sistema
  • Monitoreo S.M.A.R.T. del disco duro
  • Alertas automáticas de umbrales
  • Revisión de tendencias de uso de recursos
  • Pruebas periódicas de hardware

Políticas de mantenimiento recomendadas

Actividad Frecuencia Herramienta / Método Aplicable en
Instalación de actualizaciones de seguridad Mensual (Patch Tuesday) Windows Update / WSUS Server 2019, Win 10
Copia de seguridad completa Semanal Windows Server Backup / Veeam Server 2019
Copia de seguridad incremental Diaria Windows Server Backup / robocopy Server 2019, Win 10
Revisión del visor de eventos Semanal Event Viewer (eventvwr.msc) Server 2019, Win 10
Verificación de integridad del disco Mensual chkdsk /f /r Server 2019, Win 10
Escaneo de malware y antivirus Semanal Windows Defender / ESET / Sophos Server 2019, Win 10
Prueba de restauración de backups Trimestral Restauración en entorno de prueba Server 2019
Revisión de espacio en disco Semanal Monitor de rendimiento / PowerShell Server 2019, Win 10
Auditoría de cuentas de usuario Mensual Active Directory / PowerShell Server 2019 (AD DS)
Crear punto de restauración Antes de cambios Protección del sistema (sysdm.cpl) Windows 10

Estrategias de recuperación ante fallos

🔁 Punto de restauración del sistema

Permite revertir el SO a un estado anterior sin afectar archivos personales. Ideal para deshacer cambios de configuración o instalaciones problemáticas.

  • Crear puntos antes de instalar software o drivers
  • Restaurar desde: Configuración → Recuperación → Abrir restauración del sistema
  • También accesible desde modo seguro

💿 Imagen del sistema (System Image)

Copia completa del sistema operativo, configuraciones y datos. Permite restaurar el sistema completo en caso de fallo grave.

  • Panel de control → Copia de seguridad y restauración
  • Guardar en disco externo, NAS o red
  • Restaurar desde el entorno de recuperación de Windows (WRE)

🛠️ Entorno de recuperación de Windows (WRE)

Herramienta de recuperación integrada que arranca cuando el SO no puede iniciarse normalmente.

  • Reparación automática de inicio
  • Símbolo del sistema para comandos de recuperación
  • Restauración del sistema
  • Recuperación desde imagen del sistema
  • Restablecer este PC (conservar o eliminar archivos)

🌐 Active Directory Backup (Server)

En Windows Server con AD DS, es fundamental respaldar el estado del sistema incluyendo la base de datos de Active Directory.

  • Usar Windows Server Backup para respaldo del "System State"
  • Recuperación autorizada vs. no autorizada de AD
  • Restauración del SYSVOL y NTDS.dit
  • Modo de restauración de servicios de directorio (DSRM)

☁️ Alta disponibilidad (Server)

Estrategias para garantizar que los servicios del servidor permanezcan activos ante fallos de hardware o software.

  • Failover Clustering (clúster de conmutación por error)
  • Controladores de dominio adicionales (DC secundario)
  • RAID para tolerancia a fallos de disco
  • UPS para protección ante cortes eléctricos

🔐 Modo seguro

Inicia Windows con controladores y servicios mínimos. Permite diagnosticar y resolver problemas que impiden el arranque normal.

  • Acceder pulsando F8 / Shift+Reiniciar → Opciones avanzadas
  • Modo seguro con funciones de red
  • Modo seguro con símbolo del sistema
  • Útil para eliminar malware o drivers dañados

Plan de recuperación ante desastres (DRP) — Pasos básicos

  1. Identificar activos críticosListar servidores, servicios y datos cuya interrupción causaría mayor impacto en la organización.
  2. Definir RTO y RPORTO (Recovery Time Objective): tiempo máximo tolerable de inactividad. RPO (Recovery Point Objective): pérdida máxima tolerable de datos.
  3. Implementar backups regularesSeguir la regla 3-2-1: 3 copias de datos, en 2 medios diferentes, con 1 copia fuera del sitio (offsite o nube).
  4. Documentar procedimientos de recuperaciónCrear guías paso a paso para restaurar cada sistema o servicio crítico, accesibles sin necesidad del sistema caído.
  5. Probar el plan periódicamenteRealizar simulacros de recuperación al menos una vez por trimestre. Verificar que los backups son funcionales y los tiempos de recuperación son aceptables.
  6. Actualizar el planRevisar y actualizar el DRP después de cada cambio importante en la infraestructura (nuevos servidores, cambios de red, actualizaciones mayores).

✅ Conclusión

Una política de mantenimiento bien estructurada, combinada con estrategias robustas de recuperación, minimiza el tiempo de inactividad y el impacto de los fallos. En entornos con Windows Server, es fundamental contar con al menos un controlador de dominio secundario, backups diarios del "System State" y un plan documentado y probado de recuperación ante desastres.