Problema

Los usuarios de PCs de gaming con Windows 11 reportan que, al ejecutar títulos exigentes, la pantalla se vuelve negra y el equipo se reinicia sin mostrar un BSOD visible. Los registros de Windows indican un Machine Check Exception (MCE) y, con mayor detalle, un Core 4: Cache Hierarchy Error. El síntoma típico es: sonido de reinicio, pantalla negra, y ausencia de información de diagnóstico en pantalla. Este patrón no está limitado a un juego concreto; suele aparecer bajo carga sostenida de GPU y CPU, y puede confundirse con un fallo exclusivo del controlador gráfico.

Causa

Un MCE es una señal de que el procesador detectó un error de hardware que no pudo corregir. En sistemas modernos con CPUs Ryzen y GPUs AMD, los motivos más frecuentes son:

  1. Desbordamiento de energía – una fuente de alimentación (PSU) insuficiente o degradada no entrega la corriente requerida durante picos de carga, provocando caídas de voltaje que disparan el MCE.
  2. Temperaturas extremas – sobrecalentamiento del CPU (caché L3) o de la GPU genera errores de caché y time‑outs del driver.
  3. Controlador de GPU inestable – versiones recientes pueden introducir regressiones; el driver puede colapsar y, al no responder, el watchdog de Windows reinicia el sistema.
  4. Memoria RAM defectuosa – errores de ECC o de paridad pueden propagarse a la caché del procesador y activar el MCE.
  5. BIOS/UEFI desactualizado – microcódigo del CPU y configuraciones de power management pueden ser incompatibles con versiones de Windows 11 o con la GPU de última generación.
  6. Problemas de señal PCIe – contactos sucios o ranuras dañadas generan errores de transmisión que el controlador interpreta como fallos críticos.

En la práctica, varios de estos factores coexisten: una PSU de 600 W puede estar al límite con una RX 7600 y un Ryzen 5 5600 bajo carga, mientras que un driver 26.6.1 introduce un bug que solo se manifiesta cuando la caché del núcleo está bajo estrés térmico.

Solución

Abordar el problema requiere un proceso iterativo de aislamiento. A continuación, una ruta que funciona en la mayoría de los setups similares:

1. Verificar la fuente de alimentación

  • Confirma que la PSU entrega al menos 80 PLUS Bronze y que su potencia nominal supera en un 20 % la suma de los TDP de CPU + GPU + periféricos.
  • Usa un multímetro o un tester de PSU para medir los rails (+12 V, +5 V, +3.3 V) bajo carga (por ejemplo, con OCCT o AIDA64). Busca caídas mayores a 5 % del valor nominal.

2. Actualizar BIOS/UEFI

  • Descarga la última versión del fabricante de la placa base.
  • Aplica la actualización siguiendo el manual; habilita CPU Microcode Update y PCIe ASPM en modo Auto.
  • Restablece la configuración a valores predeterminados y, si es necesario, ajusta manualmente el XMP de la RAM.

3. Gestionar los controladores de GPU

  • Desinstala completamente los drivers con DDU en modo Safe Mode.
  • Instala la versión estable anterior que no cause el MCE (por ejemplo, 25.9.1) o la última versión WHQL disponible.
  • Desactiva Radeon Software overlay y cualquier herramienta de overclocking.

4. Test de estrés de CPU y GPU

  • Ejecuta Prime95 (Blend test) para CPU y FurMark para GPU, cada uno durante 15 min. Monitorea temperaturas con HWMonitor.
  • Si el MCE ocurre durante el test de CPU, el problema está probablemente en el procesador, la RAM o la PSU.
  • Si ocurre solo bajo carga GPU, revisa la alimentación PCIe y los conectores de alimentación de la tarjeta.

5. Memoria RAM

  • Ejecuta MemTest86 desde un USB arrancable durante al menos 4 pasadas.
  • Si aparecen errores, reemplaza los módulos o prueba en modo single‑channel.

6. Configuración de energía de Windows

  • Abre Power OptionsHigh performance.
  • Desactiva PCI Express → Link State Power Management y Processor power management → Minimum processor state (establece en 100 % para pruebas).
  • Ejecuta powercfg /energy para generar un informe y corrige los avisos críticos.

7. Revisión física

  • Retira y vuelve a colocar la GPU, la RAM y los cables de alimentación.
  • Limpia los contactos con alcohol isopropílico y verifica que no haya polvo bloqueando los disipadores.

8. Registro de eventos y WHEA

  • En Event Viewer busca eventos con ID 41 (Kernel‑Power) y 18 (WHEA‑UNCORRECTABLE_ERROR).
  • Exporta los logs y busca patrones de tiempo; si los eventos aparecen justo antes del reinicio, confirma la causa de hardware.

Cuándo aplicar esta solución

  • Síntomas: pantalla negra, reinicio inmediato, ausencia de BSOD, eventos MCE en el visor, ocurre bajo carga gráfica o de CPU.
  • Aplicable: cualquier PC con Windows 11 que use CPU Ryzen y GPU AMD o Nvidia, especialmente después de una actualización de hardware o de drivers.
  • No aplica: si el sistema muestra un BSOD con código STOP (por ejemplo, DRIVER_IRQL_NOT_LESS_OR_EQUAL) o si el problema ocurre exclusivamente al iniciar Windows sin carga de aplicación.

Código

# Generar informe de energía (útil para detectar caídas de voltaje)
powercfg /energy /output "%USERPROFILE%\Desktop\energy_report.html"
# Exportar eventos WHEA a CSV para análisis rápido
wevtutil qe Microsoft-Windows-WHEA-Logger/Operational /f:CSV > "%USERPROFILE%\Desktop\whea_log.csv"

Verificación

  1. Prueba de estabilidad: después de aplicar los pasos, ejecuta un ciclo de juego de al menos 2 horas o un benchmark como 3DMark mientras monitoreas temperaturas y consumo de energía.
  2. Revisión de logs: abre el informe de energía y confirma que no aparecen Critical warnings. Verifica que el Event Viewer ya no registre eventos 41 o 18.
  3. Reinicio controlado: fuerza un reinicio con shutdown /r /t 0 y observa que el sistema arranca sin retrasos ni pantallas negras.

Notas adicionales

  • En setups con overclock, vuelve a los valores de fábrica antes de descartar hardware; el CPU cache error suele aparecer cuando la frecuencia de la caché L3 supera los límites seguros.
  • Algunas PSU baratas pueden pasar la prueba de carga en bench pero fallar bajo picos rápidos de demanda; considera una prueba con carga real (juego) antes de descartar la fuente.
  • Si el problema persiste después de validar PSU, CPU y RAM, la GPU puede estar defectuosa aunque los drivers no muestren fallos; prueba la tarjeta en otro equipo para confirmar.
  • Mantén siempre una copia de los controladores anteriores; la reversión rápida con DDU ahorra tiempo cuando una actualización introduce regresiones.