![](https://webcf.waybackmachine.org/web/20231203004829im_/https://habrastorage.org/r/w1560/getpro/habr/upload_files/bf2/372/af0/bf2372af0a722bab61a741a0f562e409.png)
В современных серверах устанавливается очень большой объем памяти. Иногда модули памяти ломаются и при ошибке сервер перезагружается. Если повезет, то умный системный контроллер подсветит неисправный модуль памяти, но может и не подсветить, тогда нужно искать, переустанавливая модули. Ситуация с перезагрузками сервера повторяется редко, но каждый раз это очень больно для бизнес-критичных приложений.
Для диагностики модулей есть хорошая программа memtest86+, но если памяти у нас 1ТБ, то полное тестирование растягивается на несколько дней, а бизнес не может так долго ждать.
Как же быть? В этой публикации я поделюсь опытом тестирования памяти сервера Gigabyte R292-4S0 с СУБД на Enteprice Linux 8 (EL8) и 1 ТБ памяти двумя методами:
С EFI загрузкой memtest86+ v7;
С автоматизированным созданием сотни libvirt-KVM виртуальных машин с memtest86+ внутри.
Запуск memtest внутри виртуальной машины... "Фу...", - скажут некоторые. И будут неправы. Почему?