#5310: Алгоритм действий при крэше системы

Отредактирована: 86 дней назад

Решение

  1. Дождаться его записи, т.к при краше системы происходит запись слепка оперативной памяти, то для корректной записи необходимо дождаться его окончания, затем система перезагрузится самостоятельно. Это нужно для того, чтобы в дальнейшем разработка смогла его открыть и прочитать;
  2. Завести тикет с соответствующей темой и содержанием, ПИН-ом и версией, продублировать информацию о краше выделенному инженеру, либо на телефон премиум поддержки;
  3. Ввести мораторий на изменения и откатить изменения, которые потенциально могли привести к крашу, особенно если краш случился после внесения изменений в конфигурацию или добавления нового функционала;
  4. Совместно с инженером UserGate выполнить расчет хэш-суммы md5 (md5sum <file_name>) для файлов vmcore и dmesg. Выгрузить vmcore, dmesg и kern.log вытащить их можно только через root, например предварительно заархивировав и переместить в папку с логами utm или utm-console. затем выгрузить вместе с остальными логам через веб консоль. Сравнить ранее хэш-суммы файлов vmcore и dmesg после разархивирования только после этого проводить откат на предыдущую версию;
  5. Если краш произошёл после обновления, то выполнить откат на предыдущую версию, но только после выполнения п.4;
  6. Будет заведена задача SUM или RND (NGFW/DCFW);
  7. Ожидать от технической поддержки ОС, при анализе dmesg разработчики смогут назвать потенциальную причину или модуль, который вызвал краш системы.