+1
Отвечен

БЕДА: Постоянный ребут сервера!

Archy_k 4 года назад обновлен mikbill (CEO) 4 года назад 6

Есть 2 сервака: 1 биллинг + 1 НАС (на FreeBSD)

Биллинговый сервак перезагружается по 10 раз в день!

Куда посмотреть - не знаю, но глянул в первую очередь, кто заходил (команда last)

И вижу вот что:


art pts/0 188.163.1.236 Sun Apr 10 21:58 still logged in

art pts/0 188.163.1.236 Sun Apr 10 21:37 - 21:38 (00:00)

reboot system boot 3.2.0-4-amd64 Sun Apr 10 19:14 - 22:12 (02:57)
reboot system boot 3.2.0-4-amd64 Sun Apr 10 11:28 - 22:12 (10:43)
reboot system boot 3.2.0-4-amd64 Sun Apr 10 10:31 - 22:12 (11:40)
reboot system boot 3.2.0-4-amd64 Sun Apr 10 10:26 - 22:12 (11:45)
reboot system boot 3.2.0-4-amd64 Sun Apr 10 10:14 - 22:12 (11:57)
reboot system boot 3.2.0-4-amd64 Sun Apr 10 09:44 - 22:12 (12:27)
reboot system boot 3.2.0-4-amd64 Sat Apr 9 14:09 - 22:12 (1+08:02)

art pts/0 188.163.1.236 Sat Apr 9 10:03 - 10:03 (00:00)

art pts/0 188.163.1.236 Fri Apr 8 00:38 - 00:38 (00:00)
art pts/0 188.163.1.236 Thu Apr 7 15:12 - 15:15 (00:03)
art pts/0 188.163.1.236 Thu Apr 7 13:16 - 13:17 (00:00)
art pts/0 188.163.1.236 Wed Apr 6 22:23 - 22:36 (00:13)
art pts/1 188.163.1.236 Wed Apr 6 20:52 - 20:55 (00:02)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 20:52 - 22:12 (4+01:19)
art pts/0 188.163.1.236 Wed Apr 6 20:46 - down (00:04)
art pts/0 188.163.1.236 Wed Apr 6 20:34 - 20:36 (00:02)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 22:58 - 20:50 (-2:-8)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 22:10 - 20:50 (-1:-19)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 21:58 - 20:50 (-1:-7)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 21:09 - 20:50 (00:-18)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 21:05 - 20:50 (00:-14)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 20:59 - 20:50 (00:-8)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 20:50 - 20:50 (00:00)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 19:23 - 20:50 (01:27)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 15:11 - 20:50 (05:39)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 07:36 - 20:50 (13:13)
reboot system boot 3.2.0-4-amd64 Wed Apr 6 00:19 - 20:50 (20:30)
reboot system boot 3.2.0-4-amd64 Tue Apr 5 22:01 - 20:50 (22:48)
reboot system boot 3.2.0-4-amd64 Mon Apr 4 21:11 - 20:50 (1+23:39)
reboot system boot 3.2.0-4-amd64 Sun Apr 3 15:18 - 20:50 (3+05:31)
reboot system boot 3.2.0-4-amd64 Sun Apr 3 13:36 - 20:50 (3+07:13)
reboot system boot 3.2.0-4-amd64 Sun Apr 3 12:51 - 20:50 (3+07:59)
art tty1 Sat Apr 2 14:31 - 14:32 (00:01)
art tty1 Sat Apr 2 14:27 - 14:27 (00:00)
reboot system boot 3.2.0-4-amd64 Sat Apr 2 17:27 - 20:50 (4+03:22)
reboot system boot 3.2.0-4-amd64 Sat Apr 2 14:49 - 20:50 (4+06:01)
reboot system boot 3.2.0-4-amd64 Fri Apr 1 22:35 - 20:50 (4+22:15)


wtmp begins Fri Apr 1 22:35:12 2016


Как видно из этого, сервер иногда вздумывает перезагружаться по много раз, и при этом некий "reboot" - (не пойму, это пользователь что ли?) якобы заходити делает перезагрузку, но нет никакого пользователя "ребут" в /etc/passwd

Кто знает, что это за фигня? Подскажите пожалуйста!

Не ошибка

Похоже на аппаратную проблему.

думаю стоит проверить не высохла ли термопаста/сгорел кулер...


Термопаста новая, свеженькая... кулеры в норме.

попробуйте проверить память мемтестом, поищите в /var/log/messages и выводе команды dmesg строки типа error или critical, у вас билилнг на центосе? ОС сама по себе стабильная из коробки, проверенно, больше года аптаймы видел))

Железо это либо дрова, вариантов других тут нет и не может быть.

ядро поменяйте, в биосе выключите "всякое" подозрительное или не нужное.

В линксах хватает "приколов" где опция биоса решает вопросы...это если отбросить версию что железо 100500 без сбоев.

Сервис поддержки клиентов работает на платформе UserEcho