СоХабр закрыт.

С 13.05.2019 изменения постов больше не отслеживаются, и новые посты не сохраняются.

| сохранено

H Моя история выбора системы мониторинга в черновиках Из песочницы

Сисадмины делятся на две категории — те, кто уже используют мониторинг, и те, кто ещё нет.
Шутка юмора.


К необходимости мониторинга приходят разными путями. Одним повезло и мониторинг пришёл из материнской компании. Тут все просто, за вас уже обо всем подумали — чем, что и как мониторить. И даже наверняка уже написали необходимые мануалы и объяснения. Другие приходят к этой необходимости сами и инициатива исходит, как правило, из ИТ-отдела. Минус в том, что собирать все шишки и проходить грабли придётся на собственном опыте. Плюсы тоже имеются — можно выбрать любую систему мониторинга и мониторить только необходимое, равно как и придумать свои принципы реагирования на проблемы. Я в разное время работал в разных компаниях, однако там, где я был близок к мониторингу, я шёл вторым путём.

Краткий экскурс в прошлое


Первый «опыт» был в далеком прошлом. Это был один из местных провайдеров, где я внезапно был кладовщиком. Управляемое оборудование тогда было дОрого и поэтому кражи и обрывы отслеживали с помощью Friendly Pinger пингуя нескольких клиентов, которые были постоянно или почти постоянно в сети. Работало так себе, но лучшего не было.

Потом у другого местного провайдера админы использовали Nagios. По большому счету, доступа у меня туда не было, поэтому оценить его возможности я был не в состоянии. Однако, управляемое оборудование использовалось на каждой из точек и, вероятно, мониторинг был эффективным инструментом.

Потом я попал в компанию, которая является магистральным провайдером и качестве дочерней службы предлагала домашний интернет. Здесь использовался Zenoss во всей его красе. Я в него глубоко не забирался, однако смог ощутить всю его мощь и пользу — одна только магия regexp’о-в чего стОит… Собирали, настраивали систему и писали регламенты вдумчивые профессионалы своего дела.

И вот на очередном месте работы я пришёл к потребности узнавать о проблемах раньше, чем об этом наябедничает какой-нибудь главбух. Учитывая, что время на творческие эксперименты было, я пошёл смотреть, что нам предлагает народная промышленность.

Муки выбора


На самом деле, выбор оказался неожиданно простым. Разумеется, на вкус и цвет все фломастеры разные, поэтому мои критерии и взгляды, актуальные на тот момент могут оказаться неподходящими для вас. Мне вспомнились несколько систем и я вкратце опишу свои мысли по отношению к ним.

Мне, как Windows-админу, в первую очередь пришёл в голову System Center во всей своей красе. Первым и главным плюсом является его интегрированность в окружение Microsft, причём без камлания с бубном, а Native. Второй плюс — комплексный подход. Будем честны, System Center ни разу не есть чисто система мониторинга — это все же система обслуживания инфраструктуры. Однако это и первый минус. Разворачивать этого монстра только ради мониторинга никакого смысла не имеет. Вот если бы нужны были разного рода бэкапы и развёртывание миллиона VDS… Да и стоимость внедрения не радует, потому что разориться придётся дважды — сперва на лицензиях, а потом на серверах, где оно будет жить.

Далее, обратимся к прошлому в лице Nagios. Система отпала сразу, поскольку конфигурирование системы руками через файлы конфигурации делает систему необслуживаемой. Я не осуждаю людей, которым нравится листать полторы тыщи однотипных строк, чтобы поправить единственный параметр, но и сам так делать не хочу.

Zenoss. Отличная система! Все есть, все может, настраивается с приемлемым уровнем сложности, но тяжеловата. Не те масштабы у нас были, какие-нибудь вложенные группы мы не использовали никогда. Да и сам движок оказался чересчур требовательным к ресурсам. Ради чего? Отказались.

Zabbix — наш выбор. Привлекли достаточно низкие системные требования и простота запуска. Фактически, на запуск ушло несколько минут. Скачать образ для VMWare и нажать кнопку «включить виртуалку». Все! Я больше вам скажу, для наших нужд вполне бы хватило этого «стартового образа», хоть мы вскоре и развернули все, как надо.

В первоначальном списке был ещё Cacti, но до него дело просто не дошло. Ну какой смысл, если Zabbix взлетел с первого пинка и всем сразу понравился? Поэтому ничего про Cacti сказать не могу.

После написанного


Компания, в которой я внедрял Zabbix благополучно умерла своей смертью. Собственник сказал «мне все надоело, я закрываю бизнес», поэтому особенно про мониторинг там рассказывать нечего. Смотрели за серверами, за интернетом и туннелями на всех площадках и собирали счетчики с принтеров.

Потом в моей жизни недолго был PRTG. На мой вкус, прекрасно работает с Windows-системами, использует любопытный механизм работы агентов и стоит неприличных денег. Это при достаточно грустной идеологии доступа к обновлениям версий.

Компания, в которой я сейчас работаю, использует Zabbix. Это был не мой выбор, но я ему рад и поддерживаю целиком и полностью. Учитывая состояние системы мониторинга до моего прихода, я почти воссоздал все заново. Понимание того, что «мы что-то делаем не так» было. И даже был развернут новый сервер с Zabbix’ом, но не было человека, который бы взялся за эту задачу и довёл до конца. Полного просветления в мониторинге мы ещё не достигли, но хочется верить, что направление мы знаем. Процесс доведения мониторинга до идеала бесконечен, хотя основные тезисы я для себя уже сформулировал.
–7
~1900

комментарии (9)

0
naim ,  
советую посмотреть на netXMS или на крайняк на LibreNMS
+3
+4 –1
tchspprt ,  
Ощущение — как будто на Пикабу попал, а не на Хабр.
–1
paranoya_prod ,  
Интересно, почему не рассматривают RMM-системы? Такие как Comodo One RMM ныне iTarian или Panda RMM. Почему все сразу Забиксы и Нагиосы ставят?
0
Dr_Wut ,  
Потому что это первое, о чем говорит гугл ;)
0
PythonKaa ,  
На самом деле это почти так и есть. Zabbix, как уже говорилось, хорош для быстрого старта и может мониторить все, для чего можно написать скрипт.
+4
Dr_Wut ,  
Прочитал и так и не понял — а о чем статья? Особенно странно что в ней лайкают…
+2
Snow_Bars ,  

Я так и не понял, по каким критериям систему-то выбирать надо? Что выбирать надо — это понятно, но как и почему? Одно из трех?
И автор, вы прежде чем публиковать, в тот же Ворд текст скопировали, опечатки убрали…

+1
r_j ,  
Custer Center

Может имелось ввиду MS SCOM?

Не сочтите за грубость, но… Как думаете, какую пользу ИТ-сообществу принесет ваша статья про некро-мониторинги, когда уже все пишут в основном про Prometheus, Graphite, InfluxDB, в крайнем случае — Zabbix? Ладно бы, если это пятничный пост про былую молодость, тогда хотя бы года указывали, а то даже не понятно — может вы и сейчас в сторону Cacti еще смотрите.

Процесс доведения мониторинга до идеала бесконечен, хотя основные тезисы я для себя уже сформулировал.

Поведуйте!
0
PythonKaa ,  
Действительно, имелся ввиду MS SCOM, опечатался, исправил.

Текст описывает события 4-летней давности в части непосредственно выбора. Будут вам мои тезисы, но чуток попозже