Сисадмины делятся на две категории — те, кто уже используют мониторинг, и те, кто ещё нет.
Шутка юмора.
К необходимости мониторинга приходят разными путями. Одним повезло и мониторинг пришёл из материнской компании. Тут все просто, за вас уже обо всем подумали — чем, что и как мониторить. И даже наверняка уже написали необходимые мануалы и объяснения. Другие приходят к этой необходимости сами и инициатива исходит, как правило, из ИТ-отдела. Минус в том, что собирать все шишки и проходить грабли придётся на собственном опыте. Плюсы тоже имеются — можно выбрать любую систему мониторинга и мониторить только необходимое, равно как и придумать свои принципы реагирования на проблемы. Я в разное время работал в разных компаниях, однако там, где я был близок к мониторингу, я шёл вторым путём.
Краткий экскурс в прошлое
Первый «опыт» был в далеком прошлом. Это был один из местных провайдеров, где я внезапно был кладовщиком. Управляемое оборудование тогда было дОрого и поэтому кражи и обрывы отслеживали с помощью Friendly Pinger пингуя нескольких клиентов, которые были постоянно или почти постоянно в сети. Работало так себе, но лучшего не было.
Потом у другого местного провайдера админы использовали Nagios. По большому счету, доступа у меня туда не было, поэтому оценить его возможности я был не в состоянии. Однако, управляемое оборудование использовалось на каждой из точек и, вероятно, мониторинг был эффективным инструментом.
Потом я попал в компанию, которая является магистральным провайдером и качестве дочерней службы предлагала домашний интернет. Здесь использовался Zenoss во всей его красе. Я в него глубоко не забирался, однако смог ощутить всю его мощь и пользу — одна только магия regexp’о-в чего стОит… Собирали, настраивали систему и писали регламенты вдумчивые профессионалы своего дела.
И вот на очередном месте работы я пришёл к потребности узнавать о проблемах раньше, чем об этом наябедничает какой-нибудь главбух. Учитывая, что время на творческие эксперименты было, я пошёл смотреть, что нам предлагает народная промышленность.
Муки выбора
На самом деле, выбор оказался неожиданно простым. Разумеется, на вкус и цвет все фломастеры разные, поэтому мои критерии и взгляды, актуальные на тот момент могут оказаться неподходящими для вас. Мне вспомнились несколько систем и я вкратце опишу свои мысли по отношению к ним.
Мне, как Windows-админу, в первую очередь пришёл в голову System Center во всей своей красе. Первым и главным плюсом является его интегрированность в окружение Microsft, причём без камлания с бубном, а Native. Второй плюс — комплексный подход. Будем честны, System Center ни разу не есть чисто система мониторинга — это все же система обслуживания инфраструктуры. Однако это и первый минус. Разворачивать этого монстра только ради мониторинга никакого смысла не имеет. Вот если бы нужны были разного рода бэкапы и развёртывание миллиона VDS… Да и стоимость внедрения не радует, потому что разориться придётся дважды — сперва на лицензиях, а потом на серверах, где оно будет жить.
Далее, обратимся к прошлому в лице Nagios. Система отпала сразу, поскольку конфигурирование системы руками через файлы конфигурации делает систему необслуживаемой. Я не осуждаю людей, которым нравится листать полторы тыщи однотипных строк, чтобы поправить единственный параметр, но и сам так делать не хочу.
Zenoss. Отличная система! Все есть, все может, настраивается с приемлемым уровнем сложности, но тяжеловата. Не те масштабы у нас были, какие-нибудь вложенные группы мы не использовали никогда. Да и сам движок оказался чересчур требовательным к ресурсам. Ради чего? Отказались.
Zabbix — наш выбор. Привлекли достаточно низкие системные требования и простота запуска. Фактически, на запуск ушло несколько минут. Скачать образ для VMWare и нажать кнопку «включить виртуалку». Все! Я больше вам скажу, для наших нужд вполне бы хватило этого «стартового образа», хоть мы вскоре и развернули все, как надо.
В первоначальном списке был ещё Cacti, но до него дело просто не дошло. Ну какой смысл, если Zabbix взлетел с первого пинка и всем сразу понравился? Поэтому ничего про Cacti сказать не могу.
После написанного
Компания, в которой я внедрял Zabbix благополучно умерла своей смертью. Собственник сказал «мне все надоело, я закрываю бизнес», поэтому особенно про мониторинг там рассказывать нечего. Смотрели за серверами, за интернетом и туннелями на всех площадках и собирали счетчики с принтеров.
Потом в моей жизни недолго был PRTG. На мой вкус, прекрасно работает с Windows-системами, использует любопытный механизм работы агентов и стоит неприличных денег. Это при достаточно грустной идеологии доступа к обновлениям версий.
Компания, в которой я сейчас работаю, использует Zabbix. Это был не мой выбор, но я ему рад и поддерживаю целиком и полностью. Учитывая состояние системы мониторинга до моего прихода, я почти воссоздал все заново. Понимание того, что «мы что-то делаем не так» было. И даже был развернут новый сервер с Zabbix’ом, но не было человека, который бы взялся за эту задачу и довёл до конца. Полного просветления в мониторинге мы ещё не достигли, но хочется верить, что направление мы знаем. Процесс доведения мониторинга до идеала бесконечен, хотя основные тезисы я для себя уже сформулировал.
комментарии (9)