Есть у меня в парке серверов множество различных рейд-контроллеров, в том числе софтовых(mdadm). У каждого из них имеются различные средства мониторинга, но хотелось бы все это отслеживать централизовано, например через zabbix, а в случае изменения состояния любого из массивов — получать уведомления, например по почте. Данная статья не является пошаговым руководством, а представляет из себя набор заметок на память для различных контроллеров.

В каждом подразделе описана техника получения информации о состоянии массивов zabbix-агентом. В некоторых сервера с мат. Платами intel устанавливали интегрированные контроллеры axx4sasmod.

Zabbix

Управлять и мониторить их можно с помощью RAID Web Console 2(не понятно, почему она называется Web, когда работает не через браузер, а требует установки на клиенте), либо с помощью snmp. Команднострочная утилита CmdTool2 почему-то контроллер не обнаружила. Корректно настроить работу через snmp на Debian мне не удалось, как это сделать на редхат-подобных описано в статье, ссылка на которую дана ниже. Пример создания тригера. Создадим тригер отслеживания состояния массивов на примере mdadm. Создаем шаблон Configuration → Templates → Create template, задаем имя и добавляем в группу Templates: В шаблоне открываем вкладку Items и создаем элемент. Указываем ключ(имя пользовательского параметра в zabbix-агенте) и уменьшаем кол-во дней хранения значений: Дальше переходим во вкладку Triggers и создаем тригер, в поле Expression (Выражение) нажимаем на конпке Add и в появившемся окне в поле Item нажимаем Select, в появившемся окне выбираем группу Templates и только что созданый шаблон, там у нас один единственный элемент(Item), выбираем его.

Zabbix Мониторинг Raid Windows

Есть несколько серверов HP, работают давно, приходиться постоянно заходить в HP Diagnostics и проверять состояние жестких дисков. На серверах установлены zabbix агенты и стандартный шаблон для windows, версия 1,8. Думаю сделать триггер для проверки реид если есть такой миб. Мониторинг LSI MegaRAID в Zabbix. В моем варианте я рассчитываю мониторинг только Adapter #0 т.е. Когда в система только одна плата raid контроллера (опция -a0). MegaRAID SAS 9261-8i sys-block/megacli-8.02.21 net-analyzer/zabbix-2.0.9. Примеры вывода команд megacli. Megacli -LDInfo -LAll -a0 -NoLog. Adapter 0 -- Virtual Drive Information: Virtual Drive: 0 (Target Id: 0) Name: RAID Level: Primary-6, Secondary-0, RAID Level Qualifier-3. Статья про контроль с помощью Zabbix программных RAID-массивов Linux, созданных средствами mdadm. На этот раз кроме установленного и настроенного в системе Zabbix-агента не понадобится более никаких дополнительных пакетов. Первое решение, приходящее на ум - использовать программу mdadm. Но есть решение получше - использовать для этого файл /proc/mdstat.

Raid

В выпадающем меню Function выбираем «Last (most recent) T value is NOT N» и проверяем, что в поле N стоит ноль, таким образом трегер будет проверять, что полученное значение от zabbix-клиента(кол-во отказавших массивов) равняется нолю, если это не так — он сработает. Вот что должно получиться(если все нормально, нажимаем Insert): Ну и в заключении задаем имя тригера и уровень серъезности произшествия, я оценил его как Hight.

Одной из полезнейших возможностей является наблюдение за состоянием оборудования с поддержкой — интеллектуального интерфейса управления платформой, который предназначен для автономного мониторинга состояния компонентов серверных платформ, а также для управления встроенными в них аппаратными и микропрограммными функциями даже в тех случаях, когда система находится в выключенном состоянии. Постановка задачи Необходимо «научить» Zabbix следить за такими параметрами сервера с поддержкой IPMI, как: окружающая температура, температура центральных процессоров, скорость вращения вентиляторов систем охлаждения, напряжение на выходах блока питания, состояние и т.д. (полный список параметров зависит от возможностей используемого ). Данная статья содержит рекомендации по получению списка сенсоров (датчиков), поддерживаемых Вашей платформой, включению IPMI мониторинга узлов сети, а также созданию элементов данных и триггеров, предназначенных для контроля текущего состояния оборудования и оповещения системных администраторов о предстоящем возникновении проблем. Исходные данные Имеется сервер HP ProLiant DL140 G3 с модулем удаленного управления, работающий под управлением операционной системы FreeBSD и, кроме всего прочего, являющийся сервером Zabbix. Для получения информации о поддерживаемых сенсорах и критических значениях измеряемых ими параметров будет использоваться утилита, а для обеспечения поддержки IPMI сервером Zabbix — компоненты пакета. Все программное обеспечение будет устанавливаться из портов, поэтому я рекомендую Вам (я использовал FreeBSD 8.1-STABLE и последние на начало августа 2010 года версии портов для нее).

Получение информации о доступных сенсорах IPMI Перед выполнением действий, которые описаны в данной статье, следует убедиться, что используемая Вами платформа поддерживает функции IPMI. Для этого достаточно загрузить модуль ядра (драйвер) IPMI командой kldload ipmi, а затем посмотреть содержимое журнала системных сообщений командой dmesg grep ipmi. Если используемая платформа поддерживает функции IPMI, будут отображены примерно такие сообщения: ipmi0: port 0xca2-0xca3 on acpi0 ipmi0: KCS mode found at io 0xca2 on acpi ipmi0: IPMI device rev. 1, firmware rev. 2.2, version 2.0 ipmi0: Number of channels 1 ipmi0: Attached watchdog Утилиту ipmitool, являющуюся одним из удобнейших инструментов для работы с IPMI из консоли, необходимо установить из портов: cd /usr/ports/sysutils/ipmitool make install clean Для получения информации о доступных сенсорах можно выполнить команду ipmitool sensor, которая отобразит примерно такую таблицу.

Создание элементов данных для IPMI мониторинга При создании элементов данных, связанных с сенсорами IPMI, следует помнить три момента: во-первых, их Тип должен иметь значение IPMI агент, во-вторых, их параметр IPMI Sensor должен содержать Sensor ID, возвращаемый утилитой ipmitool, в третьих, их параметр Ключ может содержать любой текст без пробелов (во избежание путаницы такой же текст, как IPMI Sensor, только без пробелов). Например, для создания элемента данных Ambient temperature, связанного с сенсором AMB Temp, нужно зайти в раздел Настройка » Узлы сети и перейти по ссылке Элементы данных в столбце Элементы данных. На открывшейся странице ЭЛЕМЕНТЫ ДАННЫХ необходимо нажать кнопку Создать элемент данных, а затем на открывшейся странице НАСТРОЙКА ЭЛЕМЕНТОВ ДАННЫХ следует ввести Описание (произвольное название элемента данных), выбрать в списке Тип значение IPMI агент, ввести в поле IPMI Sensor значение Sensor ID, ввести аналогичный текст (естественно, удалив пробел) в поле Ключ, задать Единицу измерения и Интервал обновления (на мой взгляд, не следует «мерить» значения инертных параметров IPMI чаще, чем раз в 3 минуты). Ваши вопросы совершенно не касаются этой статьи.

Во-первых, все, что описано в статье, работает (это подтвердили, в том числе и Ваши эксперименты). Во-вторых, Вы задаете вопросы по железке, с которой я никогда не сталкивался. В-третьих, я не писал о дискретных датчиках, т.к. Промо код для europcar.

Zabbix Мониторинг Raiders

Большая часть серверного железа умеет самостоятельно реагировать на изменение их состояния. В-четвертых, это бесплатный ресурс, а не оффициальнай саппорт, поэтому пользуйтесь тем, что есть, и спрашивайте о том, что я знаю.

А фразы «таки умным» и «не хотите отвечать» оставьте для других ситуаций. Меня Вы этим не заденете 🙂 P.S.: Повторюсь. Увеличьте loglevel до максимума. Ситуация заметно прояснится. Если, Вы подумали что я Вас пытаюсь задеть, то напрасно! Я же писал ранее, что Вы самый умный человек, разбирающийся в датчиках из всех, кого я встречал, поэтому и написал Вам. Я чётко осознаю то, что Вы мне ничем не обязаны и даже имеете полной право послать.

Zabbix Мониторинг Raiders Of The Lost Ark

Я старательно старался проверить все Ваши советы, и мне кажется, не заслужил обвинения в тупизне. Да я не такой умный, как Вы, но зачем человека оскорблять-то? Можно же было просто написать, что не обязны консультировать, и бы Вас понял. Loglevel увеличивать пробовал — в итоге за 30 секунд файл с логами стал размером 3 мегабайта.

Zabbix Мониторинг Raider

Похоже, что дело все-таки не во мне и не в шаблонах, а в самом Zabbix. Не зря же появился такой, который, к сожалению, на freebsd (у меня) не применился к версии zabbix-1.8.2. Похоже не судьба мне использовать дискретные датчики. При использовании утилиты portdowngrade пробовал использовать и 3 и 8 версии порта, а потом патчить их патчем ссылку, на который, я приводил выше. В результате всегда получается вот что: # /usr/ports/net-mgmt/zabbix-server# patch.