ua ru en

Контроль работоспособности систем

В УФС приоритетной задачей является функция контроля. Так в основе бизнеса лежат информационные технологии, то и их мониторинг является неотъемлемой функцией бизнес процесса.

 

Контроль осуществляется на основе наблюдения за поведением систем с целью обеспечения их оптимального функционирования. На основе данных контроля осуществляется, оперативное реагирование в случае непредвиденных ситуаций, а также адаптация системы, то есть принятие оптимизирующих решений.

 

Одной из основных целей при развертке продукта была максимальная область охвата всех систем, а для этого нужен максимально гибкий продукт.

 

Ключевые контролируемые позиции:

 

  • серверная (электропитание нагрузка, влажность, температура)
  • коммуникации (состояние/загрузка портов)
  • сервера (нагрузка на процессоры, количество свободной памяти, количество операций ввода/вывода, свободное место на диске, температура)
  • приложения (состояние, интерконнекты приложений, ошибки которые генерирует сервер приложений и само приложение)
  • состояние контрагентов, от которых мы зависим (SMS агрегаторы, платежные шлюзы)

 

 

 

 

Система контроля построена, как комплексное решение на базе программного продукта Zabbix.

 

Основные возможности продукта:

  • Распределенный мониторинг вплоть до 1000 узлов. Конфигурация младших узлов полностью контролируется старшими узлами, находящихся на более высоком уровне иерархии.
  • Сценарии на основе мониторинга
  • Автоматическое обнаружение
  • Централизованный мониторинг лог-файлов
  • Веб-интерфейс для администрирования и настройки
  • Отчетность и тенденции
  • SLA мониторинг
  • Поддержка высокопроизводительных агентов (zabbix-agent) практически для всех платформ
  • Комплексная реакция на события
  • Поддержка SNMP v1, 2, 3
  • Поддержка SNMP трапов
  • Поддержка IPMI
  • Поддержка мониторинга JMX приложений из коробки
  • Поддержка выполнения запросов в различные базы данных без необходимости использования скриптовой обвязки
  • Расширение за счет выполнения внешних скриптов
  • Гибкая система шаблонов и групп
  • Возможность создавать карты сетей
Для надежности в компании используются дополнительные средства контроля, такие как, мониторинг транзакций или визуальный контроль за состоянием в серверной комнате.

В конце месяца проходит анализ работоспособности систем, регистрируются наиболее важные события, строится график работоспособности.

 

Система контроля построена так, чтобы максимально охватить все системы. Но всегда уделяется внимание тому, чтобы контроль был не чрезмерным, т.к. сразу резко падает его эффективность.

 

Система контроля малоэффективна без функции оперативного реагирования. Для этого реализованы, как автоматические средства оповещения путем SMS, так и в виде круглосуточной службы мониторинга. Оператор визуально может диагностировать проблему и оперативно по телефону сообщить ответственному специалисту о возникшей проблеме.

 

Существующая система контроля показала свою высокую эффективность и в последние несколько лет практически не изменялась. Изначально хорошо продуманная система с первого раза и без технического вмешательства прошла тестирование на соответствие стандарту платежных систем PCI DSS.

 

КОНТАКТЫ

Украина, г. Киев
ул. Северо-Сырецкая, 1-3
тел.: (044) 596-6330
факс: (044) 596-6335
e-mail: info@ufn.com.ua