Постоянный контроль ресурсов сервера необходим для стабильной работы сервисов. В качестве инструмента аналитики используем сбор метрик.
Контролируем: использование CPU, памяти, SWAP, утилизацию дисков, сетевую нагрузку, показатели загруженности ядра, температуру сервера, состояние RAID массива и другие параметры.
Данные получаем и анализируем самостоятельно на своих серверах. Клиент не тратит дополнительные средства и время на анализ. Храним и обрабатываем метрики собственными силами.
Показатели обновляются в среднем каждые 60 секунд, что даёт возможность отслеживать состояние сервера в режиме реального времени. При появлении первых признаков проблемы, наши сотрудники оперативно вмешиваются в работу, чтобы не допустить перегрузки сервера и остановки сервисов.