Как отслеживать работоспособность ваших экземпляров облачной платформы Google

Google Cloud Platform поставляется с набором инструментов мониторинга, которые отслеживают показатели любого используемого вами облачного ресурса, что может помочь вам выявить проблемы в вашей инфраструктуре. Кроме того, он также имеет полную поддержку AWS.

Настройка панели мониторинга

По умолчанию GCP создает панель мониторинга для некоторых основных ресурсов, таких как корзины облачного хранилища, диски хранилища и экземпляры Compute Engine, которые можно просмотреть на вкладках «Мониторинг» этих ресурсов. Однако полный сервис «Мониторинг» доступен на боковой панели в разделе «Операции»:

Вы можете просмотреть существующие информационные панели на вкладке «Информационные панели»:

По умолчанию на диаграмме для экземпляров Compute Engine отображается загрузка ЦП, дисковый ввод-вывод и любые недавно сработавшие оповещения. Вы можете отфильтровать все эти графики по времени и дате, используя элементы управления вверху.

Если вы хотите создать свою собственную панель инструментов, это довольно просто. Панели мониторинга являются общими — вы можете создать панель мониторинга, которую можно применить к любому экземпляру GCE, а затем отфильтровать панель мониторинга по имени экземпляра, идентификатору проекта или идентификатору зоны. Таким образом, вы можете настроить одну панель со всеми полезными показателями, а затем повторно использовать ее для любого ресурса того же типа. Если вы хотите, чтобы на панели управления отображался конкретный экземпляр, это также возможно.

На «Панели информационных панелей» создайте новую информационную панель:

Каждая информационная панель содержит несколько диаграмм, которые отображают метрики из данного ресурса. Создайте новую диаграмму для добавления на панель инструментов:

В этом диалоговом окне у вас есть полный контроль над тем, какие показатели вы хотите отображать. Вы не ограничены только одной метрикой, так как диаграммы могут отображать несколько метрик друг над другом, хотя не гарантируется, что два графика будут иметь смысл вместе.

Тип ресурса позволяет вам выбрать, какой облачный ресурс вы отслеживаете, будь то корзина облачного хранилища, база данных, Compute Engine или экземпляр EC2, или практически любой ресурс GCP или AWS, о котором вы только можете подумать. Это отфильтрует метрики, которые вы можете использовать, чтобы отображать только те метрики, которые относятся к данному ресурсу.

Имя метрики будет выбирать, какие данные отображать на графике. Существует множество метрик для сложных ресурсов, таких как экземпляры GCE, но все общие, такие как загрузка ЦП, дисковый ввод-вывод, использование памяти и вход/выход из сети, представлены здесь.

Фильтр позволяет предварительно выбрать конкретный проект, экземпляр, зону или группу. Вы всегда можете изменить это на панели инструментов, чтобы просмотреть другие экземпляры, но это установит фильтр по умолчанию.

Группировать по изменит способ отображения нескольких ресурсов на графике. Если вы добавляете диаграмму для наблюдения за группой экземпляров, вы можете, например, разделить их по имени экземпляра.

После добавления на график вы всегда можете отредактировать настройки из меню на графике или активировать «Режим статистики», в котором будут отображаться скользящие средние и другие полезные функции.

Настройка пользовательских сигналов тревоги

Одной из наиболее полезных функций пакета мониторинга GCP является возможность устанавливать настраиваемые сигналы тревоги, которые будут уведомлять вас о возникновении проблем с вашей сетью.

Мониторинг предлагает два вида сигналов тревоги, оба из которых абсолютно бесплатны и не ограничены для всех. Проверка работоспособности будет запрашивать веб-службу или службу TCP, чтобы убедиться, что она все еще работает. Политики оповещения будут отслеживать показатели и отправлять оповещения всякий раз, когда они достигают определенного уровня или происходит что-то необычное.

Проверки времени безотказной работы просты и доступны на главной вкладке «Обзор». Вам просто нужно дать ему свое имя хоста и установить интервал для проверки.

После того, как вы нажмете «Сохранить», вам будет предложено создать политику оповещения для проверки, которая будет отправлять вам уведомления в случае сбоя.

Если вы хотите настроить собственную политику оповещения, вы можете сделать это на боковой панели «Оповещения». Это позволяет выбрать ресурс, метрику, фильтр и группу, а также настроить отправку уведомления, если график соответствует заданному условию. Например, вы можете установить сигнал тревоги, который срабатывает, если загрузка ЦП экземпляра превышает 80 % в течение как минимум нескольких минут.

Конечно, вам нужно будет настроить уведомления для будильника. Самый простой вариант — настроить канал уведомлений для отправки вам электронной почты, но доступны и другие варианты, такие как SMS-уведомления, уведомления Slack или публикация в веб-перехватчике.

Все эти варианты уведомлений совершенно бесплатны.