Как установить базу данных NoSQL Apache Cassandra в Debian 11
Apache Cassandra — это распределенная база данных с открытым исходным кодом, разработанная для облачных вычислений. Он обеспечивает высокодоступную и масштабируемую службу базы данных без единой точки отказа и ручной настройки.
Apache Cassandra — одна из самых популярных баз данных, используемых в области искусственного интеллекта для создания роботов. Благодаря возможности быстрого масштабирования с использованием стандартного оборудования Cassandra может стать одной из основных систем хранения данных, которые будут использоваться в будущих роботизированных устройствах управления данными.
Apache Cassandra — это база данных NoSQL. Благодаря добавлению интерфейса Apache Thrift Cassandra можно использовать для хранения данных и управления ими без использования SQL, позволяя разработчикам использовать знакомые протоколы разработки приложений, такие как REST и Thrift.
Cassandra была разработана инженером Facebook Прашантом Маликом. База данных была названа в честь жены соучредителя Facebook, погибшего в автокатастрофе в 2008 году. Она построена на архитектуре Google BigTable с поддержкой распространения, репликации, обнаружения сбоев и балансировки нагрузки с помощью Apache ZooKeeper.
В Cassandra данные распределяются по кластеру серверов. Он не имеет единой точки отказа и может выдержать потерю любого количества компьютеров без потери данных. При необходимости общую мощность системы можно увеличить, просто добавив больше машин. Cassandra разработана для того, чтобы очень хорошо справляться с частыми сбоями и произвольными потерями машины за счет доступности записи во время ремонта.
Использование Apache Cassandra в качестве базы данных NoSQL дает множество преимуществ. Но установить и начать работу может быть сложно. В этом уроке мы покажем вам, как начать работу с Cassandra на вашем собственном сервере Debian 11, и сделаем это как можно проще.
Вы узнаете, как создать кластер Apache Cassandra на своем компьютере. Также вы узнаете, как использовать клиентскую программу cqlsh для взаимодействия с базой данных Cassandra, установленной на вашем компьютере.
Прочитав это руководство, вы сможете легко установить и использовать Cassandra на своем компьютере.
Предварительные условия
Для работы с этим руководством вам понадобится сервер Ubuntu 20.04 или Debian 11 со следующими характеристиками:
- Минимум 2 ГБ ОЗУ, 2 процессора по 2,0 ГГц каждый. Не менее 40 ГБ свободного места на жестком диске для установки.
- На вашем сервере настроен пользователь без полномочий root с привилегиями sudo.
Обновление вашей системы
Прежде всего, убедитесь, что у вас установлены последние версии, введя следующую команду на своем сервере.
sudo apt update -y && sudo apt upgrade -y
Далее установите необходимые пакеты, необходимые для Cassandra.
sudo apt install build-essential binutils bsdmainutils gnupg2 curl -y
Установка Java (JDK)
Далее мы собираемся установить Java Development Kit (JDK) на ваш сервер.
Java Development Kit (JDK) содержит компилятор и инструменты для разработки программ Java.
Требуется запустить клиентскую программу Cassandra cqlsh и, следовательно, сервер Cassandra. По умолчанию cqlsh ищет среду выполнения Java (JRE), установленную на вашем компьютере. Но иногда бывает сложно установить JRE в системах на базе Ubuntu или Debian, поскольку они установлены по умолчанию.
В этой демонстрации мы установим официальную стабильную версию OpenJDK 11 JDK. OpenJDK — это официальная стабильная версия OpenJDK от Oracle и лучшая альтернатива JRE, которая не подведет вас, если вы захотите использовать JDK для разработки своего следующего замечательного приложения.
Запустите команду ниже, чтобы установить openjdk-11-openjdk на ваш сервер.
sudo apt install openjdk-11-jre -y
После установки выполните приведенную ниже команду, чтобы проверить ее и убедиться, что она установлена правильно.
java -version
-version — это встроенная команда терминала, которая показывает версию Java, установленную в вашей системе. Если вы видите номер версии, как показано ниже, это означает, что вы успешно установили этот JDK.
Установка базы данных NoSQL Apache Cassandra в Debian 11
Теперь, когда мы обновили нашу систему и установили необходимые пакеты, мы готовы установить Cassandra на наш сервер.
По умолчанию базовый репозиторий Debian 11 не включает Cassandra. Чтобы установить Cassandra, нам нужно будет добавить официальный репозиторий Cassandra от разработчика Cassandra.
Официальный репозиторий Cassandra содержит последние стабильные версии Cassandra, ее зависимости и дополнения.
Запустите команду ниже, чтобы добавить ключ аутентификации официального репозитория Cassandra. Эта команда добавляет ключ аутентификации официального репозитория Cassandra в связку ключей APT вашей системы.
Добавление ключа аутентификации не позволяет неавторизованным лицам добавить вредоносный репозиторий, содержащий защищенную версию Cassandra или вредоносное ПО. Он также проверяет, что вы получаете доступ к официальному репозиторию, а не к репозиторию, выдающему себя за другое лицо.
curl https://downloads.apache.org/cassandra/KEYS | apt-key add -
Вы получите сообщение ОК, если ключ аутентификации был успешно добавлен.
Теперь добавьте официальный репозиторий Cassandra в список источников APT вашей системы. Эта команда добавит официальный репозиторий Cassandra в список источников APT вашей системы. Информация о ключах GPG, которая используется для подписи пакетов, на этом этапе автоматически извлекается из сети серверов ключей.
echo "deb https://downloads.apache.org/cassandra/debian 40x main" | tee -a /etc/apt/sources.list.d/cassandra.list
После добавления официального репозитория Cassandra в вашу систему выполните команду ниже, чтобы обновить список источников APT.
sudo apt update -y
После того, как вы обновили список источников APT, выполните приведенную ниже команду, чтобы проверить, правильно ли добавлен официальный репозиторий Cassandra в список источников APT вашей системы.
apt-cache policy
Вы получите результат, аналогичный приведенному ниже. Вы можете видеть, что репозиторий правильно добавлен в список источников APT вашей системы. Прежде чем перейти к следующему шагу, вы должны убедиться, что версия репозитория отображается как 40x.
Теперь вы можете установить Cassandra, используя приведенную ниже команду в терминале или командной строке.
sudo apt install cassandra -y
После установки выполните следующую команду, чтобы проверить, правильно ли установлена Cassandra в вашей системе. Вы получите статус установленной Cassandra.
sudo systemctl status cassandra
Тестирование Apache Cassandra
Теперь, когда вы успешно установили Cassandra, вы готовы ее протестировать. Итак, мы начнем с тестирования сервера Cassandra с помощью nodetool. Nodetool — это утилита, которая используется для диагностики проблем с установкой Cassandra.
Он считывает информацию из Cassandra о том, какие узлы активны, сколько реплик должно быть для каждого семейства столбцов и т. д. Затем он распечатывает информацию, полученную от Cassandra, и сравнивает ее с тем, что вы ожидаете увидеть, учитывая схему. Он пытается выявить основные проблемы конфигурации.
Запустите команду nodetool status, чтобы проверить ошибки и предупреждения о вашей установке.
nodetool status
Вы получите результат, аналогичный приведенному ниже. Если ошибок нет, вы успешно установили Cassandra на свой сервер.
Вы также можете использовать клиент cqlsh для тестирования Cassandra. cqlsh — официальная клиентская программа Cassandra, поставляемая в комплекте с Cassandra. В этой демонстрации мы продолжим тестирование Cassandra на вашем сервере, используя cqlsh для изменения имени кластера по умолчанию в вашей системе. А затем еще раз проверьте имя кластера.
Запустите команду cqlsh ниже, чтобы войти на сервер Cassandra.
cqlsh
Вы увидите экран, аналогичный показанному ниже.
Чтобы изменить имя кластера в вашей системе, добавьте запрос ниже в командной строке и нажмите Enter.
Введите exit и нажмите Enter, чтобы выйти из cqlsh.
Откройте файл /etc/cassandra/cassandra.yaml в текстовом редакторе.
sudo nano /etc/cassandra/cassandra.yaml
Найдите строку cluster_name: ‘Test Cluster’ и измените имя на Vitux. Сохраните и выйдите из файла, набрав Ctrl + O, затем Enter, а затем Ctrl + X для выхода.
До
После
Теперь, когда ваш кластер называется Vitux, еще раз проверьте имя кластера на своем сервере.
cqlsh
Если вы видите, что имя кластера в нашей системе изменилось на Vitux, это означает, что вы успешно изменили имя своего кластера с помощью клиента cqlsh Cassandra в своем терминале.
Заключение
В этой статье мы показали, как установить Cassandra на сервер Debian 11. И как протестировать установку, зайдя в систему с помощью cqlsh и изменив имя кластера с Test Cluster на Vitux. Если вы хотите узнать больше о Cassandra, посетите ее официальный сайт.