Поиск по сайту:

Горизонтальные коробчатые диаграммы с точками с использованием Seaborn в Python


Блокплоты — один из самых популярных инструментов, доступных для визуализации наборов данных, который в основном создается с использованием библиотеки Python под названием Seaborn, которая обеспечивает простой и мощный способ создания как горизонтальных, так и вертикальных коробчатых диаграмм, а также других типов визуализации.

В этой статье мы сосредоточимся на том, как создать горизонтальную коробчатую диаграмму с точками, используя Seaborn в Python.

Что такое бокс-сюжет?

Прежде всего, давайте определимся, что такое коробчатый сюжет. Ящичная диаграмма — это графическое представление набора данных, которое отображает распределение данных в наборе данных с использованием выбросов, квартилей и медианы. Поле в середине графика представляет собой межквартильный размах (IQR) данных, при этом «усы» простираются до минимальных и максимальных значений, которые находятся на определенном расстоянии от медианы. Выбросы представлены как отдельные точки за пределами усов.

Горизонтальные диаграммы с точками с использованием Seaborn

Давайте начнем с того, как мы можем создать горизонтальную коробчатую диаграмму с точками, используя Seaborn в Python. Мы будем использовать набор данных из библиотеки Seaborn под названием «советы», который содержит информацию, имеющую столбцы «Общая сумма счета» и «День недели в ресторане».

Ниже приведены шаги, которые мы будем выполнять для создания горизонтальной коробчатой диаграммы с точками, используя Seaborn в Python:

  • Импортируйте все необходимые библиотеки, такие как seaborn и matplotlib.

  • загрузите набор данных «советы» с помощью функции sns.load_dataset() –

  • Затем мы можем создать горизонтальную коробчатую диаграмму, используя функцию sns.boxplot().

  • Мы установили для переменных x и y значения «total_bill» и «day» соответственно, чтобы отобразить общую сумму счета по оси X и день недели по оси Y.

  • Мы также установили для параметраWhis значение [0, 100], чтобы отобразить полный диапазон данных, и настроили ширину коробчатых диаграмм и размер выбросов с помощью параметров width и fliersize.

  • Наконец, мы установили параметр ориентации на «h», чтобы создать горизонтальную коробчатую диаграмму.

  • Далее мы можем добавить на график отдельные точки данных, используя функцию sns.swarmplot().

  • Мы снова устанавливаем переменные x и y на «total_bill» и «day» и регулируем размер и цвет точек, используя параметры размера и цвета.

  • Мы также установили параметр ориентации на «h», чтобы создать горизонтальную диаграмму роя.

  • Наконец, мы добавляем к графику заголовок и метки осей, используя стандартные функции Matplotlib plt.title(), plt.xlabel() и plt.ylabel().

  • Затем мы можем показать график с помощью функции plt.show().

Пример

import seaborn as snsb
import matplotlib.pyplot as pltt

# Load example dataset
tips_df = snsb.load_dataset("tips")

# Create horizontal boxplot with points
snsb.boxplot(x="total_bill", y="day", data=tips_df, whis=[0, 100], width=.6, fliersize=5, orient="h")
snsb.swarmplot(x="total_bill", y="day", data=tips_df, color=".2", size=3, orient="h")

# Add title and axis labels
pltt.title("Total Bill by Day")
pltt.xlabel("Total Bill ($)")
pltt.ylabel("Day of Week")

# Show plot
pltt.show()

Выход

Программа для индивидуальной горизонтальной коробчатой диаграммы

import seaborn as snss
import matplotlib.pyplot as pltt

# Load example dataset
tips_df = snss.load_dataset("tips")

# Set style and color palette
snss.set_style("whitegrid")
snss.set_palette("husl")

# Create horizontal boxplot with points
snss.boxplot(x="total_bill", y="day", data=tips_df, whis=[0, 100], width=.6, fliersize=5, orient="h")
snss.swarmplot(x="total_bill", y="day", data=tips_df, color="black", size=4, orient="h")

# Customize plot appearance
pltt.title("Total Bill by Day", fontsize=14, fontweight="bold")
pltt.xlabel("Total Bill ($)", fontsize=12)
pltt.ylabel("Day of Week", fontsize=12)
pltt.xticks(fontsize=10)
pltt.yticks(fontsize=10)

# Adjust plot dimensions
pltt.figure(figsize=(8, 6))

# Show plot
pltt.show()

Выход

  • В приведенной выше настроенной программе мы начинаем с импорта необходимых библиотек, включая Seaborn и Matplotlib.

  • Загрузите пример набора данных под названием «советы», используя функцию sns.load_dataset() из Seaborn.

  • Настройте внешний вид графика, установив стиль «whitegrid» с помощью sns.set_style(). Кроме того, мы устанавливаем цветовую палитру «husl» с помощью sns.set_palette().

  • Создайте горизонтальную коробчатую диаграмму с помощью sns.boxplot(), указав переменные x и y как «total_bill» и «day» соответственно.

  • Мы настраиваем различные параметры, такие как ширина, ширина и размер флаера, чтобы настроить внешний вид коробчатого графика.

  • Чтобы добавить отдельные точки данных, мы используем sns.swarmplot() и настраиваем его цвет, размер и ориентацию.

  • Чтобы дополнительно настроить внешний вид графика, мы изменяем заголовок, xlabel и ylabel, используя функции plt.title(), plt.xlabel() и plt.ylabel() из Matplotlib.

  • Мы также настраиваем размер шрифта заголовка, меток и делений, используя размер шрифта.

  • Кроме того, мы можем настроить размеры графика, указав размер фигуры с помощью plt.figure() и передав нужные размеры в виде кортежа.

  • Наконец, мы используем plt.show() для отображения настроенной горизонтальной диаграммы с точками.

Заключение

В заключение, создание горизонтальных коробчатых диаграмм с точками с использованием Seaborn в Python является важным методом визуализации наборов данных, распределения данных и изучения взаимосвязей между различными переменными. Мы использовали функции boxplot() и swarmplot() компании seaborn для создания визуально привлекательных горизонтальных диаграмм, отображающих ключевые статистические показатели, такие как медианы, выбросы и квартили.

Статьи по данной тематике: