Горизонтальные коробчатые диаграммы с точками с использованием Seaborn в Python
Блокплоты — один из самых популярных инструментов, доступных для визуализации наборов данных, который в основном создается с использованием библиотеки Python под названием Seaborn, которая обеспечивает простой и мощный способ создания как горизонтальных, так и вертикальных коробчатых диаграмм, а также других типов визуализации.
В этой статье мы сосредоточимся на том, как создать горизонтальную коробчатую диаграмму с точками, используя Seaborn в Python.
Что такое бокс-сюжет?
Прежде всего, давайте определимся, что такое коробчатый сюжет. Ящичная диаграмма — это графическое представление набора данных, которое отображает распределение данных в наборе данных с использованием выбросов, квартилей и медианы. Поле в середине графика представляет собой межквартильный размах (IQR) данных, при этом «усы» простираются до минимальных и максимальных значений, которые находятся на определенном расстоянии от медианы. Выбросы представлены как отдельные точки за пределами усов.
Горизонтальные диаграммы с точками с использованием Seaborn
Давайте начнем с того, как мы можем создать горизонтальную коробчатую диаграмму с точками, используя Seaborn в Python. Мы будем использовать набор данных из библиотеки Seaborn под названием «советы», который содержит информацию, имеющую столбцы «Общая сумма счета» и «День недели в ресторане».
Ниже приведены шаги, которые мы будем выполнять для создания горизонтальной коробчатой диаграммы с точками, используя Seaborn в Python:
-
Импортируйте все необходимые библиотеки, такие как seaborn и matplotlib.
загрузите набор данных «советы» с помощью функции sns.load_dataset() –
Затем мы можем создать горизонтальную коробчатую диаграмму, используя функцию sns.boxplot().
Мы установили для переменных x и y значения «total_bill» и «day» соответственно, чтобы отобразить общую сумму счета по оси X и день недели по оси Y.
Мы также установили для параметраWhis значение [0, 100], чтобы отобразить полный диапазон данных, и настроили ширину коробчатых диаграмм и размер выбросов с помощью параметров width и fliersize.
Наконец, мы установили параметр ориентации на «h», чтобы создать горизонтальную коробчатую диаграмму.
Далее мы можем добавить на график отдельные точки данных, используя функцию sns.swarmplot().
Мы снова устанавливаем переменные x и y на «total_bill» и «day» и регулируем размер и цвет точек, используя параметры размера и цвета.
Мы также установили параметр ориентации на «h», чтобы создать горизонтальную диаграмму роя.
Наконец, мы добавляем к графику заголовок и метки осей, используя стандартные функции Matplotlib plt.title(), plt.xlabel() и plt.ylabel().
-
Затем мы можем показать график с помощью функции plt.show().
Пример
import seaborn as snsb
import matplotlib.pyplot as pltt
# Load example dataset
tips_df = snsb.load_dataset("tips")
# Create horizontal boxplot with points
snsb.boxplot(x="total_bill", y="day", data=tips_df, whis=[0, 100], width=.6, fliersize=5, orient="h")
snsb.swarmplot(x="total_bill", y="day", data=tips_df, color=".2", size=3, orient="h")
# Add title and axis labels
pltt.title("Total Bill by Day")
pltt.xlabel("Total Bill ($)")
pltt.ylabel("Day of Week")
# Show plot
pltt.show()
Выход
Программа для индивидуальной горизонтальной коробчатой диаграммы
import seaborn as snss
import matplotlib.pyplot as pltt
# Load example dataset
tips_df = snss.load_dataset("tips")
# Set style and color palette
snss.set_style("whitegrid")
snss.set_palette("husl")
# Create horizontal boxplot with points
snss.boxplot(x="total_bill", y="day", data=tips_df, whis=[0, 100], width=.6, fliersize=5, orient="h")
snss.swarmplot(x="total_bill", y="day", data=tips_df, color="black", size=4, orient="h")
# Customize plot appearance
pltt.title("Total Bill by Day", fontsize=14, fontweight="bold")
pltt.xlabel("Total Bill ($)", fontsize=12)
pltt.ylabel("Day of Week", fontsize=12)
pltt.xticks(fontsize=10)
pltt.yticks(fontsize=10)
# Adjust plot dimensions
pltt.figure(figsize=(8, 6))
# Show plot
pltt.show()
Выход
В приведенной выше настроенной программе мы начинаем с импорта необходимых библиотек, включая Seaborn и Matplotlib.
Загрузите пример набора данных под названием «советы», используя функцию sns.load_dataset() из Seaborn.
Настройте внешний вид графика, установив стиль «whitegrid» с помощью sns.set_style(). Кроме того, мы устанавливаем цветовую палитру «husl» с помощью sns.set_palette().
Создайте горизонтальную коробчатую диаграмму с помощью sns.boxplot(), указав переменные x и y как «total_bill» и «day» соответственно.
Мы настраиваем различные параметры, такие как ширина, ширина и размер флаера, чтобы настроить внешний вид коробчатого графика.
Чтобы добавить отдельные точки данных, мы используем sns.swarmplot() и настраиваем его цвет, размер и ориентацию.
Чтобы дополнительно настроить внешний вид графика, мы изменяем заголовок, xlabel и ylabel, используя функции plt.title(), plt.xlabel() и plt.ylabel() из Matplotlib.
-
Мы также настраиваем размер шрифта заголовка, меток и делений, используя размер шрифта.
Кроме того, мы можем настроить размеры графика, указав размер фигуры с помощью plt.figure() и передав нужные размеры в виде кортежа.
Наконец, мы используем plt.show() для отображения настроенной горизонтальной диаграммы с точками.
Заключение
В заключение, создание горизонтальных коробчатых диаграмм с точками с использованием Seaborn в Python является важным методом визуализации наборов данных, распределения данных и изучения взаимосвязей между различными переменными. Мы использовали функции boxplot() и swarmplot() компании seaborn для создания визуально привлекательных горизонтальных диаграмм, отображающих ключевые статистические показатели, такие как медианы, выбросы и квартили.