Как создать тепловую карту корреляции треугольника в seaborn?
В этом уроке мы научимся создавать тепловую карту корреляции треугольников в seaborn; Как звучит название, корреляция — это мера, показывающая степень связи переменных. Тепловые карты корреляции — это тип графика, который представляет отношения между числовыми переменными. Эти графики используются, чтобы понять, какие переменные связаны друг с другом, а также силу их связи. Тогда как тепловая карта — это двумерное графическое представление данных с использованием разных цветов.
Seaborn — это библиотека Python, которая используется для визуализации данных. Это полезно при создании статических графиков. Он построен на основе matplotlib и тесно интегрируется со структурами данных Pandas. Он предоставляет несколько графиков для представления данных. С помощью Pandas мы можем создавать привлекательные сюжеты. В этом уроке мы проиллюстрируем три примера создания тепловой карты треугольника. В конце мы научимся использовать библиотеку Seaborn для создания потрясающих и информативных тепловых карт.
Синтаксис
Это синтаксис для создания тепловой карты корреляции треугольников.
sns.heatmap(df.corr(),annot=True,fmt=".2f,mask=np.triu(np.ones_like(df.corr(),dtype=bool)))
В этом синтаксисе мы создали тепловую карту с помощью sns.heatmap(). Затем мы передаем корреляционную матрицу DataFrame «df», используя «df.corr()». Мы также установили 'annot=True' для отображения значений корреляции на тепловой карте, 'fmt=".2f"' для форматирования значений до 2 десятичных знаков и 'mask=np.triu(np.ones_like(df.corr() ), dtype=bool))', чтобы замаскировать верхнюю треугольную часть тепловой карты. Это делает тепловую карту треугольной по форме, показывая только нижнюю треугольную часть, которая представляет уникальные корреляции.
Пример 1
Вот пример, в котором мы использовали «советы» в качестве набора данных. Содержит информацию о чаевых, которые дают официантам в ресторане. Он включает в себя такие переменные, как общая сумма счета, размер вечеринки и сумма чаевых. Затем мы загрузили набор данных Tips с помощью функции Seaborn load_dataset() и создали матрицу корреляции с помощью метода corr() для набора данных. Затем мы создали тепловую карту корреляции треугольников, используя функцию Heatmap() компании Seaborn. Наконец, мы установили атрибуты и установили цвет карты как «весна» и отобразили ее с помощью функции plt.show(). Полученная тепловая карта показывает корреляцию между переменными «Общий счет», «Чаевые» и «Размер».
import seaborn as sns
import numpy as np
from matplotlib import pyplot as plt
import seaborn as sns
tips = sns.load_dataset("tips")
corr = tips.corr()
mask = np.zeros_like(corr, dtype=np.bool_)
mask[np.triu_indices_from(mask)] = True
sns.heatmap(corr, mask=mask, cmap='spring', annot=True)
plt.show()
Выход
Пример 2
В этом примере мы используем набор данных «Титаник», который представляет собой набор данных, используемый в машинном обучении и статистике, который содержит информацию о пассажирах «Титаника», включая их возраст, пол, класс билета, а также выжили ли они или нет. Сначала мы загрузили набор данных «Титаника» с помощью функции Seaborn «load_dataset()» и создали корреляционную матрицу, используя метод «corr()» для набора данных. Затем мы создаем тепловую карту корреляции треугольников, используя функцию Heatmap() компании Seaborn, и устанавливаем ее атрибуты. Наконец, мы отобразили его с помощью функции show() в Matplotlib. Полученная тепловая карта показывает корреляцию между переменными Age, Fare и Class.
import seaborn as sns
import numpy as np
from matplotlib import pyplot as plt
import seaborn as sns
titanic = sns.load_dataset("titanic")
corr = titanic.corr()
mask = np.zeros_like(corr, dtype=np.bool_)
mask[np.triu_indices_from(mask)] = True
sns.heatmap(corr, mask=mask, cmap='copper', annot=True)
plt.show()
Выход
Пример 3
В этом примере мы используем набор данных Iris, еще один классический набор данных, используемый в машинном обучении и статистике. Он содержит измерения длины чашелистика, ширины чашелистика, длины лепестка и ширины лепестка для трех видов цветов ириса: Setosa, Versicolor и Virginica. Сначала мы загрузили набор данных Iris с помощью функции Seaborn’s load_dataset() и создали корреляционную матрицу с помощью метода corr() для набора данных. Затем мы создали тепловую карту корреляции треугольников, используя функцию Heatmap() от Seaborn, и отобразили ее с помощью функции show() в Matplotlib. Полученная тепловая карта показывает корреляции между переменными «Длина чашелистика», «Ширина чашелистика», «Длина лепестка» и «Ширина лепестка».
import seaborn as sns
import numpy as np
from matplotlib import pyplot as plt
import seaborn as sns
# Load the Iris dataset
iris = sns.load_dataset("iris")
# Create a correlation matrix
corr = iris.corr()
# Create a heatmap using Seaborn
mask = np.zeros_like(corr, dtype=np.bool_)
mask[np.triu_indices_from(mask)] = True
sns.heatmap(corr, mask=mask, cmap='coolwarm', annot=True)
plt.show()
Выход
Мы узнали, что Seaborn — это мощная библиотека визуализации данных на Python, которая предоставляет различные функции для создания различных типов визуализаций, включая тепловые карты, которые являются полезным способом визуализации корреляций между переменными в наборе данных, особенно когда количество переменных велико. Кроме того, функция Heatmap() компании Seaborn позволяет нам настраивать цветовую палитру и отображать коэффициенты корреляции на тепловой карте, используя аргументы cmap и annot соответственно. Он также предоставляет несколько встроенных наборов данных для практики визуализации данных, таких как набор данных Iris, набор данных Titanic и набор данных Tips. Создание тепловых карт с использованием Seaborn очень полезно для специалистов по данным и аналитиков, которым необходимо исследовать и понимать корреляции в больших наборах данных. С помощью этих тепловых карт специалисты по данным и аналитики могут получить представление о своих данных и принимать обоснованные решения на основе своих выводов.