Как создать тепловую карту морской корреляции в Python?
Сила и направление корреляции между двумя парами переменных в наборе данных отображаются графически на тепловой карте корреляции, которая представляет собой корреляционную матрицу. Это эффективный метод поиска закономерностей и связей в огромных наборах данных.
Набор инструментов Python для визуализации данных Seaborn предлагает простые утилиты для создания статистических визуальных изображений. Пользователи могут быстро просмотреть корреляционную матрицу набора данных благодаря функции создания корреляционных тепловых карт.
Мы должны импортировать набор данных, вычислить матрицу корреляции переменных, а затем использовать функцию тепловой карты Сиборна для создания тепловой карты для построения тепловой карты корреляции. Тепловая карта отображает матрицу с цветами, которые указывают степень корреляции между переменными. Также пользователь может отображать коэффициенты корреляции на тепловой карте.
Тепловые карты корреляции Сиборна представляют собой эффективный метод визуализации для изучения закономерностей и взаимосвязей в наборах данных и могут использоваться для определения ключевых переменных для дополнительного исследования.
Использование функции Тепловая карта()
Функция тепловой карты генерирует матрицу с цветовой кодировкой, которая показывает, насколько сильно две пары переменных в наборе данных коррелируют друг с другом. Функция тепловой карты требует, чтобы мы передали ей корреляционную матрицу переменных, которую можно рассчитать с помощью метода corr фрейма данных Pandas. Функция тепловой карты предлагает широкий спектр дополнительных опций, позволяющих пользователю изменять внешний вид тепловой карты, включая цветовую схему, аннотации, размер графика и местоположение.
Синтаксис
import seaborn as sns
sns.heatmap(data, cmap=None, annot=None)
Данные параметра в приведенной выше функции представляют собой корреляционную матрицу, представляющую входной набор данных. Цветовая карта, которая будет использоваться для раскрашивания тепловой карты, называется cmap.
Пример 1
В этом примере мы создаем тепловую карту морской корреляции в Python. Во-первых, мы импортируем библиотеки seaborn и matplotlib и используем функцию загрузки набора данных Seaborn для загрузки набора данных радужной оболочки глаза. Набор данных содержит переменные SepalLength, SepalWidth, PetalLength и PetalWidth. Набор данных ириса включает измерения длины чашелистика, ширины чашелистика, длины и ширины лепестка цветков ириса. Это пример информации –
Serial no | sepal_length | sepal_width | petal_length | petal_width | species |
---|---|---|---|---|---|
0 | 5.1 | 3.5 | 1.4 | 0.2 | setosa |
1 | 4.9 | 3.0 | 1.4 | 0.2 | Setosa |
2 | 4.7 | 3.2 | 1.3 | 0.2 | Setosa |
3 | 4.6 | 3.1 | 1.5 | 0.2 | Setosa |
4 | 5.0 | 3.6 | 1.4 | 0.2 | setosa |
Пользователи могут использовать метод загрузки набора данных Seaborn для загрузки набора данных радужной оболочки глаза в DataFrame Pandas. Затем матрица корреляции переменных рассчитывается с использованием метода corr фрейма данных Pandas и сохраняется в переменной с именем corr_matrix. Для создания тепловой карты мы используем метод тепловой карты Сиборна. Мы передаем матрицу корреляции corr_matrix и устанавливаем для аргумента cmap значение «coolwarm», чтобы использовать различные цвета для обозначения положительных и отрицательных корреляций с функцией. Наконец, мы используем модуль pyplot из метода show matplotlib для отображения тепловой карты.
# Required libraries
import seaborn as sns
import matplotlib.pyplot as plt
# Load the iris dataset into a Pandas dataframe
iris_data = sns.load_dataset('iris')
# Creating the correlation matrix of the iris dataset
iris_corr_matrix = iris_data.corr()
print(iris_corr_matrix)
# Create the heatmap using the `heatmap` function of Seaborn
sns.heatmap(iris_corr_matrix, cmap='coolwarm', annot=True)
# Display the heatmap using the `show` method of the `pyplot` module from matplotlib.
plt.show()
Выход
sepal_length sepal_width petal_length petal_width
sepal_length 1.000000 -0.117570 0.871754 0.817941
sepal_width -0.117570 1.000000 -0.428440 -0.366126
petal_length 0.871754 -0.428440 1.000000 0.962865
petal_width 0.817941 -0.366126 0.962865 1.000000
Пример 2
В этом примере мы снова создаем тепловую карту морской корреляции в Python. Во-первых, мы импортируем библиотеки seaborn и matplotlib и используем функцию загрузки набора данных Seaborn для загрузки набора данных по алмазам. Набор данных по бриллиантам включает подробную информацию о стоимости и характеристиках бриллиантов, включая их вес в каратах, огранку, цвет и чистоту. Это пример информации –
Serial no | carat | cut | color | clarity | depth | table | price | x | y | z |
---|---|---|---|---|---|---|---|---|---|---|
0 | 0.23 | Ideal | E | SI2 | 61.5 | 55.0 | 326 | 3.95 | 3.98 | 2.43 |
1 | 0.21 | Premium | E | SI1 | 59.8 | 61.0 | 326 | 3.89 | 3.84 | 2.31 |
2 | 0.23 | Good | E | VS1 | 56.9 | 65.0 | 327 | 4.05 | 4.07 | 2.31 |
3 | 0.29 | Premium | I | VS2 | 62.4 | 58.0 | 334 | 4.20 | 4.23 | 2.63 |
4 | 0.31 | Good | J | SI2 | 63.3 | 58.0 | 335 | 4.34 | 4.35 | 2.75 |
Набор данных Diamond можно загрузить в DataFrame Pandas с помощью функции загрузки набора данных Seaborn. Затем, используя метод corr кадра данных Pandas, матрица корреляции переменных вычисляется и сохраняется в переменной с именем Diamond_corr_matrix. Чтобы использовать разные цвета для обозначения положительных и отрицательных корреляций функции, мы передаем матрицу корреляций corr и устанавливаем для параметра cmap значение «холодно-теплый». Наконец, мы используем модуль pyplot из метода show matplotlib для отображения тепловой карты.
# Required libraries
import seaborn as sns
import matplotlib.pyplot as plt
# Load the diamond dataset into a Pandas dataframe
diamonds_data = sns.load_dataset('diamonds')
# Compute the correlation matrix of the variables
diamonds_corr_matrix = diamonds_data.corr()
print(diamonds_corr_matrix)
# Create the heatmap using the `heatmap` function of Seaborn
sns.heatmap(diamonds_corr_matrix, cmap='coolwarm', annot=True)
# Display the heatmap using the `show` method of the `pyplot` module from matplotlib.
plt.show()
Выход
carat depth table price x y z
carat 1.000000 0.028224 0.181618 0.921591 0.975094 0.951722 0.953387
depth 0.028224 1.000000 -0.295779 -0.010647 -0.025289 -0.029341 0.094924
table 0.181618 -0.295779 1.000000 0.127134 0.195344 0.183760 0.150929
price 0.921591 -0.010647 0.127134 1.000000 0.884435 0.865421 0.861249
x 0.975094 -0.025289 0.195344 0.884435 1.000000 0.974701 0.970772
y 0.951722 -0.029341 0.183760 0.865421 0.974701 1.000000 0.952006
z 0.953387 0.094924 0.150929 0.861249 0.970772 0.952006 1.000000
Тепловая карта является полезным графическим представлением, а seaborn делает ее простой и удобной в использовании.