Поиск по сайту:

Seaborn Distplot: подробное руководство


Эй, ребята! В этой статье мы подробно остановимся на Seaborn Distplot.

Что такое Seaborn Distplot?

Distplot или график распределения изображает изменение в распределении данных. Seaborn Distplot представляет собой общее распределение непрерывных переменных данных.

Модуль Seaborn вместе с модулем Matplotlib используется для отображения дистрибутива с различными его вариациями. Distplot отображает данные в виде гистограммы и линии в сочетании с ней.

Создание морского графика

Модуль Python Seaborn содержит различные функции для построения графика данных и отображения их вариаций. Функция seaborn.distplot() используется для построения графика distplot. Distplot представляет собой одномерное распределение данных, то есть распределение данных переменной по сравнению с распределением плотности.

Синтаксис:

seaborn.distplot()

Функция seaborn.distplot() принимает в качестве аргумента переменную данных и возвращает график с распределением плотности.

Пример 1:

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(200)
res = sn.distplot(data)
plt.show()

Мы использовали функцию numpy.random.randn() для генерации случайных значений данных. Далее используется функция pyplot.show() для отображения графика.

Выход:

Пример 2:

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd

data_set = pd.read_csv("C:/mtcars.csv")
data = pd.DataFrame(data_set['mpg'])
res = sn.distplot(data)
plt.show()

Функция pandas.read_csv() загружает набор данных в среду Python.

Выход:

Добавление меток к оси DistPlot

Seaborn Distplot может быть снабжен метками оси путем преобразования значений данных в серию Pandas с использованием следующего синтаксиса:

Синтаксис:

pandas.Series(data,name='name')
seaborn.distplot()

Pandas Series содержит параметр «name», чтобы установить метку оси данных.

Пример:

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(200)
res = pd.Series(data,name="Range")
plot = sn.distplot(res)
plt.show()

Выход:

Seaborn DistPlot вместе с графиком оценки плотности ядра

Seaborn Distplot также можно использовать вместе с графиком оценки плотности ядра для оценки вероятности распределения непрерывных переменных по различным значениям данных.

Синтаксис:

seaborn.distplot(data,kde=True)

Для параметра kde установлено значение True, чтобы включить график плотности ядра вместе с distplot.

Пример:

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(100)
res = pd.Series(data,name="Range")
plot = sn.distplot(res,kde=True)
plt.show()

Выход:

Визуализация данных с помощью Seaborn DistPlot вместе с Rug Plot

Мы можем сопоставить Seaborn Distplot вместе с Rug Plot, чтобы отобразить распределение данных по ячейкам относительно одномерной переменной данных. Rug Plot описывает визуализацию распределения данных в виде бинов.

Синтаксис:

seaborn.distplot(data, rug=True, hist=False)

Параметр rug должен быть установлен в значение True, чтобы включить распределение ковров.

Пример:

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(100)
res = pd.Series(data,name="Range")
plot = sn.distplot(res,rug=True,hist=False)
plt.show()

Выход:

Построение графика Seaborn Distplot вдоль вертикальной оси

Весь Distplot можно отобразить по оси Y, используя следующий синтаксис:

Синтаксис:

seaborn.distplot(data,vertical=True)

Для параметра vertical необходимо установить значение True, чтобы отобразить дистплот по оси Y.

Пример:

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(100)

plot = sn.distplot(data,vertical=True)

plt.show()

Выход:

Установка другого стиля с помощью функции seaborn.set()

Seaborn имеет ряд встроенных функций для добавления дополнительных фоновых функций к графикам. Функция seaborn.set() используется для установки другого фона для графиков распределения.

Синтаксис:

seaborn.set(style)

Пример:

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
sn.set(style='dark',)
data = np.random.randn(500)

plot = sn.distplot(data)

plt.show()

Выход:

Установка пользовательского цвета для Seaborn DistPlot

Мы можем установить различные цвета для distplot, чтобы добавить к визуализации данных, используя параметр «color» функции seaborn.distplot().

Синтаксис:

seaborn.distplot(data, color='color')

Пример:

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

sn.set(style='dark',)
data = np.random.randn(500)
plot = sn.distplot(data,color='purple')

plt.show()

Выход:

Заключение

Таким образом, модуль Seaborn вместе с модулем Matplotlib помогает визуализировать данные и отображает распределение данных.

Я настоятельно рекомендую всем читателям прочитать модуль Python Matplotlib, чтобы понять основы визуализации данных.

Рекомендации

  • Функция Seaborn distplot() – документация