Seaborn Distplot: подробное руководство
Эй, ребята! В этой статье мы подробно остановимся на Seaborn Distplot.
Что такое Seaborn Distplot?
Distplot или график распределения изображает изменение в распределении данных. Seaborn Distplot представляет собой общее распределение непрерывных переменных данных.
Модуль Seaborn вместе с модулем Matplotlib используется для отображения дистрибутива с различными его вариациями. Distplot отображает данные в виде гистограммы и линии в сочетании с ней.
Создание морского графика
Модуль Python Seaborn содержит различные функции для построения графика данных и отображения их вариаций. Функция seaborn.distplot()
используется для построения графика distplot. Distplot представляет собой одномерное распределение данных, то есть распределение данных переменной по сравнению с распределением плотности.
Синтаксис:
seaborn.distplot()
Функция seaborn.distplot() принимает в качестве аргумента переменную данных и возвращает график с распределением плотности.
Пример 1:
import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
data = np.random.randn(200)
res = sn.distplot(data)
plt.show()
Мы использовали функцию numpy.random.randn()
для генерации случайных значений данных. Далее используется функция pyplot.show()
для отображения графика.
Выход:
Пример 2:
import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd
data_set = pd.read_csv("C:/mtcars.csv")
data = pd.DataFrame(data_set['mpg'])
res = sn.distplot(data)
plt.show()
Функция pandas.read_csv()
загружает набор данных в среду Python.
Выход:
Добавление меток к оси DistPlot
Seaborn Distplot может быть снабжен метками оси путем преобразования значений данных в серию Pandas с использованием следующего синтаксиса:
Синтаксис:
pandas.Series(data,name='name')
seaborn.distplot()
Pandas Series содержит параметр «name
», чтобы установить метку оси данных.
Пример:
import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
data = np.random.randn(200)
res = pd.Series(data,name="Range")
plot = sn.distplot(res)
plt.show()
Выход:
Seaborn DistPlot вместе с графиком оценки плотности ядра
Seaborn Distplot также можно использовать вместе с графиком оценки плотности ядра для оценки вероятности распределения непрерывных переменных по различным значениям данных.
Синтаксис:
seaborn.distplot(data,kde=True)
Для параметра kde
установлено значение True
, чтобы включить график плотности ядра вместе с distplot.
Пример:
import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
data = np.random.randn(100)
res = pd.Series(data,name="Range")
plot = sn.distplot(res,kde=True)
plt.show()
Выход:
Визуализация данных с помощью Seaborn DistPlot вместе с Rug Plot
Мы можем сопоставить Seaborn Distplot вместе с Rug Plot, чтобы отобразить распределение данных по ячейкам относительно одномерной переменной данных. Rug Plot описывает визуализацию распределения данных в виде бинов.
Синтаксис:
seaborn.distplot(data, rug=True, hist=False)
Параметр rug
должен быть установлен в значение True
, чтобы включить распределение ковров.
Пример:
import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
data = np.random.randn(100)
res = pd.Series(data,name="Range")
plot = sn.distplot(res,rug=True,hist=False)
plt.show()
Выход:
Построение графика Seaborn Distplot вдоль вертикальной оси
Весь Distplot можно отобразить по оси Y, используя следующий синтаксис:
Синтаксис:
seaborn.distplot(data,vertical=True)
Для параметра vertical
необходимо установить значение True
, чтобы отобразить дистплот по оси Y.
Пример:
import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
data = np.random.randn(100)
plot = sn.distplot(data,vertical=True)
plt.show()
Выход:
Установка другого стиля с помощью функции seaborn.set()
Seaborn имеет ряд встроенных функций для добавления дополнительных фоновых функций к графикам. Функция seaborn.set()
используется для установки другого фона для графиков распределения.
Синтаксис:
seaborn.set(style)
Пример:
import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
sn.set(style='dark',)
data = np.random.randn(500)
plot = sn.distplot(data)
plt.show()
Выход:
Установка пользовательского цвета для Seaborn DistPlot
Мы можем установить различные цвета для distplot, чтобы добавить к визуализации данных, используя параметр «color
» функции seaborn.distplot().
Синтаксис:
seaborn.distplot(data, color='color')
Пример:
import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
sn.set(style='dark',)
data = np.random.randn(500)
plot = sn.distplot(data,color='purple')
plt.show()
Выход:
Заключение
Таким образом, модуль Seaborn вместе с модулем Matplotlib помогает визуализировать данные и отображает распределение данных.
Я настоятельно рекомендую всем читателям прочитать модуль Python Matplotlib, чтобы понять основы визуализации данных.
Рекомендации
- Функция Seaborn distplot() – документация