Поиск по сайту:

Визуализация данных с помощью линейного графика Seaborn


Привет, народ! В этой статье мы рассмотрим учебник Seaborn и разберемся с линейным графиком Seaborn. Недавно мы рассмотрели тепловые карты Seaborn, поэтому не стесняйтесь взглянуть, если вам интересно узнать больше о тепловых картах.

Что такое линейный график?

Seaborn как библиотека используется в визуализации данных из моделей, построенных на основе набора данных, для прогнозирования результата и анализа изменений в данных.

Линейные графики Seaborn отображают взаимосвязь между непрерывными и категориальными значениями в формате непрерывных точек данных.

На протяжении всей этой статьи мы будем использовать приведенный ниже набор данных для управления данными и формирования линейного графика. Пожалуйста, просмотрите приведенный ниже снимок набора данных, прежде чем двигаться дальше.

В приведенном ниже наборе данных переменные данных — «cyl», «vs», «am», «gear» и «carb» являются категориальными переменными, поскольку все значения данных подпадают под определенную категорию или диапазон значений.

В то время как оставшийся столбец данных подпадает под целые/непрерывные переменные, потому что они несут с собой дискретные целые значения.

Входной набор данных:

Построение вашего первого линейного графика Seaborn

Чтобы начать с линейных графиков, нам нужно установить и импортировать библиотеку Seaborn в среду Python с помощью следующей команды:

Синтаксис:

pip install seaborn

После завершения установки импортируйте библиотеку в текущую рабочую среду и используйте функции

Синтаксис:

import seaborn

Для всей серии Seaborn мы будем использовать библиотеку Matplotlib, чтобы отображать данные и отображать их надлежащим образом.

Создание однолинейного графика с Seaborn

Мы можем предоставить дискретные значения или использовать наборы данных для создания линейного графика Seaborn.

Синтаксис:

seaborn.lineplot(x, y, data)

  • x: переменная данных для оси X
  • y: переменная данных для оси Y.
  • данные: объект, указывающий на весь набор данных или значения данных.

Пример 1: Использование случайных данных для создания линейного графика Seaborn

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

Year = [2012, 2014, 2016, 2020, 2021, 2022, 2018]
Profit = [80, 75.8, 74, 65, 99.5, 19, 33.6]

data_plot = pd.DataFrame({"Year":Year, "Profit":Profit})

sns.lineplot(x = "Year", y = "Profit", data=data_plot)
plt.show()

На приведенном ниже линейном графике мы можем наблюдать линейную зависимость между двумя переменными данных — «Год» и «Прибыль».

Выход:

Пример 2. Использование набора данных для создания линейного графика и отображения связи между столбцами данных.

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg",data=info)
sns.set(style='dark',)
plt.show()

Входной набор данных:

Выход:

Несколько графиков Seaborn Line

Мы можем создать несколько строк для визуализации данных в одном пространстве или на одном графике. Мы можем использовать одни и те же или несколько столбцов данных/переменных данных и отображать взаимосвязь между ними в целом.

1. Использование параметра hue для создания цветового оттенка для нескольких точек данных

Параметр hue можно использовать для группировки различных переменных набора данных, и он поможет отобразить взаимосвязь между столбцами данных по оси x и оси y со столбцом, переданным в качестве значения параметра.

Синтаксис:

seaborn.lineplot(x,y,data,hue)

Пример:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="cyl")
plt.show()

Как видно на приведенном ниже графике, он представляет собой три линии с разной цветовой схемой, чтобы показать взаимосвязь между «драт», «миль на галлон» и «цил» соответственно.

Выход:

2. Использование параметра стиля для построения различных типов линий

Мы можем установить для параметра стиля значение, которое мы хотели бы отображать вместе с осями x и y, а также указать различные структуры линий: тире, точки (маркеры) и т. д.

Синтаксис:

seaborn.lineplot(x, y, data, style)

Пример 2:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="cyl", style="cyl")
plt.show()

Как видно, график представляет значения «cyl» по отношению к «милям на галлон» и «дратам» с различной структурой линий, т. е. простой линией, штрихами и метками.

Выход:

3. Использование параметра размера для построения нескольких линейных графиков в Seaborn.

Мы даже можем использовать параметр size функции seaborn.lineplot() для представления взаимосвязей нескольких переменных данных с изменяющимся размером линии для построения. Таким образом, он действует как группирующая переменная с разным размером/шириной в зависимости от величины данных.

Синтаксис:

seaborn.lineplot(x, y, data, size)

Пример 3:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="gear",style="gear",size="gear")
plt.show()

Входной набор данных:

Выход:

Использование другой цветовой палитры вместе с линейным графиком

Цветовая карта и палитра Seaborn определяют цветовой диапазон для моделей визуализации. Параметр palette вместе с hue можно использовать для определения схемы кодирования цвета с точки зрения переменной данных.

Для получения дополнительных цветовых палитр вы можете перейти по ссылке здесь: Цветовая палитра

Синтаксис:

seaborn.lineplot(x,y,data,hue,palette)

Пример:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
 
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="gear", palette = "Set1")
plt.show()

Выход:

Добавление планок погрешностей к линейному графику

Линейные графики можно использовать для определения уровней достоверности/интервалов на графиках для отображения коэффициентов ошибок с помощью параметра err_style.

Синтаксис:

seaborn.lineplot(x,y,data,err_style="bars")

Пример:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "cyl", y = "mpg",data=info, err_style="bars")
plt.show()

Выход:

Установка другого стиля с помощью функции seaborn.set()

Функцию Python seaborn.set() можно использовать для отображения графика в другом стиле фона.

Синтаксис:

seaborn.set(style)

Пример:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "cyl", y = "mpg",data=info,hue="gear")
sns.set(style='dark',)
plt.show()

Выход:

Заключение

Таким образом, в этой статье мы поняли линейные графики и связанные с ними варианты.

Я настоятельно рекомендую читателям ознакомиться с учебным пособием по Python Matplotlib, чтобы лучше понять линейные графики.

Рекомендации

  • График Seaborn Line — официальная документация