Визуализация данных с помощью линейного графика Seaborn
Привет, народ! В этой статье мы рассмотрим учебник Seaborn и разберемся с линейным графиком Seaborn. Недавно мы рассмотрели тепловые карты Seaborn, поэтому не стесняйтесь взглянуть, если вам интересно узнать больше о тепловых картах.
Что такое линейный график?
Seaborn как библиотека используется в визуализации данных из моделей, построенных на основе набора данных, для прогнозирования результата и анализа изменений в данных.
Линейные графики Seaborn отображают взаимосвязь между непрерывными и категориальными значениями в формате непрерывных точек данных.
На протяжении всей этой статьи мы будем использовать приведенный ниже набор данных для управления данными и формирования линейного графика. Пожалуйста, просмотрите приведенный ниже снимок набора данных, прежде чем двигаться дальше.
В приведенном ниже наборе данных переменные данных — «cyl», «vs», «am», «gear» и «carb» являются категориальными переменными, поскольку все значения данных подпадают под определенную категорию или диапазон значений.
В то время как оставшийся столбец данных подпадает под целые/непрерывные переменные, потому что они несут с собой дискретные целые значения.
Входной набор данных:
Построение вашего первого линейного графика Seaborn
Чтобы начать с линейных графиков, нам нужно установить и импортировать библиотеку Seaborn в среду Python с помощью следующей команды:
Синтаксис:
pip install seaborn
После завершения установки импортируйте библиотеку в текущую рабочую среду и используйте функции
Синтаксис:
import seaborn
Для всей серии Seaborn мы будем использовать библиотеку Matplotlib, чтобы отображать данные и отображать их надлежащим образом.
Создание однолинейного графика с Seaborn
Мы можем предоставить дискретные значения или использовать наборы данных для создания линейного графика Seaborn.
Синтаксис:
seaborn.lineplot(x, y, data)
x
: переменная данных для оси Xy
: переменная данных для оси Y.данные
: объект, указывающий на весь набор данных или значения данных.
Пример 1: Использование случайных данных для создания линейного графика Seaborn
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
Year = [2012, 2014, 2016, 2020, 2021, 2022, 2018]
Profit = [80, 75.8, 74, 65, 99.5, 19, 33.6]
data_plot = pd.DataFrame({"Year":Year, "Profit":Profit})
sns.lineplot(x = "Year", y = "Profit", data=data_plot)
plt.show()
На приведенном ниже линейном графике мы можем наблюдать линейную зависимость между двумя переменными данных — «Год» и «Прибыль».
Выход:
Пример 2. Использование набора данных для создания линейного графика и отображения связи между столбцами данных.
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg",data=info)
sns.set(style='dark',)
plt.show()
Входной набор данных:
Выход:
Несколько графиков Seaborn Line
Мы можем создать несколько строк для визуализации данных в одном пространстве или на одном графике. Мы можем использовать одни и те же или несколько столбцов данных/переменных данных и отображать взаимосвязь между ними в целом.
1. Использование параметра hue для создания цветового оттенка для нескольких точек данных
Параметр hue
можно использовать для группировки различных переменных набора данных, и он поможет отобразить взаимосвязь между столбцами данных по оси x и оси y со столбцом, переданным в качестве значения параметра.
Синтаксис:
seaborn.lineplot(x,y,data,hue)
Пример:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="cyl")
plt.show()
Как видно на приведенном ниже графике, он представляет собой три линии с разной цветовой схемой, чтобы показать взаимосвязь между «драт», «миль на галлон» и «цил» соответственно.
Выход:
2. Использование параметра стиля для построения различных типов линий
Мы можем установить для параметра стиля значение, которое мы хотели бы отображать вместе с осями x и y, а также указать различные структуры линий: тире, точки (маркеры) и т. д.
Синтаксис:
seaborn.lineplot(x, y, data, style)
Пример 2:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="cyl", style="cyl")
plt.show()
Как видно, график представляет значения «cyl» по отношению к «милям на галлон» и «дратам» с различной структурой линий, т. е. простой линией, штрихами и метками.
Выход:
3. Использование параметра размера для построения нескольких линейных графиков в Seaborn.
Мы даже можем использовать параметр size
функции seaborn.lineplot()
для представления взаимосвязей нескольких переменных данных с изменяющимся размером линии для построения. Таким образом, он действует как группирующая переменная с разным размером/шириной в зависимости от величины данных.
Синтаксис:
seaborn.lineplot(x, y, data, size)
Пример 3:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="gear",style="gear",size="gear")
plt.show()
Входной набор данных:
Выход:
Использование другой цветовой палитры вместе с линейным графиком
Цветовая карта и палитра Seaborn определяют цветовой диапазон для моделей визуализации. Параметр palette
вместе с hue
можно использовать для определения схемы кодирования цвета с точки зрения переменной данных.
Для получения дополнительных цветовых палитр вы можете перейти по ссылке здесь: Цветовая палитра
Синтаксис:
seaborn.lineplot(x,y,data,hue,palette)
Пример:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="gear", palette = "Set1")
plt.show()
Выход:
Добавление планок погрешностей к линейному графику
Линейные графики можно использовать для определения уровней достоверности/интервалов на графиках для отображения коэффициентов ошибок с помощью параметра err_style
.
Синтаксис:
seaborn.lineplot(x,y,data,err_style="bars")
Пример:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "cyl", y = "mpg",data=info, err_style="bars")
plt.show()
Выход:
Установка другого стиля с помощью функции seaborn.set()
Функцию Python seaborn.set()
можно использовать для отображения графика в другом стиле фона.
Синтаксис:
seaborn.set(style)
Пример:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "cyl", y = "mpg",data=info,hue="gear")
sns.set(style='dark',)
plt.show()
Выход:
Заключение
Таким образом, в этой статье мы поняли линейные графики и связанные с ними варианты.
Я настоятельно рекомендую читателям ознакомиться с учебным пособием по Python Matplotlib, чтобы лучше понять линейные графики.
Рекомендации
- График Seaborn Line — официальная документация