Ковариация и корреляция в программировании на R
Здравствуйте, читатели! В этой статье мы подробно сосредоточимся на двух важных параметрах статистики — ковариации и корреляции в программировании на R.
Итак, начнем!!
Ковариация в программировании на R
В статистике ковариация — это мера отношения между двумя переменными набора данных. То есть он показывает, как две переменные связаны друг с другом.
Например, когда две переменные имеют высокую положительную корреляцию, переменные движутся вперед в одном направлении.
Ковариация полезна при предварительной обработке данных перед моделированием в области науки о данных и машинного обучения.
В программировании на R мы используем функцию cov()
для вычисления ковариации между двумя кадрами данных или векторами.
Пример:
Мы предоставляем следующие три параметра функции cov():
- x – вектор 1
- y – вектор 2
- метод — любой метод расчета ковариации, например Пирсона, Спирмена. По умолчанию используется метод Пирсона.
a <- c(2,4,6,8,10)
b <- c(1,11,3,33,5)
print(cov(a, b, method = "spearman"))
Выход:
> print(cov(a, b, method = "spearman"))
[1] 1.25
Корреляция в программировании на R
Корреляция на статистической основе — это метод нахождения взаимосвязи между переменными с точки зрения движения данных. То есть это помогает нам проанализировать влияние изменений, внесенных в одну переменную, на другую переменную набора данных.
Когда две переменные сильно (положительно) коррелированы, мы говорим, что переменные отображают одну и ту же информацию и оказывают одинаковое влияние на другие переменные данных в наборе данных.
Функция cor()
в R позволяет вычислить корреляцию между переменными набора данных или вектора.
Пример:
a <- c(2,4,6,8,10)
b <- c(1,11,3,33,5)
corr = cor(a,b)
print(corr)
print(cor(a, b, method = "spearman"))
Выход:
> print(corr)
[1] 0.3629504
> print(cor(a, b, method = "spearman"))
[1] 0.5
Ковариация корреляции в R
R предоставляет нам функцию cov2cor()
для преобразования значения ковариации в корреляцию. Он преобразует ковариационную матрицу в корреляционную матрицу значений.
Примечание. В этом случае векторы или значения, передаваемые для построения cov(), должны быть квадратной матрицей!
Пример:
Здесь мы передали два вектора a и b так, что они подчиняются всем условиям квадратной матрицы. Далее, используя функцию cov2cor(), мы получаем соответствующую корреляционную матрицу для каждой пары значений данных.
a <- c(2,4,6,8)
b <- c(1,11,3,33)
covar = cov(a,b)
print(covar)
res = cov2cor(covar)
print(res)
Выход:
> covar = cov(a,b)
> print(covar)
[1] 29.33333
> print(res)
[,1] [,2] [,3]
[1,] 6000 21 1200
[2,] 5 32 2100
[3,] 12 500 3200
Заключение
На этом мы подошли к концу этой темы. Здесь мы узнали о встроенных функциях для вычисления корреляции и ковариации в R. Более того, мы даже видели функцию в R, которая помогает нам преобразовать значение ковариации в данные корреляции.
Не стесняйтесь комментировать ниже, если у вас возникнут какие-либо вопросы. Чтобы узнать больше о таких сообщениях, связанных с R, следите за обновлениями.
А пока удачного обучения!! :)