Ковариация и корреляция в программировании на R

Здравствуйте, читатели! В этой статье мы подробно сосредоточимся на двух важных параметрах статистики — ковариации и корреляции в программировании на R.

Итак, начнем!!

Ковариация в программировании на R

В статистике ковариация — это мера отношения между двумя переменными набора данных. То есть он показывает, как две переменные связаны друг с другом.

Например, когда две переменные имеют высокую положительную корреляцию, переменные движутся вперед в одном направлении.

Ковариация полезна при предварительной обработке данных перед моделированием в области науки о данных и машинного обучения.

В программировании на R мы используем функцию cov() для вычисления ковариации между двумя кадрами данных или векторами.

Пример:

Мы предоставляем следующие три параметра функции cov():

x – вектор 1
y – вектор 2
метод — любой метод расчета ковариации, например Пирсона, Спирмена. По умолчанию используется метод Пирсона.

a <- c(2,4,6,8,10) 

b <- c(1,11,3,33,5) 

print(cov(a, b, method = "spearman"))

Выход:

> print(cov(a, b, method = "spearman")) 
[1] 1.25

Корреляция в программировании на R

Корреляция на статистической основе — это метод нахождения взаимосвязи между переменными с точки зрения движения данных. То есть это помогает нам проанализировать влияние изменений, внесенных в одну переменную, на другую переменную набора данных.

Когда две переменные сильно (положительно) коррелированы, мы говорим, что переменные отображают одну и ту же информацию и оказывают одинаковое влияние на другие переменные данных в наборе данных.

Функция cor() в R позволяет вычислить корреляцию между переменными набора данных или вектора.

Пример:

a <- c(2,4,6,8,10) 

b <- c(1,11,3,33,5) 

corr = cor(a,b)
print(corr)

print(cor(a, b, method = "spearman"))

Выход:

> print(corr)
[1] 0.3629504

> print(cor(a, b, method = "spearman")) 
[1] 0.5

Ковариация корреляции в R

R предоставляет нам функцию cov2cor() для преобразования значения ковариации в корреляцию. Он преобразует ковариационную матрицу в корреляционную матрицу значений.

Примечание. В этом случае векторы или значения, передаваемые для построения cov(), должны быть квадратной матрицей!

Пример:

Здесь мы передали два вектора a и b так, что они подчиняются всем условиям квадратной матрицы. Далее, используя функцию cov2cor(), мы получаем соответствующую корреляционную матрицу для каждой пары значений данных.

a <- c(2,4,6,8) 

b <- c(1,11,3,33) 

covar = cov(a,b)
print(covar)

res = cov2cor(covar)
print(res)

Выход:

> covar = cov(a,b)
> print(covar)
[1] 29.33333

> print(res)
     [,1] [,2] [,3]
[1,] 6000   21 1200
[2,]    5   32 2100
[3,]   12  500 3200

Заключение

На этом мы подошли к концу этой темы. Здесь мы узнали о встроенных функциях для вычисления корреляции и ковариации в R. Более того, мы даже видели функцию в R, которая помогает нам преобразовать значение ковариации в данные корреляции.

Не стесняйтесь комментировать ниже, если у вас возникнут какие-либо вопросы. Чтобы узнать больше о таких сообщениях, связанных с R, следите за обновлениями.

А пока удачного обучения!! :)