Поиск по сайту:

Функция unique() в программировании на R


Функция unique() в R используется для исключения или удаления повторяющихся значений или строк, присутствующих в векторе, а также в матрице.

Функция unique() нашла свое важное значение в EDA (исследовательском анализе данных), поскольку она напрямую идентифицирует и устраняет повторяющиеся значения в данных.

В этой статье мы собираемся раскрыть различное применение функции unique() в программировании на R. Катаемся!!!

Идея получения уникальных значений

Что ж, прежде чем углубляться в тему, хорошо бы узнать, что за ней стоит. В данном случае это уникальные значения. Уникальная функция вернет уникальные значения, удалив повторяющиеся счетчики.

Диаграмма говорит вам, что уникальная функция будет искать дубликаты и устранять их, чтобы возвращать уникальные значения. В следующих разделах вы найдете множество иллюстраций, которые научат вас чему-то хорошему.

Синтаксис функции Unique() в R

Уникальный: Функция unique() используется для выявления и устранения повторяющихся счетчиков, присутствующих в данных.

unique(x)

Где:

X=Это может быть вектор, фрейм данных или матрица.

Простой пример функции unique() в R

Если у вас есть вектор с повторяющимися значениями, то с помощью функции unique() вы можете легко удалить их, используя одну строку кода.

Посмотрим, как это работает…

#An input vector having duplicate values
df<-c(1,2,3,2,4,5,1,6,8,9,8,6)

#elimnates the duplicate values in the vector 
unique(df)
Output = 1 2 3 4 5 6 8 9

На приведенном выше рисунке вы можете заметить, что входной вектор имеет много повторяющихся значений.

После того, как мы передали этот вектор уникальной функции, она удаляет все повторяющиеся значения и возвращает только уникальные значения, как показано выше.

Поиск уникальных значений в матрице

Теперь мы собираемся найти повторяющиеся значения, присутствующие в матрице, и устранить их с помощью уникальной функции.

Для этого мы должны сначала создать матрицу из «n» строк и столбцов с повторяющимися значениями.

Чтобы создать матрицу, запустите приведенный ниже код.

#creates a 6 x 4 matrix having 24 elements 
df<-matrix(rep(1:20,length.out=24),nrow = 6,ncol=4,byrow = T)
      [,1] [,2] [,3] [,4]
[1,]    1    2    3    4
[2,]    5    6    7    8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20
[6,]    1    2    3    4

Как вы можете легко заметить, последняя строка полностью дублируется. Все, что вам нужно сделать, это с помощью функции unique() удалить эти повторяющиеся значения.

#removes the duplicate values
unique(df)
       [,1] [,2] [,3] [,4]
[1,]    1    2    3    4
[2,]    5    6    7    8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20

Ура!

Ты сделал это! Все повторяющиеся значения, присутствующие в матрице, были удалены уникальной функцией, и она вернула матрицу, имеющую только уникальные значения.

Поиск уникальных значений в кадре данных

До сих пор мы работали над векторами и матрицами, чтобы извлечь уникальные значения, устранив дубликаты.

В этом разделе давайте сосредоточимся на получении уникальных значений, присутствующих во фрейме данных.

Чтобы создать фрейм данных, запустите приведенный ниже код.

#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#dataframe
Class_data
   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male

Это фрейм данных, который имеет количество дубликатов, как показано выше. Давайте применим уникальную функцию, чтобы избавиться от присутствующего здесь повторяющегося значения.

unique(Class_data)
   Student Age  Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male

Ух ты! Уникальная функция вернула все уникальные значения, присутствующие в фрейме данных, удалив повторяющиеся значения.

Точно так же, используя функцию unique() в R, вы можете легко получить уникальные значения, присутствующие в данных.

Поиск уникальных значений определенного столбца

Да, а что, если вам нужно получить уникальные значения из определенного столбца, а не из набора данных?

Не беспокойтесь, используя функцию unique(), мы также можем получить уникальные значения из определенного столбца, как показано ниже.

#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#dataframe
Class_data
   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male

Хорошо, я беру тот же фрейм данных, который мы использовали в последних разделах для простоты понимания.

Давайте используем уникальную функцию, чтобы избавиться от повторяющихся значений.

unique(Class_data$Student)
Output = "Naman" "Megh"  "Mark" 

Таким же образом мы также можем получить уникальные значения в столбцах «Возраст» или «Пол».

unique(Class_data$Gender)
"Male"   "Female"

Нахождение длины уникальных значений

В этом разделе мы собираемся получить количество уникальных значений в данных. Это приложение более полезно, чтобы лучше узнать ваши данные и подготовить их для дальнейшего анализа.

#importing the dataset
datasets::BOD
    Time  demand
1    1     8.3
2    2    10.3
3    3    19.0
4    4    16.0
5    5    15.6
6    7    19.8

ну, здесь мы используем набор данных БПК. Давайте сначала найдем уникальные значения, за которыми последует счет.

#returns the unique value
unique(BOD$demand)
Output = 8.3  10.3 19.0  16.0  15.6  19.8

Хорошо, теперь у нас есть уникальные значения, представленные в столбце спроса в наборе данных БПК.

Теперь мы готовы найти количество уникальных значений.

#returns the length of unique values
length(unique(BOD$demand))
Output =  6

Подведение итогов

Что ж, функция unique() в R очень полезна, когда речь идет об EDA (исследовательском анализе данных).

Это поможет вам лучше понять ваши данные вместе с конкретными подсчетами.

В этой статье рассказывается о множестве приложений и вариантов использования функции unique(). Удачного разбора!!!

Подробнее: Документация R