Функция unique() в программировании на R
Функция unique() в R используется для исключения или удаления повторяющихся значений или строк, присутствующих в векторе, а также в матрице.
Функция unique() нашла свое важное значение в EDA (исследовательском анализе данных), поскольку она напрямую идентифицирует и устраняет повторяющиеся значения в данных.
В этой статье мы собираемся раскрыть различное применение функции unique() в программировании на R. Катаемся!!!
Идея получения уникальных значений
Что ж, прежде чем углубляться в тему, хорошо бы узнать, что за ней стоит. В данном случае это уникальные значения. Уникальная функция вернет уникальные значения, удалив повторяющиеся счетчики.
Диаграмма говорит вам, что уникальная функция будет искать дубликаты и устранять их, чтобы возвращать уникальные значения. В следующих разделах вы найдете множество иллюстраций, которые научат вас чему-то хорошему.
Синтаксис функции Unique() в R
Уникальный: Функция unique() используется для выявления и устранения повторяющихся счетчиков, присутствующих в данных.
unique(x)
Где:
X=Это может быть вектор, фрейм данных или матрица.
Простой пример функции unique() в R
Если у вас есть вектор с повторяющимися значениями, то с помощью функции unique() вы можете легко удалить их, используя одну строку кода.
Посмотрим, как это работает…
#An input vector having duplicate values
df<-c(1,2,3,2,4,5,1,6,8,9,8,6)
#elimnates the duplicate values in the vector
unique(df)
Output = 1 2 3 4 5 6 8 9
На приведенном выше рисунке вы можете заметить, что входной вектор имеет много повторяющихся значений.
После того, как мы передали этот вектор уникальной функции, она удаляет все повторяющиеся значения и возвращает только уникальные значения, как показано выше.
Поиск уникальных значений в матрице
Теперь мы собираемся найти повторяющиеся значения, присутствующие в матрице, и устранить их с помощью уникальной функции.
Для этого мы должны сначала создать матрицу из «n» строк и столбцов с повторяющимися значениями.
Чтобы создать матрицу, запустите приведенный ниже код.
#creates a 6 x 4 matrix having 24 elements
df<-matrix(rep(1:20,length.out=24),nrow = 6,ncol=4,byrow = T)
[,1] [,2] [,3] [,4]
[1,] 1 2 3 4
[2,] 5 6 7 8
[3,] 9 10 11 12
[4,] 13 14 15 16
[5,] 17 18 19 20
[6,] 1 2 3 4
Как вы можете легко заметить, последняя строка полностью дублируется. Все, что вам нужно сделать, это с помощью функции unique() удалить эти повторяющиеся значения.
#removes the duplicate values
unique(df)
[,1] [,2] [,3] [,4]
[1,] 1 2 3 4
[2,] 5 6 7 8
[3,] 9 10 11 12
[4,] 13 14 15 16
[5,] 17 18 19 20
Ура!
Ты сделал это! Все повторяющиеся значения, присутствующие в матрице, были удалены уникальной функцией, и она вернула матрицу, имеющую только уникальные значения.
Поиск уникальных значений в кадре данных
До сих пор мы работали над векторами и матрицами, чтобы извлечь уникальные значения, устранив дубликаты.
В этом разделе давайте сосредоточимся на получении уникальных значений, присутствующих во фрейме данных.
Чтобы создать фрейм данных, запустите приведенный ниже код.
#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))
#dataframe
Class_data
Student Age Gender
1 Naman 22 Male
2 Megh 23 Female
3 Mark 24 Male
4 Naman 22 Male
5 Megh 23 Female
6 Mark 24 Male
Это фрейм данных, который имеет количество дубликатов, как показано выше. Давайте применим уникальную функцию, чтобы избавиться от присутствующего здесь повторяющегося значения.
unique(Class_data)
Student Age Gender
1 Naman 22 Male
2 Megh 23 Female
3 Mark 24 Male
Ух ты! Уникальная функция вернула все уникальные значения, присутствующие в фрейме данных, удалив повторяющиеся значения.
Точно так же, используя функцию unique() в R, вы можете легко получить уникальные значения, присутствующие в данных.
Поиск уникальных значений определенного столбца
Да, а что, если вам нужно получить уникальные значения из определенного столбца, а не из набора данных?
Не беспокойтесь, используя функцию unique(), мы также можем получить уникальные значения из определенного столбца, как показано ниже.
#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))
#dataframe
Class_data
Student Age Gender
1 Naman 22 Male
2 Megh 23 Female
3 Mark 24 Male
4 Naman 22 Male
5 Megh 23 Female
6 Mark 24 Male
Хорошо, я беру тот же фрейм данных, который мы использовали в последних разделах для простоты понимания.
Давайте используем уникальную функцию, чтобы избавиться от повторяющихся значений.
unique(Class_data$Student)
Output = "Naman" "Megh" "Mark"
Таким же образом мы также можем получить уникальные значения в столбцах «Возраст» или «Пол».
unique(Class_data$Gender)
"Male" "Female"
Нахождение длины уникальных значений
В этом разделе мы собираемся получить количество уникальных значений в данных. Это приложение более полезно, чтобы лучше узнать ваши данные и подготовить их для дальнейшего анализа.
#importing the dataset
datasets::BOD
Time demand
1 1 8.3
2 2 10.3
3 3 19.0
4 4 16.0
5 5 15.6
6 7 19.8
ну, здесь мы используем набор данных БПК. Давайте сначала найдем уникальные значения, за которыми последует счет.
#returns the unique value
unique(BOD$demand)
Output = 8.3 10.3 19.0 16.0 15.6 19.8
Хорошо, теперь у нас есть уникальные значения, представленные в столбце спроса в наборе данных БПК.
Теперь мы готовы найти количество уникальных значений.
#returns the length of unique values
length(unique(BOD$demand))
Output = 6
Подведение итогов
Что ж, функция unique() в R очень полезна, когда речь идет об EDA (исследовательском анализе данных).
Это поможет вам лучше понять ваши данные вместе с конкретными подсчетами.
В этой статье рассказывается о множестве приложений и вариантов использования функции unique(). Удачного разбора!!!
Подробнее: Документация R