Функции head() и tail() в R — подробный справочник
Функции head() и tail() в R часто используются для чтения первых и последних n строк набора данных.
Вы можете быть работающим профессионалом, программистом или новичком, но в некоторых случаях вам необходимо читать большие наборы данных и анализировать их.
Очень сложно переварить огромный набор данных, который содержит более 20 столбцов или даже больше и тысячи строк.
В этой статье будут рассмотрены функции head() и tail() в R, которые возвращают первую и последнюю n строк соответственно.
Синтаксис функций head() и tail()
Давайте быстро посмотрим, как выглядят методы head() и tail().
Head(): функция, которая возвращает первые n строк набора данных.
head(x,n=number)
Tail(): функция, которая возвращает последние n строк набора данных.
tail(x,n=number)
Где,
x=входной набор данных/кадр данных.
n=количество строк, которые должна отображать функция.
Функция head() в R
Функция head() в R используется для отображения первых строк n, присутствующих во фрейме входных данных.
В этом разделе мы собираемся получить первые n строк, используя функцию head().
Для этого процесса мы собираемся импортировать набор данных «радужная оболочка», который по умолчанию доступен в R studio.
#importing the dataset
df<-datasets::iris
#returns first n rows of the data
head(df)
Вы можете видеть, что функция head() вернула первые 6 строк, присутствующих в наборе данных радужной оболочки.
Функция head() с пользовательскими строками
По умолчанию функция head() возвращает первые 6 строк по умолчанию.
Но что, если вы хотите увидеть первые 10, 15 строк набора данных?
Что ж, вы могли заметить в синтаксисе, что вы можете передать числовой аргумент функции head для отображения определенного количества строк.
Посмотрим, как это работает.
#importing the data
df<-datasets::airquality
#returns first 10 rows
head(df,n=10)
Теперь вы можете видеть, что функция head() вернула первые 10 строк, указанные нами во входных данных. Вы также можете написать тот же запрос, что и head(df,10), и получить те же результаты.
Вот как работает функция head().
Функция head() для получения первых n значений в определенном столбце
Что ж, в приведенных выше разделах функция head() возвращала весь набор значений, присутствующих в первых n строках набора данных.
Но знаете ли вы, что функция head() способна возвращать значения определенного столбца?
Да, вы правильно прочитали!
С помощью одного фрагмента кода вы можете получить первые n значений указанного столбца.
#importing the data
df<-datasets::mtcars
#returns first 10 values in column 'mpg'
head(mtcars$mpg,10)
Output = 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2
Как и в приведенном выше примере, вы можете легко указать имя требуемого столбца вместе с требуемым количеством строк. Вот и все.
Функция head() проникнет в данные и вернет требуемое.
Функция tail() в R
Функция tail() в R, в частности, используется для отображения последних n строк набора данных, в отличие от функции head().
В этом разделе будет показана функция tail() и ее использование в R.
Для этой цели мы используем набор данных «качество воздуха».
#importing the dataset
df<-datasets::airquality
#returns last n rows of the data
tail(df)
Что ж, в этом выводе вы можете увидеть последние 6 строк набора данных радужной оболочки. Вот что будет делать функция tail() в R.
Функция tail() с пользовательскими строками
Подобно функции head(), функция tail() может возвращать последние n строк указанного числа.
#importing the data
df<-datasets::airquality
#returns the last 10 values
tail(df,10)
Здесь вы можете видеть, что функция tail() вернула последние 10 строк, как указано нами в коде.
Функция tail() для получения первых n значений в определенном столбце
Функции head() и tail() выполняют одну и ту же работу совершенно противоположным образом.
Вы также можете использовать хвостовую функцию для получения последних n значений определенного столбца.
Посмотрим, как это работает!
#importing the data
df<-datasets::mtcars
#returns the last 10 values of column 'mpg'
tail(mtcars$mpg,10)
Output = 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7 15.0 21.4
Если вы можете получить этот результат, поздравляем! Вы сделали это.
Как и в этом примере, вы можете указать имя столбца вместе с количеством строк, чтобы получить требуемые значения.
Подведение итогов
Функции head() и tail() в R являются наиболее полезными функциями, когда речь идет о чтении и анализе данных.
Вы можете получить настраиваемые значения с помощью этих функций, как показано выше. Простой синтаксис, эффективные результаты! - функции head() и tail() в R.
На этом пока все, приятного анализа!!!
Дополнительное исследование: документация R