Поиск по сайту:

Функции head() и tail() в R — подробный справочник


Функции head() и tail() в R часто используются для чтения первых и последних n строк набора данных.

Вы можете быть работающим профессионалом, программистом или новичком, но в некоторых случаях вам необходимо читать большие наборы данных и анализировать их.

Очень сложно переварить огромный набор данных, который содержит более 20 столбцов или даже больше и тысячи строк.

В этой статье будут рассмотрены функции head() и tail() в R, которые возвращают первую и последнюю n строк соответственно.

Синтаксис функций head() и tail()

Давайте быстро посмотрим, как выглядят методы head() и tail().

Head(): функция, которая возвращает первые n строк набора данных.

head(x,n=number)

Tail(): функция, которая возвращает последние n строк набора данных.

tail(x,n=number)

Где,

x=входной набор данных/кадр данных.

n=количество строк, которые должна отображать функция.

Функция head() в R

Функция head() в R используется для отображения первых строк n, присутствующих во фрейме входных данных.

В этом разделе мы собираемся получить первые n строк, используя функцию head().

Для этого процесса мы собираемся импортировать набор данных «радужная оболочка», который по умолчанию доступен в R studio.

#importing the dataset
df<-datasets::iris

#returns first n rows of the data
head(df)

Вы можете видеть, что функция head() вернула первые 6 строк, присутствующих в наборе данных радужной оболочки.

Функция head() с пользовательскими строками

По умолчанию функция head() возвращает первые 6 строк по умолчанию.

Но что, если вы хотите увидеть первые 10, 15 строк набора данных?

Что ж, вы могли заметить в синтаксисе, что вы можете передать числовой аргумент функции head для отображения определенного количества строк.

Посмотрим, как это работает.

#importing the data
df<-datasets::airquality

#returns first 10 rows
head(df,n=10)

Теперь вы можете видеть, что функция head() вернула первые 10 строк, указанные нами во входных данных. Вы также можете написать тот же запрос, что и head(df,10), и получить те же результаты.

Вот как работает функция head().

Функция head() для получения первых n значений в определенном столбце

Что ж, в приведенных выше разделах функция head() возвращала весь набор значений, присутствующих в первых n строках набора данных.

Но знаете ли вы, что функция head() способна возвращать значения определенного столбца?

Да, вы правильно прочитали!

С помощью одного фрагмента кода вы можете получить первые n значений указанного столбца.

#importing the data
df<-datasets::mtcars

#returns first 10 values in column 'mpg'
head(mtcars$mpg,10)
Output = 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2

Как и в приведенном выше примере, вы можете легко указать имя требуемого столбца вместе с требуемым количеством строк. Вот и все.

Функция head() проникнет в данные и вернет требуемое.

Функция tail() в R

Функция tail() в R, в частности, используется для отображения последних n строк набора данных, в отличие от функции head().

В этом разделе будет показана функция tail() и ее использование в R.

Для этой цели мы используем набор данных «качество воздуха».

#importing the dataset 
df<-datasets::airquality

#returns last n rows of the data
tail(df)

Что ж, в этом выводе вы можете увидеть последние 6 строк набора данных радужной оболочки. Вот что будет делать функция tail() в R.

Функция tail() с пользовательскими строками

Подобно функции head(), функция tail() может возвращать последние n строк указанного числа.

#importing the data
df<-datasets::airquality

#returns the last 10 values 
tail(df,10)

Здесь вы можете видеть, что функция tail() вернула последние 10 строк, как указано нами в коде.

Функция tail() для получения первых n значений в определенном столбце

Функции head() и tail() выполняют одну и ту же работу совершенно противоположным образом.

Вы также можете использовать хвостовую функцию для получения последних n значений определенного столбца.

Посмотрим, как это работает!

#importing the data
df<-datasets::mtcars

#returns the last 10 values of column 'mpg'
tail(mtcars$mpg,10)
Output = 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7 15.0 21.4

Если вы можете получить этот результат, поздравляем! Вы сделали это.

Как и в этом примере, вы можете указать имя столбца вместе с количеством строк, чтобы получить требуемые значения.

Подведение итогов

Функции head() и tail() в R являются наиболее полезными функциями, когда речь идет о чтении и анализе данных.

Вы можете получить настраиваемые значения с помощью этих функций, как показано выше. Простой синтаксис, эффективные результаты! - функции head() и tail() в R.

На этом пока все, приятного анализа!!!

Дополнительное исследование: документация R