Поиск по сайту:

Чтение файла CSV во фреймы данных в R


С помощью специальных функций, предлагаемых R, чтение CSV-файлов во фреймы данных стало намного проще.

CSV вариант №

CSV расширяется как запятая, разделенная, значения. В этом файле сохраненные значения разделены запятой. Этот процесс хранения данных намного проще.

Почему CSV является наиболее часто используемым форматом файлов для хранения данных?

Хранение данных в таблице Excel является наиболее распространенной практикой во многих компаниях. В большинстве фирм люди хранят данные в виде значений, разделенных запятыми (CSV), поскольку этот процесс проще, чем создание обычных электронных таблиц. Позже они могут использовать встроенные пакеты R для чтения и анализа данных.

Будучи самым популярным и мощным языком программирования статистического анализа, R предлагает специальные функции для чтения данных в организованные фреймы данных из файла CSV.

Чтение файла CSV во фрейм данных

В этом коротком примере мы увидим, как мы можем прочитать CSV-файл в организованные фреймы данных.

Первым делом в этом процессе нужно получить и настроить рабочий каталог. Вам нужно выбрать рабочий путь файла CSV.

1. Настройка рабочего каталога

Здесь вы можете проверить рабочий каталог по умолчанию с помощью функции getwd(), а также изменить каталог с помощью функции setwd().

>getwd() #Shows the default working directory 

---->   "C:/Users/Dell/Documents"

> setwd("C:\Users\Dell\Documents\R-test data") #to set the new working Directory

> getwd() #you can see the updated working directory

---> "C:/Users/Dell/Documents/R-test data"

2. Импорт и чтение набора данных/файла CSV

После настройки рабочего пути вам необходимо импортировать набор данных или файл CSV, как показано ниже.

> readfile <- read.csv("testdata.txt")

Выполните приведенную выше строку кода в R studio, чтобы получить фрейм данных, как показано ниже.

Чтобы проверить класс переменной «readfile», выполните приведенный ниже код.

> class(readfile)

---> "data.frame"            

На изображении выше вы можете увидеть фрейм данных, который включает в себя информацию об именах студентов, их идентификаторах, отделах, поле и оценках.

3. Извлечение информации об ученике из CSV-файла

После получения фрейма данных вы можете проанализировать данные. Вы можете извлечь конкретную информацию из фрейма данных.

Для получения наивысших оценок, набранных учащимися,

>marks <- max(data$Marks.Scored) #this will give you the highest marks

#To extract the details of a student who scored the highest marks,

> data <- read.csv("traindata.csv")

> Marks <- max(data$Marks.Scored)

> retval <- subset(data, Marks.Scored == max(Marks.Scored))   #This will
 extract the details of the student who secured highest marks 

> View(retval)

Чтобы извлечь данные о студентах, которые учатся на кафедре химии,

> readfile <- read.csv("traindata.csv")

> retval <- subset( data, Department == "chemistry")  # This will extract the student details who are in Biochemistry department 
 
> View(retval)

Заключение

С помощью этого процесса вы можете читать CSV-файлы в R с использованием функции read.csv(\\). В этом руководстве рассказывается, как импортировать CSV-файл, читать CSV-файл и извлекать определенную информацию из фрейма данных.

Я использовал R studio для этого проекта. RStudio также предлагает отличные функции, такие как консоль, редактор и среда. В любом случае вы можете использовать другие редакторы, такие как Thinn-R, редактор Crimson и т. д. Я надеюсь, что это руководство поможет вам понять, как читать CSV-файлы в R и извлекать некоторую информацию из фрейма данных.

Подробнее читайте: https://cran.r-project.org/manuals.html