Чтение файла CSV во фреймы данных в R
С помощью специальных функций, предлагаемых R, чтение CSV-файлов во фреймы данных стало намного проще.
CSV вариант №
CSV расширяется как запятая, разделенная, значения. В этом файле сохраненные значения разделены запятой. Этот процесс хранения данных намного проще.
Почему CSV является наиболее часто используемым форматом файлов для хранения данных?
Хранение данных в таблице Excel является наиболее распространенной практикой во многих компаниях. В большинстве фирм люди хранят данные в виде значений, разделенных запятыми (CSV), поскольку этот процесс проще, чем создание обычных электронных таблиц. Позже они могут использовать встроенные пакеты R для чтения и анализа данных.
Будучи самым популярным и мощным языком программирования статистического анализа, R предлагает специальные функции для чтения данных в организованные фреймы данных из файла CSV.
Чтение файла CSV во фрейм данных
В этом коротком примере мы увидим, как мы можем прочитать CSV-файл в организованные фреймы данных.
Первым делом в этом процессе нужно получить и настроить рабочий каталог. Вам нужно выбрать рабочий путь файла CSV.
1. Настройка рабочего каталога
Здесь вы можете проверить рабочий каталог по умолчанию с помощью функции getwd(), а также изменить каталог с помощью функции setwd().
>getwd() #Shows the default working directory
----> "C:/Users/Dell/Documents"
> setwd("C:\Users\Dell\Documents\R-test data") #to set the new working Directory
> getwd() #you can see the updated working directory
---> "C:/Users/Dell/Documents/R-test data"
2. Импорт и чтение набора данных/файла CSV
После настройки рабочего пути вам необходимо импортировать набор данных или файл CSV, как показано ниже.
> readfile <- read.csv("testdata.txt")
Выполните приведенную выше строку кода в R studio, чтобы получить фрейм данных, как показано ниже.
Чтобы проверить класс переменной «readfile», выполните приведенный ниже код.
> class(readfile)
---> "data.frame"
На изображении выше вы можете увидеть фрейм данных, который включает в себя информацию об именах студентов, их идентификаторах, отделах, поле и оценках.
3. Извлечение информации об ученике из CSV-файла
После получения фрейма данных вы можете проанализировать данные. Вы можете извлечь конкретную информацию из фрейма данных.
Для получения наивысших оценок, набранных учащимися,
>marks <- max(data$Marks.Scored) #this will give you the highest marks
#To extract the details of a student who scored the highest marks,
> data <- read.csv("traindata.csv")
> Marks <- max(data$Marks.Scored)
> retval <- subset(data, Marks.Scored == max(Marks.Scored)) #This will
extract the details of the student who secured highest marks
> View(retval)
Чтобы извлечь данные о студентах, которые учатся на кафедре химии,
> readfile <- read.csv("traindata.csv")
> retval <- subset( data, Department == "chemistry") # This will extract the student details who are in Biochemistry department
> View(retval)
Заключение
С помощью этого процесса вы можете читать CSV-файлы в R с использованием функции read.csv(\\). В этом руководстве рассказывается, как импортировать CSV-файл, читать CSV-файл и извлекать определенную информацию из фрейма данных.
Я использовал R studio для этого проекта. RStudio также предлагает отличные функции, такие как консоль, редактор и среда. В любом случае вы можете использовать другие редакторы, такие как Thinn-R, редактор Crimson и т. д. Я надеюсь, что это руководство поможет вам понять, как читать CSV-файлы в R и извлекать некоторую информацию из фрейма данных.
Подробнее читайте: https://cran.r-project.org/manuals.html