R & RStudio

R 프로그래밍 기본 - III

torukmakto 2023. 7. 6. 23:22

R에서 데이터를 읽어 들이는 방법에 대해 정리해 봅니다.

 

1. R에서 외부 파일 불러오기

    ▶ 파일 종류: csv 파일, excel 파일, txt 파일, xml / JASON 파일

    ▶ 관련 함수

         - read.csv(): csv 파일을 불러올 때.

         - read_excel(): excel 파일을 불러올 때. ('readxl' package 설치 필요)

         - read.table(): txt 파일을 불러올 때.

         - xmlToDataFrame(): xml 파일을 불러올 때. ('xml' package 설치 필요)

         - read_xml(): xml 파일을 불러올 때. ('xml2' package 설치 필요)

         - fromJSON(): JASON 파일을 불러올 때. ('jsonlite' package 설치 필요)

 

2. Working Directory 설정

     setwd(): Directory 경로를 " "로 싸서 () 안에 넣어 주면 됨.

 

setwd()

   혹은 Rstudio 메뉴에서 "Session >> Set Working Directory >> Choose Directory"

   에서 선택 하면 됨. 해당 작업 후 getwd() 명령어를 입력하면 결과를 확인할 수 있음.

 

RStudio 메뉴
getwd()

  3. 데이터 형태 확인 방법

     관련 함수

         - head(): 처음의 6개 row를 보여 줌.

         - tail(): 마지막의 6개 row를 보여 줌.

         - summary(): 기초통계량(최대, 최소, 평균, 4분위수 등)과 

                               결측치 개수를 보여 줌.(연속형 자료)

         - names(): 데이터에 사용된 변수명을 보여 줌

         - str(): 데이터의 전체 구조(자료의 형태, 변수명 등)를 보여 줌.

         - is.na(): 데이터의 결측치를 TRUE/FALSE로 보여 줌.

                        데이터가 있으면 'FALSE', 비어 있으면 'TRUE'