R 프로그래밍 기본 - III
R에서 데이터를 읽어 들이는 방법에 대해 정리해 봅니다.
1. R에서 외부 파일 불러오기
▶ 파일 종류: csv 파일, excel 파일, txt 파일, xml / JASON 파일
▶ 관련 함수
- read.csv(): csv 파일을 불러올 때.
- read_excel(): excel 파일을 불러올 때. ('readxl' package 설치 필요)
- read.table(): txt 파일을 불러올 때.
- xmlToDataFrame(): xml 파일을 불러올 때. ('xml' package 설치 필요)
- read_xml(): xml 파일을 불러올 때. ('xml2' package 설치 필요)
- fromJSON(): JASON 파일을 불러올 때. ('jsonlite' package 설치 필요)
2. Working Directory 설정
▶ setwd(): Directory 경로를 " "로 싸서 () 안에 넣어 주면 됨.
혹은 Rstudio 메뉴에서 "Session >> Set Working Directory >> Choose Directory"
에서 선택 하면 됨. 해당 작업 후 getwd() 명령어를 입력하면 결과를 확인할 수 있음.
3. 데이터 형태 확인 방법
▶ 관련 함수
- head(): 처음의 6개 row를 보여 줌.
- tail(): 마지막의 6개 row를 보여 줌.
- summary(): 기초통계량(최대, 최소, 평균, 4분위수 등)과
결측치 개수를 보여 줌.(연속형 자료)
- names(): 데이터에 사용된 변수명을 보여 줌
- str(): 데이터의 전체 구조(자료의 형태, 변수명 등)를 보여 줌.
- is.na(): 데이터의 결측치를 TRUE/FALSE로 보여 줌.
데이터가 있으면 'FALSE', 비어 있으면 'TRUE'