본문 바로가기

R 프로그래밍

R 기초 - 데이터 읽고 객체 정보 확인하기

# CSV 파일 불러오기 

 1) read.csv : base R에서 기본적으로 제공하는 함수  

 2) read_csv : readr 패키지에서 제공하는 함수  -> 기본 Encoding이 UTF-8 

 

 

 

# read.csv 이용해서 파일 로딩

 

```{r}

dat<-read.csv(file="C:\\r_workspace\\data\\jungsun.csv", header=T)

head(dat)

```

* 경로 복사시 '\ 또는 \'는 \\로 변경해서 입력해줄 것

** 오류 발생 시 csv 파일에 값이 없는 빈 줄을 지워 볼 것

 

 

 

# read_csv 이용해서 파일 로딩  (readr 패키지 설치)

 

```{r}

install.packages("readr")     #readr 패키지 설치

library(readr)

dat<-read_csv("C:\\r_workspace\\data\\jungsun.csv")

View(dat)

```

 * View의 V는 대문자로 쓸 것!

 

만약, Column specification이 함께 정의되는 것이 싫다면, show_col_types = FALSE를 추가 

Use `spec()` to retrieve the full column specification for this data.
Specify the column types or set `show_col_types = FALSE` to quiet this message.

 dat<-read_csv("C:\\r_workspace\\data\\jungsun.csv", show_col_types = FALSE )

 

 

만약,  View로 불러온 값의 한글이 깨져보이는 경우 인코딩 변경

dat2<-read_csv("C:\\r_workspace\\data\\jungsun.csv", locale=locale("ko",encoding="euc-kr"))

 

 

 


# 객체 정보 보기 

class(dat)     # 데이터유형 확인 

 

str(dat)    # 데이터프레임 명세 

 

dim(dat)    데이터프레임 크기 (행과 열)

 

names(dat)    # 데이터프레임의 컬럼명

 

dat[[2]]     # 지정한 단일 컬럼값만 보기

 

dat[["sea"]]    # 특정 컬럼값만 보기 

 

head(dat)    # 첫 6행 보기

 

tail(dat)     # 마지막 6행 보기

 

head(dat,3)     # 첫 3행까지만 보기

 

summary(dat)   # dat  각 변수(컬럼)에 대한 기본통계 요약

  

# dat의 temp변수 추출하여 tem 벡터변수 생성

```{r}

tem<-na.omit(dat$temp)

tem

```

*na.omit 함수로 결측값 제거