Eco Life & Bioteco

biology and technology in MY LIFE

공부/R & Python

[R]데이터 핸들링 연습(2020.12.15)

bioteco 2020. 12. 15. 02:40

빅데이터를 만지게 되어 엑셀로는 도저히 답이 없어서

R로 조금씩 코딩을 해보려고 합니다.

아직 초보라서...

혼자 스스로 하나씩 찾아보면서 공부해보고 있습니다.

혼자 코딩을 하면서 혹시라도

도움이 되시는 분들이 있다면 사용해보시는 것도 괜찮을 것 같습니다... ^^;;

library(readxl)
library(dplyr)
ta <- read_xlsx("c:/필요한 자료를 불러오세요.xlsx") #데이터 불러오기
data.frame(ta)
ta[is.na(ta)] = 0 # NA 값을 0으로 변환
taname <- table(ta$변수명) #변수명 추출
nm <- data.frame(head(taname, n = 334)) #변수 빈도 확인, n= 총 갯수
nm
ex <- filter(.data = ta, 변수명 == "가곡") #원하는 데이터 추출
summary(ex) #데이터 구조 확인

 

     변수명               년             a               b             c   
 Length:10          Min.   :2010   Min.   :8.10   Min.   :10.20   Min.   :0.70  
 Class :character   1st Qu.:2012   1st Qu.:8.20   1st Qu.:11.03   1st Qu.:0.80  
 Mode  :character   Median :2014   Median :8.20   Median :11.20   Median :1.05  
                    Mean   :2014   Mean   :8.25   Mean   :11.27   Mean   :0.97  
                    3rd Qu.:2017   3rd Qu.:8.35   3rd Qu.:11.53   3rd Qu.:1.10  
                    Max.   :2019   Max.   :8.50   Max.   :12.50   Max.   :1.20  
       d               e               f                 g                h    
 Min.   :2.30   Min.   : 2.10   Min.   :2.409     Min.   :0.01300   Min.   :0.000  
 1st Qu.:2.50   1st Qu.: 2.40   1st Qu.:2.625     1st Qu.:0.01575   1st Qu.:1.625  
 Median :2.55   Median : 3.80   Median :2.875     Median :0.02550   Median :1.950  
 Mean   :2.65   Mean   : 4.88   Mean   :2.966     Mean   :0.02500   Mean   :1.820  
 3rd Qu.:2.80   3rd Qu.: 5.35   3rd Qu.:3.252     3rd Qu.:0.02850   3rd Qu.:2.225  
 Max.   :3.20   Max.   :14.30   Max.   :3.900     Max.   :0.05400   Max.   :3.100  
        i               j 
 Min.   :12.20   Min.   :205.0     
 1st Qu.:13.80   1st Qu.:232.2     
 Median :14.55   Median :255.5     
 Mean   :14.53   Mean   :251.1     
 3rd Qu.:15.57   3rd Qu.:274.5     
 Max.   :16.40   Max.   :286.0

중앙값을 원해서 summary() 함수를 이용하여

많은 데이터 값을 한눈에 확인 할 수 있었습니다.

정말 코딩 잘하시는 분들이 하시는 것들만 보면서

따라하기만 할 때에는 "별거 없네~"라고 생각했는데...

막상 제가 필요한 코드를 직접 생각하면서 맞추려고 하니

생각보다 힘든 점도 있네요... ㅎㅎ;;

앞으로도 혼자 공부한 내용들 조금씩 업로드하려고합니다~

누군가에게는 도움이 되기를 바라며...