빅데이터를 만지게 되어 엑셀로는 도저히 답이 없어서
R로 조금씩 코딩을 해보려고 합니다.
아직 초보라서...
혼자 스스로 하나씩 찾아보면서 공부해보고 있습니다.
혼자 코딩을 하면서 혹시라도
도움이 되시는 분들이 있다면 사용해보시는 것도 괜찮을 것 같습니다... ^^;;
library(readxl)
library(dplyr)
ta <- read_xlsx("c:/필요한 자료를 불러오세요.xlsx") #데이터 불러오기
data.frame(ta)
ta[is.na(ta)] = 0 # NA 값을 0으로 변환
taname <- table(ta$변수명) #변수명 추출
nm <- data.frame(head(taname, n = 334)) #변수 빈도 확인, n= 총 갯수
nm
ex <- filter(.data = ta, 변수명 == "가곡") #원하는 데이터 추출
summary(ex) #데이터 구조 확인
변수명 년 a b c
Length:10 Min. :2010 Min. :8.10 Min. :10.20 Min. :0.70
Class :character 1st Qu.:2012 1st Qu.:8.20 1st Qu.:11.03 1st Qu.:0.80
Mode :character Median :2014 Median :8.20 Median :11.20 Median :1.05
Mean :2014 Mean :8.25 Mean :11.27 Mean :0.97
3rd Qu.:2017 3rd Qu.:8.35 3rd Qu.:11.53 3rd Qu.:1.10
Max. :2019 Max. :8.50 Max. :12.50 Max. :1.20
d e f g h
Min. :2.30 Min. : 2.10 Min. :2.409 Min. :0.01300 Min. :0.000
1st Qu.:2.50 1st Qu.: 2.40 1st Qu.:2.625 1st Qu.:0.01575 1st Qu.:1.625
Median :2.55 Median : 3.80 Median :2.875 Median :0.02550 Median :1.950
Mean :2.65 Mean : 4.88 Mean :2.966 Mean :0.02500 Mean :1.820
3rd Qu.:2.80 3rd Qu.: 5.35 3rd Qu.:3.252 3rd Qu.:0.02850 3rd Qu.:2.225
Max. :3.20 Max. :14.30 Max. :3.900 Max. :0.05400 Max. :3.100
i j
Min. :12.20 Min. :205.0
1st Qu.:13.80 1st Qu.:232.2
Median :14.55 Median :255.5
Mean :14.53 Mean :251.1
3rd Qu.:15.57 3rd Qu.:274.5
Max. :16.40 Max. :286.0
중앙값을 원해서 summary() 함수를 이용하여
많은 데이터 값을 한눈에 확인 할 수 있었습니다.
정말 코딩 잘하시는 분들이 하시는 것들만 보면서
따라하기만 할 때에는 "별거 없네~"라고 생각했는데...
막상 제가 필요한 코드를 직접 생각하면서 맞추려고 하니
생각보다 힘든 점도 있네요... ㅎㅎ;;
앞으로도 혼자 공부한 내용들 조금씩 업로드하려고합니다~
누군가에게는 도움이 되기를 바라며...
'공부 > R & Python' 카테고리의 다른 글
[R]for 함수를 활용한 반복문 만들기 (0) | 2020.12.20 |
---|---|
[R]for 함수를 이용한 데이터 자동 계산 (0) | 2020.12.19 |
[R]r 데이터 프레임 행이름 변경하기, 상관성 분석 시각화 (0) | 2020.11.17 |
[R]r에서 엑셀파일, CSV파일 불러오기 (0) | 2020.11.03 |
[R]r에서 패키지(package) 다운받는 방법과 엑셀 불러오는 방법 (0) | 2020.11.02 |