본문 바로가기
PROGRAMMING/CODING

[R] 기초 3편. 통계 분석에 사용되는 R 함수 한 번에 총정리하기

by Hey Nary 2025. 8. 7.
728x90
반응형

 

R은 통계 분석과 데이터 처리에 특화된 프로그래밍 언어다.
처음엔 낯설지만, 기본적인 함수만 익혀도 웬만한 통계 처리와 데이터 전처리는 손쉽게 할 수 있다.

이 글에서는 실무와 학습에 자주 사용하는 R의 내장 함수들을 분야별로 정리하고, 간단한 예시 코드도 함께 소개한다.

 

[R] 기초 1편. 데이터 타입부터 구조까지 한 번에 정리하기

[R] 기초 2편. 내장 함수, 데이터 핸들링, 제어문까지 한 번에 정리하기


1. 📐 숫자 연산 관련 함수

sqrt() 제곱근 sqrt(4) → 2
abs() 절댓값 abs(-5) → 5
exp() 자연지수 e의 거듭제곱 exp(1) → 2.718...
log() 자연로그 log(10)
log10() 밑 10 로그 log10(100) → 2
pi 원주율 상수 pi
round() 반올림 round(3.5) → 4
ceiling() 올림 ceiling(3.2) → 4
floor() 내림 floor(3.8) → 3

2. 🔤 문자 연산 함수

tolower() 소문자 변환 tolower("ABC") → "abc"
toupper() 대문자 변환 toupper("abc") → "ABC"
nchar() 문자열 길이 nchar("hello") → 5
substr() 문자열 부분 추출 substr("hello", 1, 2) → "he"
strsplit() 특정 기준으로 문자열 나누기 strsplit("a,b", ",")
grepl() 특정 문자 포함 여부 확인 grepl("a", "abc") → TRUE
gsub() 문자열 치환 gsub("a", "b", "abc") → "bbc"

3. 📦 벡터 연산 함수

length() 벡터 길이 length(c(1,2,3))
paste() 문자열 결합 paste("A", "B") → "A B"
cov() 공분산 계산 cov(c(1,2), c(2,3))
cor() 상관계수 계산 cor(c(1,2), c(2,3)) → 1
table() 빈도표 생성 table(c("a", "b", "a"))
order() 정렬 순서 인덱스 order(c(3,1,2)) → 2 3 1

4. 🧮 행렬 연산 함수

t() 전치행렬 t(matrix(1:4, 2))
diag() 대각행렬 생성 diag(3)
%*% 행렬 곱 A %*% B
solve() 역행렬 구하기 solve(matrix(c(2,1,1,2),2,2))

5. 🔍 데이터 탐색 함수

head() 앞부분 확인 head(mtcars)
tail() 뒷부분 확인 tail(iris)
str() 데이터 구조 확인 str(iris)
quantile() 분위수 계산 quantile(c(1,2,3,4,5))
summary() 기본 통계 요약 summary(mtcars)

 


6. 🧼 데이터 전처리 함수

subset() 조건으로 행 추출 subset(iris, Species == "setosa")
merge() 두 데이터프레임 병합 merge(df1, df2, by = "id")
apply() 행/열 기준 반복 적용 apply(matrix(1:6,2), 1, sum) → 각 행의 합계

 


7. 📈 정규분포 관련 함수

dnorm() 정규분포 밀도 dnorm(0)
pnorm() 누적 확률 pnorm(1.96) → 약 0.975
rnorm() 정규분포 난수 생성 rnorm(5)
qnorm() 분위수 (역 누적확률) qnorm(0.95)

8. 🎲 표본 추출 함수

sample() 표본 추출 sample(1:10, 5)
runif() 균등분포 난수 생성 runif(5)

9. 🗓️ 날짜/시간 처리 함수

Sys.Date() 현재 날짜 Sys.Date()
Sys.time() 현재 시간 Sys.time()
as.Date() 문자열을 날짜로 변환 as.Date("2024-01-01")
format() 날짜 출력 형식 지정 format(Sys.Date(), "%Y/%m/%d")
as.POSIXct() 시간 데이터를 datetime으로 as.POSIXct("2024-01-01 12:00")

10. 📉 산점도 & 시각화 함수

plot() 산점도 및 기본 그래프 plot(mtcars$wt, mtcars$mpg)
abline() 회귀선 또는 기준선 abline(lm(mpg ~ wt, data = mtcars))

11. 📂 파일 입출력 함수

read.csv() CSV 불러오기 read.csv("data.csv")
write.csv() CSV 저장 write.csv(df, "output.csv")
saveRDS() R 객체 저장 saveRDS(mtcars, "data.rds")
readRDS() R 객체 불러오기 readRDS("data.rds")

 


12. 🛠️ 기타 환경 설정 함수

install.packages() 패키지 설치 install.packages("ggplot2")
library() 패키지 불러오기 library(ggplot2)
getwd() 현재 작업 경로 getwd()
setwd() 작업 경로 변경 setwd("/Users/yourname/data")

 


🧾 마무리

이 글에서 정리한 함수들만 익혀도 R에서의 기본 통계 분석과 데이터 다루기는 충분히 가능하다. 

728x90
반응형

댓글