본문 바로가기
PROGRAMMING/CODING

[R] 기초 2편. 내장 함수, 데이터 핸들링, 제어문까지 한 번에 정리하기

by Hey Nary 2025. 8. 6.
728x90
반응형

 

이전 글에서는 R의 데이터 타입과 구조에 대해 알아봤다면,

[R] 기초 1편. 데이터 타입부터 구조까지 한 번에 정리하기

이번에는 실제로 R을 다룰 때 가장 자주 쓰이는 함수와 구문들을 정리해 보자.

이번 글의 주제는 다음 세 가지다:

  1. R 내장 함수
  2. 데이터 핸들링 (이름 변경, 추출, 결합)
  3. 제어문 (조건문, 반복문, 사용자 정의 함수, 주석)

1. R의 내장 함수

R은 다양한 작업을 손쉽게 처리할 수 있도록 기본적으로 많은 함수들을 제공한다.

1-1. 도움말 함수

  • help() 또는 ? : 함수 설명서 보기
help(mean)
?mean

1-2. 기본 문자열 및 수열 함수

paste() 문자열 연결 paste("R", "stats") → "R stats"
seq() 수열 생성 seq(1, 10, by=2) → 1 3 5 7 9
rep() 값 반복 rep(1:2, times=3) → 1 2 1 2 1 2
 

1-3. 객체 제어 함수

print() 결과 출력 print("Hello")
ls() 현재 환경에 저장된 객체 목록 ls()
rm() 변수 삭제 rm(x)
 

1-4. 통계 함수

R은 기본 통계 처리에 필요한 함수들을 내장하고 있다. 여기서는 가장 기초적인 함수를 소개하고, 다음 글에서 좀 더 자세히 통계 함수를 다뤄보겠다.

sum() 합계
mean() 평균
median() 중앙값
var() 분산
sd() 표준편차
max() 최댓값
min() 최솟값
range() 최소~최대 범위 반환
summary() 요약 통계 출력
kurtosis() 첨도 (e1071 패키지 필요)
x <- c(1, 2, 3, 4, 5) 
mean(x) # 3 
summary(x) # Min, 1st Qu., Median, Mean, 3rd Qu., Max

2. R 데이터 핸들링

R에서 데이터를 조작하는 것은 분석의 핵심이다. 이 섹션에서는 이름 바꾸기, 추출, 결합을 다룬다.

2-1. 데이터 이름 변경

# 행렬 행/열 이름 변경 
m1 <- matrix(c(1:6), nrow=2)
colnames(m1) <- c('c1,','c2','c3')
rownames(m1) <- c('r1,','r2')

##출력
  c1 c2 c3
r1 1  3  5
r2 2  4  6
# 데이터프레임 행/열 이름 변경 
df1 <- data.frame(x=c(1:6), y=c(4:6))
colnames(df1) <- c('c1,','c2')
rownames(df2) <- c('r1,','r2','r3')

##출력
  c1 c2
r1 1  4
r2 2  5
r3 3  6

2-2. 데이터 추출 (인덱싱)

df[1, ]       # 1행 전체
df[, 2]       # 2열 전체
df[1:3, 2:3]  # 1~3행, 2~3열
df$name       # "name" 열 추출
df$name[3]    # "name" 열 [3] 요소 추출

2-3. 데이터 결합

cbind() 열 방향으로 결합
rbind() 행 방향으로 결합
 
cbind(c(1,2), c(3,4)) # 2열짜리 행렬 생성
rbind(c(1,2), c(3,4)) # 2행짜리 행렬 생성

3. 제어문

프로그래밍에서 빠질 수 없는 제어 흐름. 조건문과 반복문, 사용자 정의 함수, 주석 처리까지 알아보자.

3-1. 조건문: if, if else, ifelse()

 
x <- 10 
if (x > 0) { 
	print("양수입니다") 
} else { 
	print("음수 또는 0입니다") 
}

3-2. 반복문: for, while

# for문 예시
for (i in 1:5) { 
	print(i) 
} 

# while문 예시 
i <- 0 
while (i <= 5) { 
	print(i)
    i <- i + 1
}

##출력
1
2
3
4
5

 

3-3. 사용자 정의 함수

  • function()을 사용하여 함수 정의
  • return()은 선택사항 (없어도 마지막 결과 반환됨)
add <- function(x, y) {
	return(x + y)
} 

add(2, 3) 
# 결과: 5

3-4. 주석 처리

  • R에서 주석은 # 하나로 시작하며, 줄 끝까지 무시된다.
 
# 이것은 주석입니다
x <- 5 # 변수 x에 5를 저장

마무리

이번 글에서는 R의 실질적인 사용에 필요한 요소들을 다뤘다.

  • 자주 쓰는 기본 내장 함수
  • 데이터 조작 방법 (이름 변경, 추출, 결합)
  • 제어문 (조건문, 반복문, 사용자 정의 함수, 주석)

이 내용만 잘 익혀도 R로 대부분의 기초 데이터 분석을 수행할 수 있다.

 

728x90
반응형

댓글