728x90
반응형

이전 글에서는 R의 데이터 타입과 구조에 대해 알아봤다면,
[R] 기초 1편. 데이터 타입부터 구조까지 한 번에 정리하기
이번에는 실제로 R을 다룰 때 가장 자주 쓰이는 함수와 구문들을 정리해 보자.
이번 글의 주제는 다음 세 가지다:
- R 내장 함수
- 데이터 핸들링 (이름 변경, 추출, 결합)
- 제어문 (조건문, 반복문, 사용자 정의 함수, 주석)
1. R의 내장 함수
R은 다양한 작업을 손쉽게 처리할 수 있도록 기본적으로 많은 함수들을 제공한다.
1-1. 도움말 함수
- help() 또는 ? : 함수 설명서 보기
help(mean)
?mean
1-2. 기본 문자열 및 수열 함수
| paste() | 문자열 연결 | paste("R", "stats") → "R stats" |
| seq() | 수열 생성 | seq(1, 10, by=2) → 1 3 5 7 9 |
| rep() | 값 반복 | rep(1:2, times=3) → 1 2 1 2 1 2 |
1-3. 객체 제어 함수
| print() | 결과 출력 | print("Hello") |
| ls() | 현재 환경에 저장된 객체 목록 | ls() |
| rm() | 변수 삭제 | rm(x) |
1-4. 통계 함수
R은 기본 통계 처리에 필요한 함수들을 내장하고 있다. 여기서는 가장 기초적인 함수를 소개하고, 다음 글에서 좀 더 자세히 통계 함수를 다뤄보겠다.
| sum() | 합계 |
| mean() | 평균 |
| median() | 중앙값 |
| var() | 분산 |
| sd() | 표준편차 |
| max() | 최댓값 |
| min() | 최솟값 |
| range() | 최소~최대 범위 반환 |
| summary() | 요약 통계 출력 |
| kurtosis() | 첨도 (e1071 패키지 필요) |
x <- c(1, 2, 3, 4, 5)
mean(x) # 3
summary(x) # Min, 1st Qu., Median, Mean, 3rd Qu., Max
2. R 데이터 핸들링
R에서 데이터를 조작하는 것은 분석의 핵심이다. 이 섹션에서는 이름 바꾸기, 추출, 결합을 다룬다.
2-1. 데이터 이름 변경
# 행렬 행/열 이름 변경
m1 <- matrix(c(1:6), nrow=2)
colnames(m1) <- c('c1,','c2','c3')
rownames(m1) <- c('r1,','r2')
##출력
c1 c2 c3
r1 1 3 5
r2 2 4 6
# 데이터프레임 행/열 이름 변경
df1 <- data.frame(x=c(1:6), y=c(4:6))
colnames(df1) <- c('c1,','c2')
rownames(df2) <- c('r1,','r2','r3')
##출력
c1 c2
r1 1 4
r2 2 5
r3 3 6
2-2. 데이터 추출 (인덱싱)
df[1, ] # 1행 전체
df[, 2] # 2열 전체
df[1:3, 2:3] # 1~3행, 2~3열
df$name # "name" 열 추출
df$name[3] # "name" 열 [3] 요소 추출
2-3. 데이터 결합
| cbind() | 열 방향으로 결합 |
| rbind() | 행 방향으로 결합 |
cbind(c(1,2), c(3,4)) # 2열짜리 행렬 생성
rbind(c(1,2), c(3,4)) # 2행짜리 행렬 생성
3. 제어문
프로그래밍에서 빠질 수 없는 제어 흐름. 조건문과 반복문, 사용자 정의 함수, 주석 처리까지 알아보자.
3-1. 조건문: if, if else, ifelse()
x <- 10
if (x > 0) {
print("양수입니다")
} else {
print("음수 또는 0입니다")
}
3-2. 반복문: for, while
# for문 예시
for (i in 1:5) {
print(i)
}
# while문 예시
i <- 0
while (i <= 5) {
print(i)
i <- i + 1
}
##출력
1
2
3
4
5
3-3. 사용자 정의 함수
- function()을 사용하여 함수 정의
- return()은 선택사항 (없어도 마지막 결과 반환됨)
add <- function(x, y) {
return(x + y)
}
add(2, 3)
# 결과: 5
3-4. 주석 처리
- R에서 주석은 # 하나로 시작하며, 줄 끝까지 무시된다.
# 이것은 주석입니다
x <- 5 # 변수 x에 5를 저장
마무리
이번 글에서는 R의 실질적인 사용에 필요한 요소들을 다뤘다.
- 자주 쓰는 기본 내장 함수
- 데이터 조작 방법 (이름 변경, 추출, 결합)
- 제어문 (조건문, 반복문, 사용자 정의 함수, 주석)
이 내용만 잘 익혀도 R로 대부분의 기초 데이터 분석을 수행할 수 있다.
728x90
반응형
'PROGRAMMING > CODING' 카테고리의 다른 글
| [R] 기초 3편. 통계 분석에 사용되는 R 함수 한 번에 총정리하기 (8) | 2025.08.07 |
|---|---|
| [R] 기초 1편. 데이터 타입부터 구조까지 한 번에 정리하기 (5) | 2025.08.05 |
| 텍스트 마이닝 핵심 용어 정리 – 스태밍, 토큰화, 임베딩까지 쉽게 이해하기 (10) | 2025.07.10 |
| [Anaconda3] 아나콘다 터미널 명령어 모음 (0) | 2023.06.01 |
| [Anaconda3] 아나콘다 가상환경 위치 바꾸기 (User 말고 드라이브에) (0) | 2023.06.01 |
댓글