728x90
반응형

R은 통계 분석과 데이터 처리에 특화된 프로그래밍 언어다.
처음엔 낯설지만, 기본적인 함수만 익혀도 웬만한 통계 처리와 데이터 전처리는 손쉽게 할 수 있다.
이 글에서는 실무와 학습에 자주 사용하는 R의 내장 함수들을 분야별로 정리하고, 간단한 예시 코드도 함께 소개한다.
[R] 기초 1편. 데이터 타입부터 구조까지 한 번에 정리하기
[R] 기초 2편. 내장 함수, 데이터 핸들링, 제어문까지 한 번에 정리하기
1. 📐 숫자 연산 관련 함수
| sqrt() | 제곱근 | sqrt(4) → 2 |
| abs() | 절댓값 | abs(-5) → 5 |
| exp() | 자연지수 e의 거듭제곱 | exp(1) → 2.718... |
| log() | 자연로그 | log(10) |
| log10() | 밑 10 로그 | log10(100) → 2 |
| pi | 원주율 상수 | pi |
| round() | 반올림 | round(3.5) → 4 |
| ceiling() | 올림 | ceiling(3.2) → 4 |
| floor() | 내림 | floor(3.8) → 3 |
2. 🔤 문자 연산 함수
| tolower() | 소문자 변환 | tolower("ABC") → "abc" |
| toupper() | 대문자 변환 | toupper("abc") → "ABC" |
| nchar() | 문자열 길이 | nchar("hello") → 5 |
| substr() | 문자열 부분 추출 | substr("hello", 1, 2) → "he" |
| strsplit() | 특정 기준으로 문자열 나누기 | strsplit("a,b", ",") |
| grepl() | 특정 문자 포함 여부 확인 | grepl("a", "abc") → TRUE |
| gsub() | 문자열 치환 | gsub("a", "b", "abc") → "bbc" |
3. 📦 벡터 연산 함수
| length() | 벡터 길이 | length(c(1,2,3)) |
| paste() | 문자열 결합 | paste("A", "B") → "A B" |
| cov() | 공분산 계산 | cov(c(1,2), c(2,3)) |
| cor() | 상관계수 계산 | cor(c(1,2), c(2,3)) → 1 |
| table() | 빈도표 생성 | table(c("a", "b", "a")) |
| order() | 정렬 순서 인덱스 | order(c(3,1,2)) → 2 3 1 |
4. 🧮 행렬 연산 함수
| t() | 전치행렬 | t(matrix(1:4, 2)) |
| diag() | 대각행렬 생성 | diag(3) |
| %*% | 행렬 곱 | A %*% B |
| solve() | 역행렬 구하기 | solve(matrix(c(2,1,1,2),2,2)) |
5. 🔍 데이터 탐색 함수
| head() | 앞부분 확인 | head(mtcars) |
| tail() | 뒷부분 확인 | tail(iris) |
| str() | 데이터 구조 확인 | str(iris) |
| quantile() | 분위수 계산 | quantile(c(1,2,3,4,5)) |
| summary() | 기본 통계 요약 | summary(mtcars) |
6. 🧼 데이터 전처리 함수
| subset() | 조건으로 행 추출 | subset(iris, Species == "setosa") |
| merge() | 두 데이터프레임 병합 | merge(df1, df2, by = "id") |
| apply() | 행/열 기준 반복 적용 | apply(matrix(1:6,2), 1, sum) → 각 행의 합계 |
7. 📈 정규분포 관련 함수
| dnorm() | 정규분포 밀도 | dnorm(0) |
| pnorm() | 누적 확률 | pnorm(1.96) → 약 0.975 |
| rnorm() | 정규분포 난수 생성 | rnorm(5) |
| qnorm() | 분위수 (역 누적확률) | qnorm(0.95) |
8. 🎲 표본 추출 함수
| sample() | 표본 추출 | sample(1:10, 5) |
| runif() | 균등분포 난수 생성 | runif(5) |
9. 🗓️ 날짜/시간 처리 함수
| Sys.Date() | 현재 날짜 | Sys.Date() |
| Sys.time() | 현재 시간 | Sys.time() |
| as.Date() | 문자열을 날짜로 변환 | as.Date("2024-01-01") |
| format() | 날짜 출력 형식 지정 | format(Sys.Date(), "%Y/%m/%d") |
| as.POSIXct() | 시간 데이터를 datetime으로 | as.POSIXct("2024-01-01 12:00") |
10. 📉 산점도 & 시각화 함수
| plot() | 산점도 및 기본 그래프 | plot(mtcars$wt, mtcars$mpg) |
| abline() | 회귀선 또는 기준선 | abline(lm(mpg ~ wt, data = mtcars)) |
11. 📂 파일 입출력 함수
| read.csv() | CSV 불러오기 | read.csv("data.csv") |
| write.csv() | CSV 저장 | write.csv(df, "output.csv") |
| saveRDS() | R 객체 저장 | saveRDS(mtcars, "data.rds") |
| readRDS() | R 객체 불러오기 | readRDS("data.rds") |
12. 🛠️ 기타 환경 설정 함수
| install.packages() | 패키지 설치 | install.packages("ggplot2") |
| library() | 패키지 불러오기 | library(ggplot2) |
| getwd() | 현재 작업 경로 | getwd() |
| setwd() | 작업 경로 변경 | setwd("/Users/yourname/data") |
🧾 마무리
이 글에서 정리한 함수들만 익혀도 R에서의 기본 통계 분석과 데이터 다루기는 충분히 가능하다.
728x90
반응형
'PROGRAMMING > CODING' 카테고리의 다른 글
| [R] 기초 2편. 내장 함수, 데이터 핸들링, 제어문까지 한 번에 정리하기 (4) | 2025.08.06 |
|---|---|
| [R] 기초 1편. 데이터 타입부터 구조까지 한 번에 정리하기 (5) | 2025.08.05 |
| 텍스트 마이닝 핵심 용어 정리 – 스태밍, 토큰화, 임베딩까지 쉽게 이해하기 (10) | 2025.07.10 |
| [Anaconda3] 아나콘다 터미널 명령어 모음 (0) | 2023.06.01 |
| [Anaconda3] 아나콘다 가상환경 위치 바꾸기 (User 말고 드라이브에) (0) | 2023.06.01 |
댓글