본문 바로가기
반응형

PROGRAMMING42

💡 “MLP에 유도 바이어스가 없다고? 근데 그게 장점이라면?” 요즘 AI 모델 얘기할 때 “CNN은 이미지, RNN은 시계열, Transformer는 다 잘함!” 이런 말 많이 하잖아요. 근데 **MLP(멀티레이어 퍼셉트론)**는?딱히 뭐 하나 특출나게 잘하는 건 없는데, 모든 걸 다 할 수는 있어요. 그냥 구조가 단순하니까요.그런데 바로 이 단순함이 요즘 연구자들 사이에서 엄청난 관심을 받고 있습니다. 이유는 딱 하나 — 유도 바이어스(Inductive Bias) 때문이에요.🔍 유도 바이어스란 뭔데?머신러닝 모델이 어떤 문제를 더 잘 풀게 만드는 "숨겨진 직관" 같은 거예요.예를 들어,CNN은 이미지를 다룰 때 공간적인 근접성을 잘 잡아요.RNN은 순서에 민감해요.그런데 MLP는 그런 거 없어요. 그냥 주는 대로 계산만 잘함. 똑똑한 계산기 같달까?근데 이게 왜.. 2025. 4. 15.
🧠 딥러닝, 데이터셋부터 제대로 알자! — Training, Validation, Test 데이터의 역할과 분할 비율, 그리고 실전 예시까지딥러닝 공부를 하다 보면 늘 마주치는 세 가지 데이터셋이 있습니다. 바로 Training Set, Validation Set, Test Set이죠.모델을 만들고 학습시키는 데 있어 이 데이터셋들은 굉장히 중요한 역할을 합니다.이번 글에서는 이 세 가지 데이터셋이 어떤 역할을 하는지, 어떤 비율로 나누는 게 좋은지, 그리고 실제 프로젝트에서는 어떻게 사용되는지 구체적으로 살펴보겠습니다.✅ 딥러닝에서 사용하는 세 가지 데이터셋1. Training Set (훈련 데이터셋)말 그대로 모델을 학습시키는 데 사용하는 데이터입니다.신경망의 가중치와 바이어스를 업데이트하는 데 사용돼요.학습 과정에서 이 데이터를 반복적으.. 2025. 4. 14.
🤖 Tabular Data에선 왜 MLP가 잘 안 먹힐까? – 유도 바이어스의 문제 딥러닝이 이미지나 자연어 처리에서는 탁월한 성능을 보이는 반면, 엑셀처럼 생긴 표(table) 형태의 데이터, 즉 tabular data에선 예상보다 성능이 잘 안 나오는 경우가 많습니다.왜 그럴까요? 바로 "유도 바이어스(inductive bias)" 때문입니다.🎯 유도 바이어스란?머신러닝 모델은 학습 데이터를 일반화해서 새로운 데이터를 예측하려고 합니다. 이때, 모델이 어떤 식으로 일반화를 하려는지에 대한 **"사전 가정"**을 유도 바이어스라고 합니다.예를 들어,CNN은 공간적인 연속성을 가정합니다. (→ 이미지에 적합)RNN은 시간적 순서를 가정합니다. (→ 시계열, 자연어에 적합)이러한 가정 덕분에 모델이 적은 데이터로도 잘 일반화할 수 있는 거죠.📊 Tabular Data의 특징Tabula.. 2025. 4. 13.
[딥러닝] 활성 함수(Activation Function)란? 왜 필요할까? 딥러닝(Deep Learning) 모델에서 활성 함수(Activation Function)는 신경망의 중요한 요소 중 하나입니다.활성 함수가 없다면, 신경망은 단순한 선형 변환만 수행하게 되어 다층 신경망을 사용해도 단층 신경망과 동일한 성능을 내게 됩니다.따라서, 비선형성을 추가하여 복잡한 문제를 해결할 수 있도록 하는 것이 활성 함수의 역할입니다.1. 활성 함수의 개념활성 함수는 뉴런의 입력을 받아 출력을 결정하는 수학적 함수입니다. 이 함수는 입력 값을 변환하여 다음 층으로 전달하며, 네트워크가 다양한 패턴을 학습할 수 있도록 합니다.활성 함수의 주요 역할은 다음과 같습니다:비선형성 추가: 선형 변환만으로는 신경망의 깊이가 의미가 없지만, 활성 함수가 비선형성을 추가하면 복잡한 데이터 패턴을 학습할.. 2025. 4. 1.
반응형