📌 Transformer 완벽 정리 (Attention, 구조, BERT, GPT까지)1. 왜 Transformer가 등장했는가?딥러닝 모델은 데이터의 특성에 맞는 유도 바이어스(Inductive Bias)를 기반으로 발전해왔다.CNN → 이미지에서 “지역적 패턴 반복” 가정RNN → “시간적으로 가까운 데이터가 중요” 가정하지만 자연어는 이 가정들로 설명이 어렵다.❗ 자연어의 특징멀리 떨어진 단어도 중요문맥(Context)에 따라 의미 변화동일 단어도 상황에 따라 의미 다름단어 간 관계가 매우 복잡👉 즉, “어떤 단어가 중요한지 모델이 직접 판단해야 함”➡️ 이 문제를 해결하기 위해 등장한 것이 Transformer 2. Transformer 핵심: AttentionTransformer의 본질은 단..