1. 트랜스포머가 바꾼 것- NLP : BERT, GPT, T5, BART 모두 트랜스포머 기반- 비전 : ViT, Transformer, MAE 등- 멀티모달, LLM 등2. 향후 연구 방향이 모두 실현됨- 다른 태스크 적용 : BERT, GPT- Restricted attention. : Longformer, BigBird본 논문은 시퀀스 패러다임을 RNN에서 어텐션으로 완전히 전환시킨 논문이다. 여기서 특히 인상적인 점은 "단순함"이다. 복잡한 LMTM 게이트 메커니즘이나 정교한 CNN 구조 대신, "Q·K로 유사도 구하고 V에 가중합"이라는 단순한 연산을 반복할 뿐...."Simple is Best" 1. Abstract 기존의 지배적인 시퀀스 변환(sequence transduction) 모델은..