'MoE Model' 태그의 글 목록

<문 > MoE(Mixture of Experts) 전문가 혼합 기법

1. 개요○ MoE는 딥러닝 모델에서 여러 전문가(Expert) 네트워크를 배치하고 게이팅 네트워크가 입력에 따라 선택적으로 활성화하여 모델 용량 확장 대비 연산 효율성을 극대화하는 아키텍처○ 대규모 언어모델(LLM)에서 파라미터 수는 증가시키되 추론 시 연산량은 제한하여 성능과 효율성을 동시 달성하는 기법 2. MoE 아키텍처 구조 및 동작원리가。 개념정의: 다수의 전문가 네트워크(FFN)와 게이팅 네트워크(Router)로 구성되어 입력 토큰별로 Top-K 전문가만 선택 활성화하는 조건부 연산 구조핵심원리: 희소 활성화(Sparse Activation) 방식으로 전체 파라미터 중 일부만 사용하여 Dense 모델 대비 연산량 1/8 수준으로 유사 성능 달성나。MoE 아키텍처 구성도게이팅 네트워크: Sof..

인공지능(AI) 및 생성형 인공지능/AI 주요 기술 2026.01.15

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

최술사의 모두의 ICT 기술 통섭

MoE Model 1

티스토리툴바