slm 2

<문> LLM, sLLM, SLM

1. 개요LLM, sLLM, SLM은 모두 트랜스포머 기반 언어모델이나, 파라미터 규모,자원 요구,적용 영역에서 차별화되는 계층적 모델군임대규모 범용지능(LLM)에서 경량화 범용(sLLM), 특화 및 온디바이스용(SLM)으로 스펙트럼을 형성하며, 성능과 비용,지연,프라이버시 요구에 따라 적정 모델을 선택하는 것이 핵심임 2. LLM, sLLM, SLM 가. 개념구분주요 내용LLM(Large Language Model)- 수십~수천억(또는 그 이상) 파라미터를 가지는 초대형 트랜스포머 기반 언어모델로, 대규모 코퍼스를 사전학습하여 범용 질의응답·코드생성·요약 등 광범위 작업을 수행- 높은 표현력과 추론능력을 가지나, 막대한 연산자원·비용, 긴 지연과 환경·프라이버시 이슈가 수반됨sLLM(smaller La..

LLM (Large Language Model) 대규모 언어 모델

1. 개요LLM은 대규모 데이터 학습을 통해 인간 언어를 처리, 이해, 생성하는 AI 모델로, Transformer 기반 신경망을 활용하여 다양한 산업에서 활용됨2. LLM의 개념 및 구조 가. 개념LLM 정의: 대규모 데이터셋을 학습하여 인간 언어를 이해하고 생성하는 AI 모델 ​기술 기반: Transformer 신경망 구조를 사용하며, 수억~수십억 개의 파라미터를 포함 ​나. 개념도Transformer 모델의 Encoder와 Decoder 구조. Encoder는 입력 텍스트를 분석하고, Decoder는 이를 바탕으로 출력 텍스트를 생성Self-Attention은 문맥을 고려한 관계 분석을 가능하게 하며, 병렬 처리로 속도를 향상시킴​다. LLM 주요 기능 구분주요 내용텍스트 생성사용자 요청에 맞는 자..