<답>
1. 개요
- LLM은 대규모 데이터 학습을 통해 인간 언어를 처리, 이해, 생성하는 AI 모델로, Transformer 기반 신경망을 활용하여 다양한 산업에서 활용됨
2. LLM의 개념 및 구조
가. 개념
- LLM 정의: 대규모 데이터셋을 학습하여 인간 언어를 이해하고 생성하는 AI 모델
- 기술 기반: Transformer 신경망 구조를 사용하며, 수억~수십억 개의 파라미터를 포함
나. 개념도

- Transformer 모델의 Encoder와 Decoder 구조. Encoder는 입력 텍스트를 분석하고, Decoder는 이를 바탕으로 출력 텍스트를 생성
- Self-Attention은 문맥을 고려한 관계 분석을 가능하게 하며, 병렬 처리로 속도를 향상시킴
다. LLM 주요 기능
| 구분 | 주요 내용 |
| 텍스트 생성 | 사용자 요청에 맞는 자연스러운 텍스트 생성 |
| 번역 및 요약 | 다국어 번역 및 문서 핵심 내용 요약 |
| 감정 분석 | 텍스트의 감정 및 의미 분석 |
| 데이터 클러스터링 | 고객 피드백 및 제품 설명 분류 |
3. LLM과 기존 언어 모델 비교
| 구분 | 기존 언어 모델 | LLM |
| 학습 데이터 크기 | 제한적 | 수십억~수조 단위 데이터 |
| 신경망 구조 | RNN 등 순차 처리 | Transformer 기반 병렬 처리 |
| 파라미터 수 | 수백만 단위 | 수십억~수조 단위 |
- LLM은 대규모 데이터와 병렬 처리 기술로 기존 모델 대비 높은 성능을 제공
4. 기술 동향
ㅇ GPT-4, LLaMA 등 초대형 모델 개발이 활발하며 의료, 금융, 법률 등 전문 분야로 확장되고 있음
ㅇ LLM 규모에 따라 파운데이션 모델을 바탕으로 SLM등 다양한 규모 활용됨
<끝>
'인공지능(AI) 및 생성형 인공지능 > AI 주요 기술' 카테고리의 다른 글
| <문> AGI(Artificial General Intelligence, 인공 일반 지능) (0) | 2026.01.28 |
|---|---|
| <문 > MoE(Mixture of Experts) 전문가 혼합 기법 (0) | 2026.01.15 |
| <문> 트랜스포머(Transformer), 디퓨전(Diffusion) 모델 아키텍처 (0) | 2026.01.14 |
| <문 > 시각언어행동(VLA(Vision-Language-Action)) 모델 (0) | 2026.01.13 |
| <문> 프롬프트 체이닝 (0) | 2026.01.13 |