LLM
LMM - 대규모 멀티모달 모델의 이해와 적용
LLM에서 LMM으로의 진화를 이해하고, Transformer 기반 멀티모달 아키텍처(CLIP, BLIP-2, Stable Diffusion)의 원리를 학습한 뒤, Native Multimodal·MoE·Autoregressive 이미지 생성 등 최신 트렌드를 살펴봅니다. RTX 3090에서 Qwen2.5-VL을 활용한 비디오 Grounding 시연을 포함합니다.
프롬프트 엔지니어링과 AI 에이전트 설계
프롬프트 엔지니어링의 원리와 핵심 테크닉을 이해하고, AI 에이전트의 구조와 설계 원칙을 오픈소스 도구 기반 라이브 코딩 데모와 함께 학습합니다.