Omni-Modal: Thinker-Talker (Qwen2.5-Omni)
입력 모달리티를 선택하고 "처리 시작"을 눌러 Thinker-Talker 아키텍처의 동작을 확인하세요
📝 텍스트
🖼️ 이미지
🎵 오디오
🎬 비디오
📝+🖼️ 복합
처리 시작
입력 모달리티를 선택하세요. Thinker(LLM)가 텍스트를 추론하는 동시에 Talker가 음성을 생성합니다.