Omni-Modal: Thinker-Talker Architecture

Omni-Modal: Thinker-Talker (Qwen2.5-Omni)

입력 모달리티를 선택하고 "처리 시작"을 눌러 Thinker-Talker 아키텍처의 동작을 확인하세요

📝 텍스트

🖼️ 이미지

🎵 오디오

🎬 비디오

📝+🖼️ 복합

입력 모달리티를 선택하세요. Thinker(LLM)가 텍스트를 추론하는 동시에 Talker가 음성을 생성합니다.