Studio sáng tạo
Tám module sáng tạo media dùng chung credit và Library. Mọi prompt VN được tự rewrite trước khi gọi model.
Image — ảnh#
Module Image hỗ trợ 5 model chính: FAL Flux (mặc định, fast & rẻ), Nano Banana Pro (photoreal cao cấp, chỉ Pro+), Ideogram v3 (chữ trong ảnh chuẩn), GPT Image 2 (poster đa lớp), Higgsfield (UGC video frame).
Mẹo prompt VN tốt
- Mô tả CHỦ THỂ trước: 'cô gái Việt 22 tuổi mặc áo dài đỏ' tốt hơn 'một bức ảnh có cô gái…'
- Nêu rõ tone màu: 'tone xanh mint pastel', 'tone vintage cam-nâu film'.
- Chỉ định ratio cuối: 'tỉ lệ 16:9' hoặc '9:16 vertical'.
- Tránh tên người thật — model sẽ chặn vì lý do bản quyền.
Video#
Hỗ trợ Luma Ray (5s, 24fps, rẻ nhất), Kling V3 (10s, đẹp nhất motion), Seedance 2.0 (cinematic 6s, tốn nhất). Anh có thể i2v (image-to-video) từ ảnh trong Library hoặc t2v (text-to-video) từ prompt.
Storyboard#
Phân cảnh + contact-sheet — anh đưa kịch bản dài, Studio chia 6–12 cảnh và sinh ảnh đại diện từng cảnh. Hữu ích trước khi gọi Reel hoặc Film maker.
Reel#
Video dọc 9:16 dành cho TikTok / Instagram Reels / YouTube Shorts. Pipeline mặc định: storyboard → identity lock (nếu nhân vật người thật) → gen từng clip → ghép + thêm caption + nhạc nền.
Film maker#
Cinematic multi-scene + edit — phim ngắn 30–90 giây với 5–10 cảnh, có transition và grade màu cinematic. Tốn credit nhiều nhất trong Studio.
Music#
Minimax music sinh nhạc có lời từ structural tag. Mặc định 30 giây; muốn 2–3 phút thì viết lyric đầy đủ với tag [Intro] / [Verse] / [Chorus] / [Bridge] / [Outro]. Giá cố định $0.15 / bài.
Voice#
ElevenLabs TTS — giọng tiếng Việt rất tự nhiên. Có 6 preset giọng Việt sẵn (Nam Bắc / Nam Nam / Nữ Bắc / Nữ Nam / MC / Thì thầm) hoặc anh clone giọng từ 1 phút mẫu.