Studio sáng tạo

Tám module sáng tạo media dùng chung credit và Library. Mọi prompt VN được tự rewrite trước khi gọi model.


Image — ảnh#

Module Image hỗ trợ 5 model chính: FAL Flux (mặc định, fast & rẻ), Nano Banana Pro (photoreal cao cấp, chỉ Pro+), Ideogram v3 (chữ trong ảnh chuẩn), GPT Image 2 (poster đa lớp), Higgsfield (UGC video frame).

Mẹo prompt VN tốt

  • Mô tả CHỦ THỂ trước: 'cô gái Việt 22 tuổi mặc áo dài đỏ' tốt hơn 'một bức ảnh có cô gái…'
  • Nêu rõ tone màu: 'tone xanh mint pastel', 'tone vintage cam-nâu film'.
  • Chỉ định ratio cuối: 'tỉ lệ 16:9' hoặc '9:16 vertical'.
  • Tránh tên người thật — model sẽ chặn vì lý do bản quyền.

Video#

Hỗ trợ Luma Ray (5s, 24fps, rẻ nhất), Kling V3 (10s, đẹp nhất motion), Seedance 2.0 (cinematic 6s, tốn nhất). Anh có thể i2v (image-to-video) từ ảnh trong Library hoặc t2v (text-to-video) từ prompt.

Cảnh báo
Video tốn credit cao (20–100). Luôn thử Luma rẻ trước để duyệt concept, rồi mới gọi Seedance bản final.

Storyboard#

Phân cảnh + contact-sheet — anh đưa kịch bản dài, Studio chia 6–12 cảnh và sinh ảnh đại diện từng cảnh. Hữu ích trước khi gọi Reel hoặc Film maker.

Reel#

Video dọc 9:16 dành cho TikTok / Instagram Reels / YouTube Shorts. Pipeline mặc định: storyboard → identity lock (nếu nhân vật người thật) → gen từng clip → ghép + thêm caption + nhạc nền.

Film maker#

Cinematic multi-scene + edit — phim ngắn 30–90 giây với 5–10 cảnh, có transition và grade màu cinematic. Tốn credit nhiều nhất trong Studio.

Music#

Minimax music sinh nhạc có lời từ structural tag. Mặc định 30 giây; muốn 2–3 phút thì viết lyric đầy đủ với tag [Intro] / [Verse] / [Chorus] / [Bridge] / [Outro]. Giá cố định $0.15 / bài.

Voice#

ElevenLabs TTS — giọng tiếng Việt rất tự nhiên. Có 6 preset giọng Việt sẵn (Nam Bắc / Nam Nam / Nữ Bắc / Nữ Nam / MC / Thì thầm) hoặc anh clone giọng từ 1 phút mẫu.