ข่าว
อาลีบาบา คลาวด์ เปิดโอเพ่นซอร์สโมเดล AI สร้างวิดีโอ หวังกระตุ้นการเข้าถึงเทคโนโลยี
สำนักข่าวบริคอินโฟ – อาลีบาบา คลาวด์ (Alibaba Cloud) เปิดตัวโมเดลปัญญาประดิษฐ์ (AI) โอเพ่นซอร์สสำหรับการสร้างวิดีโอ โดยมีเป้าหมายเพื่อสนับสนุนชุมชนโอเพ่นซอร์สและลดอุปสรรคในการเข้าถึงเทคโนโลยี AI สำหรับการสร้างสรรค์วิดีโอคุณภาพสูง
โมเดลดังกล่าวอยู่ในซีรีส์ Wan2.1 ซึ่งเป็นรุ่นล่าสุดของ Tongyi Wanxiang (Wan) โมเดลวิดีโอพื้นฐานของอาลีบาบา คลาวด์ ประกอบด้วย 4 โมเดล ได้แก่ T2V-14B, T2V-1.3B, I2V-14B-720P และ I2V-14B-480P ออกแบบมาเพื่อสร้างภาพและวิดีโอคุณภาพสูงจากข้อความและรูปภาพ โดยโมเดลเหล่านี้สามารถดาวน์โหลดได้จาก ModelScope และ Hugging Face
Wan2.1 เป็นโมเดลสร้างวิดีโอรุ่นแรกที่รองรับการป้อนข้อมูลทั้งภาษาจีนและภาษาอังกฤษ สามารถสร้างภาพที่สมจริงและจัดการการเคลื่อนไหวที่ซับซ้อนได้อย่างแม่นยำ นอกจากนี้ ยังได้รับคะแนนสูงถึง 86.22% บน VBench leaderboard ซึ่งเป็นชุดเกณฑ์มาตรฐานสำหรับโมเดลสร้างวิดีโอ
“การเปิดให้เข้าถึงโมเดลเหล่านี้โดยไม่มีค่าใช้จ่าย จะช่วยลดอุปสรรคและทำให้ธุรกิจต่าง ๆ สามารถใช้ประโยชน์จาก AI ได้มากขึ้น” อาลีบาบา คลาวด์ กล่าว
โมเดล T2V-14B เหมาะสำหรับการสร้างภาพคุณภาพสูงที่มีการเคลื่อนไหวสูง ในขณะที่ T2V-1.3B เหมาะสำหรับการพัฒนาต่อยอดและการวิจัยทางวิชาการ ส่วนโมเดล I2V-14B-720P และ I2V-14B-480P สามารถแปลงภาพเป็นวิดีโอได้
อาลีบาบา คลาวด์ เป็นหนึ่งในบริษัทเทคโนโลยีรายแรก ๆ ที่เปิดโอเพ่นซอร์สโมเดล AI ขนาดใหญ่ โดยก่อนหน้านี้ได้เปิดตัวโมเดล Qwen (Qwen-7B) ซึ่งได้รับการจัดอันดับอยู่ในระดับสูงบน Hugging Face Open LLM Leaderboards
