Connect with us

ข่าว

อาลีบาบา คลาวด์ เปิดโอเพ่นซอร์สโมเดล AI สร้างวิดีโอ หวังกระตุ้นการเข้าถึงเทคโนโลยี

Published

on

อาลีบาบา คลาวด์ เปิดตัวโมเดล AI สร้างวิดีโอโอเพ่นซอร์สซีรีส์ Wan2.1 รองรับการสร้างวิดีโอจากข้อความและรูปภาพ ดาวน์โหลดได้แล้ววันนี้

สำนักข่าวบริคอินโฟ – อาลีบาบา คลาวด์ (Alibaba Cloud) เปิดตัวโมเดลปัญญาประดิษฐ์ (AI) โอเพ่นซอร์สสำหรับการสร้างวิดีโอ โดยมีเป้าหมายเพื่อสนับสนุนชุมชนโอเพ่นซอร์สและลดอุปสรรคในการเข้าถึงเทคโนโลยี AI สำหรับการสร้างสรรค์วิดีโอคุณภาพสูง

โมเดลดังกล่าวอยู่ในซีรีส์ Wan2.1 ซึ่งเป็นรุ่นล่าสุดของ Tongyi Wanxiang (Wan) โมเดลวิดีโอพื้นฐานของอาลีบาบา คลาวด์ ประกอบด้วย 4 โมเดล ได้แก่ T2V-14B, T2V-1.3B, I2V-14B-720P และ I2V-14B-480P ออกแบบมาเพื่อสร้างภาพและวิดีโอคุณภาพสูงจากข้อความและรูปภาพ โดยโมเดลเหล่านี้สามารถดาวน์โหลดได้จาก ModelScope และ Hugging Face

Wan2.1 เป็นโมเดลสร้างวิดีโอรุ่นแรกที่รองรับการป้อนข้อมูลทั้งภาษาจีนและภาษาอังกฤษ สามารถสร้างภาพที่สมจริงและจัดการการเคลื่อนไหวที่ซับซ้อนได้อย่างแม่นยำ นอกจากนี้ ยังได้รับคะแนนสูงถึง 86.22% บน VBench leaderboard ซึ่งเป็นชุดเกณฑ์มาตรฐานสำหรับโมเดลสร้างวิดีโอ

“การเปิดให้เข้าถึงโมเดลเหล่านี้โดยไม่มีค่าใช้จ่าย จะช่วยลดอุปสรรคและทำให้ธุรกิจต่าง ๆ สามารถใช้ประโยชน์จาก AI ได้มากขึ้น” อาลีบาบา คลาวด์ กล่าว

Advertisement

โมเดล T2V-14B เหมาะสำหรับการสร้างภาพคุณภาพสูงที่มีการเคลื่อนไหวสูง ในขณะที่ T2V-1.3B เหมาะสำหรับการพัฒนาต่อยอดและการวิจัยทางวิชาการ ส่วนโมเดล I2V-14B-720P และ I2V-14B-480P สามารถแปลงภาพเป็นวิดีโอได้

อาลีบาบา คลาวด์ เป็นหนึ่งในบริษัทเทคโนโลยีรายแรก ๆ ที่เปิดโอเพ่นซอร์สโมเดล AI ขนาดใหญ่ โดยก่อนหน้านี้ได้เปิดตัวโมเดล Qwen (Qwen-7B) ซึ่งได้รับการจัดอันดับอยู่ในระดับสูงบน Hugging Face Open LLM Leaderboards