Connect with us

ข่าว

SCBX ผนึกกำลัง SambaNova เพิ่ม ไต้ฝุ่น โมเดลภาษาไทยขนาดใหญ่ บน Samba-1 พร้อมให้นักพัฒนา AI ทั่วโลกสามารถใช้งานได้แล้ววันนี้

Published

on

ไต้ฝุ่น โมเดลภาษา

กลุ่ม SCBX นำโดย เอสซีบี เอกซ์ (SCBX) และเอสซีบี เท็นเอกซ์ (SCB 10X) ผนึกกำลัง SambaNova Systems บริษัทผู้ให้บริการโซลูชันด้าน Generative AI ที่รวบรวมโมเดลที่เร็วที่สุด และ Chips ที่ทันสมัยที่สุด นำ Typhoon ไต้ฝุ่น โมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) เปิดให้บริการบนแพลตฟอร์ม Samba-1 Composition of Experts (CoE) เพื่อให้นักพัฒนา AI ทั่วโลกสามารถใช้ต่อยอดและพัฒนาแอปพลิเคชันด้าน AI บนแพลตฟอร์ม Samba-1 ได้แล้ววันนี้

“ไต้ฝุ่น” (Typhoon) โมเดลภาษาขนาดใหญ่ คืออะไร ?

Typhoon ไต้ฝุ่น โมเดลภาษา ขนาดใหญ่ที่พัฒนาขึ้นสำหรับภาษาไทยโดยเฉพาะ (Large Language Model optimized for Thai) ซึ่งนับเป็นโมเดลภาษาไทยขนาดใหญ่ที่ดีที่สุดในปัจจุบันและมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 และ GPT-4 ในภาษาไทย

โดยวัดจาก Benchmark ที่รวบรวมและจัดเตรียมมาจากข้อสอบภาษาไทยความยากเทียบเท่าข้อสอบมัธยมปลายและข้อสอบมาตรฐานอื่นๆ ในประเทศไทย โดย “ไต้ฝุ่น” (Typhoon) ถูกออกแบบมาเพื่อแก้ไขปัญหาช่องว่างทางภาษาที่โมเดลส่วนใหญ่ในปัจจุบันถูกฝึกฝนเป็นภาษาอังกฤษเป็นหลัก รวมถึงข้อจำกัดด้านทรัพยากรของภาษาไทยที่ไม่มีข้อมูลมากเพียงพอ (Low Resource Language)

นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) กล่าวว่า “เรารู้สึกยินดีเป็นอย่างยิ่งที่ “ไต้ฝุ่น” โมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) ได้เข้าร่วมเป็นส่วนหนึ่งของ Samba-1 และพร้อมให้บริการแก่ลูกค้าของ SambaNova ทั่วโลก โดยเราเชื่อมั่นว่า Samba-1 จะช่วยให้โมเดล  “ไต้ฝุ่น” เข้าถึงนักพัฒนานวัตกรรมและแอปพลิเคชันด้าน AI ภาษาไทยได้มากขึ้น”

Advertisement

ล่าสุด “ไต้ฝุ่น” ได้เปิดตัวเวอร์ชัน Typhoon-1.5X ในขนาด 8B และ 70B พัฒนาต่อยอดจากโมเดล Llama3 โมเดลถูกปรับแต่งให้เหมาะสำหรับภาษาไทยโดยมีเทคนิคการฝึกอบรมเพื่อให้เข้าใจบริบทและวัฒนธรรมไทยให้ดียิ่งขึ้น มีประสิทธิภาพเทียบเท่ากับโมเดลชั้นนำอย่าง ChatGPT และ GPT-4 นับเป็นก้าวหน้าที่สำคัญของ NLP และ AI ภาษาไทย

ไต้ฝุ่น โมเดลภาษา
ไต้ฝุ่น โมเดลภาษา

“ไต้ฝุ่น” เปิดให้ใช้งานในรูปแบบ Open Beta ใน 2 รูปแบบ ได้แก่ 1. Pretrained Model โมเดลข้อมูลด้านภาษาไทย ครอบคลุมคำศัพท์ บริบท หรือความแตกต่างทางวัฒนธรรม รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก โมเดลนี้เป็น Open Source ที่นักพัฒนาด้าน AI สามารถดาวน์โหลดได้ฟรีเพื่อนำไปใช้พัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI   2. Instruction-tuned Model โมเดลที่ต่อยอดจาก Pretraining สามารถทำตามคำสั่งที่ป้อนเข้าไป เช่น การแปล การสรุปความ หรือการตอบคำถามได้ดียิ่งขึ้น โดยสามารถเข้าถึงได้ผ่านบริการ API

ด้าน นายกวีวุฒิ เต็มภูวภัทร Head of R&D and Innovation Lab บริษัท เอสซีบี เอกซ์ จำกัด (มหาชน) หรือ SCBX กล่าวว่า “ไต้ฝุ่น” โมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ถูกพัฒนาขึ้นมาเพื่อแก้ปัญหาที่มักเจอเมื่อใช้งานโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยชาวต่างชาติและถูกฝึกฝนเป็นภาษาอังกฤษเป็นหลัก เช่น การให้ข้อมูลภาษาไทย แต่ไม่ถูกกับบริบทหรือวัฒนธรรมของคนไทย เป็นต้น

อีกทั้งภาษาไทยถูกเก็บข้อมูลสำหรับใช้พัฒนาโมเดลภาษาไว้น้อยมาก (Low Resource Language)  เช่นเดียวกับภาษาอื่นๆ ในภูมิภาคเอเชียตะวันออกเฉียงใต้ ทำให้เกิดปัญหาช่องว่างทางภาษา เราเชื่อว่าการนำโมเดล “ไต้ฝุ่น” ไปอยู่บน Samba-1 จะช่วยให้นักพัฒนาด้าน AI ได้รับประสบการณ์ (User Experience) ที่ดีขึ้น พร้อมมีส่วนช่วยยกระดับนวัตกรรมด้าน AI และเสริมสร้างความแข็งแกร่งให้แก่อุตสาหกรรม AI ของไทย”

SambaNova คือใคร ?

SambaNova Systems มีสำนักงานใหญ่ในเมืองพาโลอัลโต รัฐแคลิฟอร์เนีย ก่อตั้งขึ้นในปี 2560 โดยผู้ทรงคุณวุฒิในอุตสาหกรรม ผู้เชี่ยวชาญด้านการออกแบบฮาร์ดแวร์และซอฟต์แวร์จาก Sun/Oracle และ Stanford University บริษัทมีผู้ร่วมลงทุน ได้แก่ SoftBank Vision Fund 2, กองทุนและบัญชีที่จัดการโดย BlackRock, Intel Capital, GV, Walden International, Temasek, GIC, Redline Capital, Atlantic Bridge Ventures, Celesta และอื่นๆ อีกมากมาย

Advertisement

โดยเปิดโอกาสให้ผู้ใช้เข้าถึงโมเดลด้าน AI ที่ล้ำสมัยได้อย่างรวดเร็ว โดยสามารถแนะนำโมเดลให้เหมาะสมกับความต้องการของผู้พัฒนา

ขณะที่ มร.โรดริโก เหลียง (Rodrigo Liang) ผู้ร่วมก่อตั้งและ CEO ของ SambaNova Systems กล่าวว่า “Samba-1 นำเสนอโมเดล Open Source ที่ทันสมัยที่สุด ซึ่งช่วยให้นักพัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI เข้าถึงโมเดล AI ที่ดีที่สุดและเร็วที่สุดในโลก โดยการเข้าร่วมของ “ไต้ฝุ่น” ครั้งนี้สอดคล้องกับกลยุทธ์ของเรา อีกทั้งเรายินดีเป็นอย่างยิ่งที่จะได้นำ “ไต้ฝุ่น” เข้าสู่ Samba-1 ร่วมกับโมเดลชั้นนำระดับโลก” 

“นักพัฒนาด้าน AI ในอุตสาหกรรมต่างๆ รวมถึงอุตสาหกรรมด้านการเงินการธนาคารจะมีแพลตฟอร์มใหม่ที่ช่วยเพิ่มศักยภาพในการพัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI ของพวกเขา การนำโมเดล “ไต้ฝุ่น” มาอยู่บนแพลตฟอร์ม Samba-1 Composition of Experts จะช่วยส่งเสริมประสิทธิภาพของโมเดล “ไต้ฝุ่น” และลดต้นทุนการใช้งานให้น้อยลงกว่าที่เคย” มร.มาร์แชล ชอย (Marshall Choy) SVP Product ของ SambaNova Systems กล่าวเสริม

“ไต้ฝุ่น” ได้เป็นส่วนหนึ่งของแพลตฟอร์ม Samba-1 Composition of Experts ซึ่งเป็นเอกลักษณ์เฉพาะของ SambaNova ที่รวบรวมโมเดลสำหรับพัฒนานวัตกรรมด้าน AI ที่หลากหลายและสามารถแนะนำโมเดลเฉพาะทางที่ตอบโจทย์ผู้ใช้งานได้อย่ามีประสิทธิภาพและตรงกับความต้องการผู้ใช้งาน นอกจากนี้ “ไต้ฝุ่น” ทำงานบนชิป SN40L ของ SambaNova ด้วยหน่วยความจำ Dataflow 3 ชั้น ซึ่งช่วยให้การประมวลผลข้อมูลมีประสิทธิภาพมากยิ่งขึ้น

Advertisement
Continue Reading
Advertisement