วันจันทร์, 13 ตุลาคม 2568

Sora นวัตกรรมใหม่จาก OpenAI สร้างวิดีโอจากข้อความ

20 ก.ย. 2024
101

คิดอย่างไรกันบ้างกับนวัตกรรมใหม่จาก OpenAI อย่าง Sora ที่สามารถสร้างวิดีโอจากข้อความได้อย่างสมจริง?

Sora นั้น เป็นโมเดลปัญญาประดิษฐ์​หรือ AI ที่สามารถสร้างวิดีโอความยาวสูงสุดได้ 1 นาที จากการใช้ Diffusion model เพื่อสร้างวิดีโอหรือดัดแปลงวิดีโอที่มีความซับซ้อน

แม้ว่าจะยังอยู่ในช่วงพัฒนาระบบ และยังไม่เปิดให้คนทั่วไปเข้าใช้งาน (ยังจำกัดเฉพาะสำหรับกลุ่มนักวิจัย นักออกแบบและศิลปินเท่านั้น เพื่อให้ประเมินและพัฒนาระบบการใช้งานให้ดีงามแน่ ๆ ก่อน) ก็ถือว่าเป็นนวัตกรรมที่สังคมวงกว้างให้ความสนใจอยู่ไม่น้อยเลย เพราะนี่หมายถึงโลกแห่งสื่อวิดีโอที่ไม่ได้เกิดจากการไปถ่ายทำจริง แต่มาจากการจัดวางล้วน ๆ

ตัวอย่างผลงานของ Sora ซึ่งเพิ่งปล่อยออกมาสู่สายตาชาวโลกไปเมื่อวันที่ 17 กุมภาพันธ์ที่ผ่านมา เป็นวิดีโอจากโจทย์ข้อความ (Prompt) ที่ระบุว่า “ผู้หญิงเก๋มีสไตล์ เดินอยู่บนท้องถนนในโตเกียว ซึ่งเต็มไปด้วยแสงไฟนีออนสว่างอ่อนๆ และป้ายไฟเต็มไปหมด ผู้หญิงใส่เสื้อแจ็กเก็ตหนังสีดำ เดรสยาวสีแดง รองเท้าบู๊ทสีดำ และถือกระเป๋าสีดำ เธอใส่แว่นตากันแดด ทาลิปสติกแดง เดินด้วยความมั่นใจ สบาย ๆ ท้องถนนเจิ่งนองไปด้วยน้ำ ซึ่งผิวน้ำสะท้อนแสงไฟเป็นสี ๆ นอกจากนี้ก็ยังมีคนเดินถนนอื่น ๆ อีก”

ระบบการตีโจทย์ของ Sora นั้นถือว่าล้ำมาก เพราะมากกว่าการสร้างวิดีโอให้มีองค์ประกอบตามข้อความครบถ้วน แต่ยังสามารถตีความบริบทของโจทย์ได้อีกด้วย เช่น การตีโจทย์ว่าองค์ประกอบเหล่านั้น ควรจะเคลื่อนไหวไปในทิศทางไหน หรือมีความเกี่ยวเนื่องระหว่างกันอย่างไร ให้มีความสมเหตุสมผลที่สุด ซึ่งเป็นคุณสมบัติที่น่าจะเข้ามาเปลี่ยนแปลงหรือยกระดับอุตสาหกรรมบันเทิงและสื่อเป็นอย่างมาก

ทว่าสิ่งที่หลาย ๆ ภาคส่วนในสังคมน่าจะกำลังเห็นตรงกัน คือ อีกด้านหนึ่งของเหรียญแห่งนวัตกรรม AI ซึ่งก็คือประเด็นเรื่องของความรับผิดชอบในการนำเอา Sora ไปใช้งานในโลกแห่งความเป็นจริงนั่นเอง

อ้างอิง
https://openai.com/sora