
คิดอย่างไรกันบ้างกับนวัตกรรมใหม่จาก OpenAI อย่าง Sora ที่สามารถสร้างวิดีโอจากข้อความได้อย่างสมจริง?
Sora นั้น เป็นโมเดลปัญญาประดิษฐ์หรือ AI ที่สามารถสร้างวิดีโอความยาวสูงสุดได้ 1 นาที จากการใช้ Diffusion model เพื่อสร้างวิดีโอหรือดัดแปลงวิดีโอที่มีความซับซ้อน
แม้ว่าจะยังอยู่ในช่วงพัฒนาระบบ และยังไม่เปิดให้คนทั่วไปเข้าใช้งาน (ยังจำกัดเฉพาะสำหรับกลุ่มนักวิจัย นักออกแบบและศิลปินเท่านั้น เพื่อให้ประเมินและพัฒนาระบบการใช้งานให้ดีงามแน่ ๆ ก่อน) ก็ถือว่าเป็นนวัตกรรมที่สังคมวงกว้างให้ความสนใจอยู่ไม่น้อยเลย เพราะนี่หมายถึงโลกแห่งสื่อวิดีโอที่ไม่ได้เกิดจากการไปถ่ายทำจริง แต่มาจากการจัดวางล้วน ๆ
ตัวอย่างผลงานของ Sora ซึ่งเพิ่งปล่อยออกมาสู่สายตาชาวโลกไปเมื่อวันที่ 17 กุมภาพันธ์ที่ผ่านมา เป็นวิดีโอจากโจทย์ข้อความ (Prompt) ที่ระบุว่า “ผู้หญิงเก๋มีสไตล์ เดินอยู่บนท้องถนนในโตเกียว ซึ่งเต็มไปด้วยแสงไฟนีออนสว่างอ่อนๆ และป้ายไฟเต็มไปหมด ผู้หญิงใส่เสื้อแจ็กเก็ตหนังสีดำ เดรสยาวสีแดง รองเท้าบู๊ทสีดำ และถือกระเป๋าสีดำ เธอใส่แว่นตากันแดด ทาลิปสติกแดง เดินด้วยความมั่นใจ สบาย ๆ ท้องถนนเจิ่งนองไปด้วยน้ำ ซึ่งผิวน้ำสะท้อนแสงไฟเป็นสี ๆ นอกจากนี้ก็ยังมีคนเดินถนนอื่น ๆ อีก”
ระบบการตีโจทย์ของ Sora นั้นถือว่าล้ำมาก เพราะมากกว่าการสร้างวิดีโอให้มีองค์ประกอบตามข้อความครบถ้วน แต่ยังสามารถตีความบริบทของโจทย์ได้อีกด้วย เช่น การตีโจทย์ว่าองค์ประกอบเหล่านั้น ควรจะเคลื่อนไหวไปในทิศทางไหน หรือมีความเกี่ยวเนื่องระหว่างกันอย่างไร ให้มีความสมเหตุสมผลที่สุด ซึ่งเป็นคุณสมบัติที่น่าจะเข้ามาเปลี่ยนแปลงหรือยกระดับอุตสาหกรรมบันเทิงและสื่อเป็นอย่างมาก
ทว่าสิ่งที่หลาย ๆ ภาคส่วนในสังคมน่าจะกำลังเห็นตรงกัน คือ อีกด้านหนึ่งของเหรียญแห่งนวัตกรรม AI ซึ่งก็คือประเด็นเรื่องของความรับผิดชอบในการนำเอา Sora ไปใช้งานในโลกแห่งความเป็นจริงนั่นเอง
อ้างอิง
https://openai.com/sora