Generative AI
ทุกวันนี้ AI มีบทบาทกับชีวิตประจำวันมาก สำหรับ AI ถ้าเจาะลึกลงไปอีก เราอาจจะได้ยินคำว่า Generative Ai หรืออีกชื่อที่เรียกกันคือ generative artificial intelligence เป็น AI แบบหนึ่งที่โฟกัสด้านการสร้างระบบที่สามารถสร้าง (generate) คอนเทนต์ที่ใหม่และไม่ซ้ำใคร ไม่ว่าจะเป็นรูปภาพ, ข้อความ, เพลง, รวมถึงแม้แต่วิดีโอ นี่แตกต่างจากระบบ AI อื่น ๆ ที่ถูกออกแบบมาเพื่อ task ใดก็ตามที่เฉพาะเจาะจง เพราะจุดมุ่งหมายของ generative AI คือการทำความเข้าใจและการทำซ้ำในส่วนของรูปแบบและโครงสร้างซึ่งพบจาก training data เพื่อที่จะสร้างผลลัพธ์ที่มีความสร้างสรรค์และแปลกใหม่
โดยทั่วไป โมเดลของ generative AI จะถูกทำการฝึกอยู่บนชุดข้อมูลขนาดใหญ่ โดยการทำการเรียนรู้รูปแบบและสร้างคอนเทนต์ใหม่นั้นจะต้องใช้เทคนิคต่าง ๆ เช่น deep learning และ neural networks นอกจากนี้ โมเดล generative AI ที่เป็นที่นิยมมากโมเดลหนึ่งคือ ประเภทหนึ่งคือ generative adversarial network (GAN) ซึ่งประกอบด้วยองค์ประกอบสองอย่าง คือตัวสร้าง (generator) และตัวจำแนก (discriminator) ตัวสร้างนั้นจะสร้าง sample ใหม่ขึ้นมา เช่น รูปภาพ ในขณะที่ตัวจำแนกจะทำการประเมิน sample ที่ถูกสร้างขึ้นมานี้ และให้ฟีดแบคกลับไปยังตัวสร้าง หรือเรียกว่ากระบวนการฝึกอบรมแบบ adversarial ซึ่งจะเห็นได้ว่าช่วยในเรื่องของการปรับปรุงคุณภาพและความสมจริงของคอนเทนต์ที่สร้างขึ้นได้เป็นอย่างมากเมื่อเวลาผ่านไป
เราสามารถนำ generative AI ไปใช้งานได้หลายด้าน ทั้งศิลปะ, การออกแบบ, ความบันเทิง, และการสังเคราะห์ข้อมูล เทคโนโลยีนี้สามารถใช้เพื่อสร้างภาพที่เหมือนจริง, สร้างตัวละครเสมือนจริง, แต่งเพลง, สร้างข้อความที่ใช้ภาษาได้อย่างเป็นธรรมชาติ, ปรับปรุงข้อมูลสำหรับการฝึกอบรมโมเดล AI อื่น, และอื่น ๆ อีกมากมาย แต่อย่างไรก็ตาม สิ่งที่สำคัญคือเรื่องที่คุณภาพโมเดล generative AI นั้นขึ้นอยู่กับข้อมูลที่ตัวโมเดลได้รับการฝึกอบรมมาเท่านั้น และผู้ใช้งานจำเป็นจะต้องพิจารณาอย่างรอบคอบถึงการหลีกเลี่ยงอคติและถึงด้านข้อกังวลด้านจริยธรรมในผลลัพธ์ที่ได้ออกมา
show case ของ generative AI
1. DeepDream: DeepDream เป็นเทคนิก generative AI technique ที่ถูกพัฒนาโดย Google ซึ่งใช้ neural networks ขนาดลึกในการสร้างภาพที่เหมือนฝันและเหมือนจริงโดยการยกระดับและขยายรูปแบบที่เจอในภาพที่มีอยู่แล้ว เทคโนโลยีนี้ถูกใช้เพื่อสร้างภาพที่ดูอาร์ตและดึงดูดจากการเปลี่ยนภาพธรรมดาให้มีองค์ประกอบที่ abstract และน่าหลงใหล
2. StyleGAN: StyleGAN (Generative Adversarial Network) เป็นโมเดล generative AI ที่ถูกพัฒนาโดย NVIDIA ซึ่งถูกนำมาใช้ในการสร้างภาพใบหน้าคนที่มีความละเอียดสูงและสมจริงเป็นอย่างมาก โดยควบคุมได้ถึงรายละเอียดทั้งอายุ, เพศ, การแสดงออกทางสีหน้า ความสามารถในการปรับแต่งนี้ทำให้ผลลัพธ์ของใบหน้าสังเคราะห์เหล่านี้หลากหลาย
3. DALL·E ของ OpenAI: DALL·E เป็นโมเดล generative AI model ที่ถูกพัฒนาโดย OpenAI ที่สามารถสร้างรูปภาพจากข้อความอธิบายได้ โดยสามารถทำความเข้าใจและตีความ prompt เพื่อสร้างภาพที่มีรายละเอียดสูงและมีจินตนาการ เช่น หากเราให้คำอธิบายอย่าง “เก้าอี้เท้าแขนที่เป็นรูปอโวคาโด” DALL·E ก็สามารถสร้างรูปที่มีเอกลักษณ์ของตัวเองซึ่งตรงกับสิ่งที่เราต้องการนี้ได้
4. DeepArt: DeepArt เป็นแอปพลิเคชัน web-based ที่ใช้ generative AI ในการแปลงภาพถ่ายเป็นงานศิลปะที่ได้รับแรงบันดาลใจจากศิลปินชื่อดังต่าง ๆ โดยใช้ neural networks ในการวิเคราะห์คอนเทนต์และสไตล์ของภาพ input แล้วจึงรวมเข้าด้วยกันเพื่อสร้างรูปภาพใหม่ที่ดูเหมือนของเดิมแต่เป็นในสไตล์ของศิลปินที่เราต้องการ
5. MuseNet ของ Magenta: MuseNet ที่ถูกพัฒนาโดย Magenta (โปรเจ็กต์วิจัยของ Google เกี่ยวกับ AI และดนตรี) เป็นโมเดล generative AI that ที่สามารถแต่งเพลงเองได้หลากหลายสไตล์และแนวเพลง โดยสามารถสร้างองค์ประกอบทางดนตรีที่สอดคล้องและประสานกันเป็นอย่างดีจากการเรียนรู้จากข้อมูลเกี่ยวกับดนตรีจำนวนมหาศาล MuseNet จึงแสดงให้เห็นถึงศักยภาพของ generative AI ในวงการที่ต้องการความคิดสร้างสรรค์อย่างการประพันธ์เพลงได้เป็นอย่างดี
showcase เหล่านี้แสดงถึงการใช้งานที่สร้างสรรค์และหลากหลายของ generative AI ในวงการต่าง ๆ ทั้งความสามารถด้านการสร้างรูปภาพ, เพลง, และแม้แต่การแปลงคอนเทนต์ที่มีอยู่แล้วให้กลายเป็นรูปแบบใหม่และไม่ซ้ำใคร