Tuesday, 7 May 2024

Prompt คืออะไร สำคัญยังไงกับ Generative AI

“วันนี้ลุงจะมาเล่าเรื่อง AI ให้ฟังแบบย่อๆ ด้วยศัพท์แสงของวงการออกแบบและก่อสร้าง”

การมาของ Generative AI กำลังจะเปลี่ยนแปลงวิธีการทำงานของหลายๆอาชีพ ที่เห้นได้ชัดที่สุดในปัจจุบันคือ กราฟฟิกดีไซเนอร์ สามารถเอา Generative AI มาช่วยให้ทำงานได้เร็วขึ้น หรือแม้แต่โปรแกรมเมอร์ ที่สามารถสั่งให้ AI อย่าง Chat GPT เขียน Coding ให้ได้เลย ถึงแม้ใช้งานไม่ได้ 100% แบบในหนัง แต่ก็ช่วยลดเวลาได้มาก

ในวงการออกแบบและก่อสร้าง ถึงแม้จะยังไม่ชัดเจน ว่า AI จะมาช่วยอะไรได้บ้าง แต่อีกไม่นานแน่นอน ถ้าดูจากพัฒนาการของ Generative AI ที่ผ่านมาช่วง 1 ปีนี้

หากดูจากประวัติศาสตร์แล้ว เราคงไม่สามารถหลีกเลี่ยงเทคโนโลยีที่กำลังมาทดแทนเครื่องมือเก่าๆได้ ยกตัวอย่างเช่น การเขียนแบบด้วยมือ ก็แทบจะไม่เห็นแล้ว เพราะมันถูกทดแทนด้วย CAD ดังนั้นเราจึงต้องเรียนรู้มันไว้บ้าง

เขียนถึงตรงนี้แล้ว ลุงก็เริ่มเครียด “นี่กุต้องเรียนรู้เครื่องมือใหม่อีกแล้วเรอะ จาก CAD มา BIM ยังทำไม่เป็นเลยว่ะ นี่ต้องมารู้จัก Generative AI อีก แต่เอาเถอะ เลี่ยงไม่ได้นี่”

ในบทความนี้ เราจะมาพูดถึง Prompt ซึ่งเป็นพื้นฐานของ Image Generative AI

prompt เปรียบเสมือนคำสั่ง ที่เราจะใส่ลงไป ยิ่งละเอียดมากก็จะได้รูปภาพที่ตรงใจเรามากที่สุด

โครงสร้างของ prompt (prompt anatomy) คือ Subject , Description , Style

ในบทความนี้ เราจะใช้ Image Creator from Microsoft Bing (ปัจจุบันให้ใช้ฟรี อนาคตเสียตังแน่นอน) มาลอง Gen รูปที่เราอยากทดลองกัน

เรามาลองใส่ prompt คำว่า home ผลลัพธ์ตามภาพด้านล่าง


“ยังๆ ลุงไม่ค่อยชอบ”

มาใส่คำอธิบายให้มากขึ้นคือ home in the jungle ได้ผลลัพธ์ตามภาพด้านล่าง


ทีนี้ลุงไม่อยากได้ บ้านบนต้นไม้ จึงใส่คำอธิบายให้มากขึ้นคือ home on ground in the jungle ได้ผลลัพธ์ตามภาพด้านล่าง


ตอนนี้ลุงเปลี่ยนใจ ไม่ชอบบ้านสไตล์แบบนี้แล้ว อยากได้แบบ modern จึงเพิ่มคำอธิบายเป็น home on ground in the jungle, modern style ได้ผลลัพธ์ตามภาพด้านล่าง ซึ่งเริ่มดูสวยงาม ตรงความต้องการแล้ว


จะเห็นว่า AI Generate ภาพออกมาตาม prompt ที่เราใส่ลงไป หากเราใส่คำที่น้อยเกินไป เช่น home มันก็จะ random ภาพมาให้แบบกว้างๆ แต่พอเพิ่มรายละเอียดเข้าไปมากๆเข้า รูปก็จะเริ่มมีรายละเอียดตามที่เราใส่ แต่จะตรงใจเรามากแต่ไหน ก็ขึ้นอยู่กับว่า เราเข้าใจโครงสร้างของ prompt มากแค่ไหน ให้สังเกตุว่ารูปด้านบนทั้งหมด เป็นแนว 3D Rendering แต่รูป home in the jungle จะออกแนวการ์ตูน นั่นเพราะว่าฐานข้อมูลของ Bing อาจจะมองว่า keyword นี้ มักใช้กับงานแนวนี้นั่นเอง

คำถามคือ แล้วถ้าเราอยากให้มันเป็นแนว 3D Rendering ได้ไหม มาลองดูกัน

prompt : home in the jungle, 3d rendering ได้ผลลัพธ์ตามภาพด้านล่าง ซึ่งตัวบ้าน กลับไม่อยู่บนต้นไม้แล้วซะงั้น


“อย่าดื้อสิวะ Bing” เป็นคำที่หลุดออกจากปากลุง หลังเห็นภาพล่าสุด ที่บ้านไม่อยู่บนต้นไม้แล้ว จึงจัดการกระแทก keyboard เพิ่มคำว่า on tree เข้าไป


prompt : home on tree in the jungle, 3d rendering ได้ผลลัพธ์ตามภาพด้านล่าง ซึ่งบ้านไปอยู่บนต้นไม้แล้ว

“555 เอ็งมันแค่ AI ต้องทำตามคำสั่งข้า” ลุงหัวเราะออกมาอย่างผู้ชนะ

ถึงตรงนี้แล้ว คงเข้าใจ Image Generative AI กันมากขึ้น แต่จะเอาไปใช้ยังไง ใช้ใน Process งานไหน และ ใช้ได้ Advance แค่ไหน ขึ้นอยู่กับประสบการณ์ของแต่ละคน แล้วลุงจะมาคอยอัพเดตให้เรื่อยๆ


ด้วยความปารถนาดี จาก ลุงวิท ผู้เชี่ยวชาญด้าน AV