ภาษาศาสตร์คอมพิวเตอร์ เมื่อโปรแกรมสื่อสารโต้ตอบมนุษย์ได้เหมือนจริง

ภาษาศาสตร์คอมพิวเตอร์ เมื่อโปรแกรมสื่อสารโต้ตอบมนุษย์ได้เหมือนจริง

ภาษาศาสตร์คอมพิวเตอร์ ศาสตร์ที่ทำให้ชีวิตในโลกดิจิทัลง่ายขึ้น และอยู่ในบริบทของอาชีพใหม่ๆ แห่งยุค 

โลกของเทคโนโลยีเดินหน้าไปเร็วมากจนเราอาจลืมสังเกตกันว่า ทุกวันนี้พวกเราคุยกับแชทบอตหรือโปรแกรมแปลภาษารู้เรื่องมากขึ้นกว่าแต่ก่อน ภาษาที่ดูเป็นธรรมชาติขึ้น ไม่แข็งห้วนเหมือนแต่ก่อน จนถึงขั้นโต้ตอบกับมนุษย์ได้อย่างเป็นธรรมชาติ นี่คือบทบาทของ ภาษาศาสตร์คอมพิวเตอร์ 

“ถ้าเราสังเกต Google Translate ตั้งแต่ปี 2019 มันเก่งขึ้นแบบก้าวกระโดด แปลภาษาดูเป็นมนุษย์ขึ้นแบบที่เราสามารถจับต้องได้ เห็นได้ชัดว่าเก่งขึ้น และเทคโนโลยีหลายๆ อย่างที่เกี่ยวกับภาษาก็เก่งขึ้นแบบกระโดดหมดเลย เพราะว่ามีการเปลี่ยนแปลงจากเทคโนโลยีตัวนี้ตัวเดียว ส่งผลให้เปลี่ยนไปทั้งวงการจริงๆ” 

รศ.ดร.อรรถพล ธำรงรัตนฤทธิ์ อาจารย์ประจำภาควิชาภาษาศาสตร์​ คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ยกตัวอย่างให้เราเห็นภาพความสำคัญของ ภาษาศาสตร์คอมพิวเตอร์ หรือ Computational Linguistics จากสิ่งใกล้ตัวที่อยู่ในมือของพวกเราทุกคนในทุกวันนี้

นิยามของวิชา ภาษาศาสตร์คอมพิวเตอร์ และที่มาในคณะอักษรฯ

ภาษาศาสตร์คอมพิวเตอร์ ,อรรถพล ธำรงรัตนฤทธิ์, อักษรศาสตร์, จุฬาลงกรณ์มหาวิทยาลัย

เริ่มต้นจากนิยามของภาษาศาสตร์คอมพิวเตอร์ “คือการนำเอาทฤษฎีทางภาษาศาสตร์มาแปลให้เป็นโปรแกรมคอมพิวเตอร์ที่เข้าใจภาษาคน ทำความเข้าใจได้ เขียนได้ สรุปได้ แปลได้”

ด้วยเหตุผลด้านความเกี่ยวเนื่องระหว่างเทคโนโลยีอย่างโปรแกรมคอมพิวเตอร์กับความรู้ทางด้านภาษาศาสตร์นี่เอง ที่ทำให้ผู้เรียนต้องทำความเข้าใจทั้งสองศาสตร์เพื่อให้เกิดการประมวลผลและใช้งานจริงกับมนุษย์ได้อย่างเป็นธรรมชาติ และถูกบรรจุอยู่ในคณะอักษรศาสตร์ที่เป็นแหล่งขององค์ความรู้ทางด้านภาษาศาสตร์

“ถ้าจะทำให้เครื่องคอมพิวเตอร์เข้าใจภาษามนุษย์ได้ จำเป็นต้องมีการรวบรวมข้อมูลที่เกี่ยวกับงานนั้นๆ เช่น ถ้าจะสอนให้แปลภาษา ก็ต้องรวบรวมข้อมูลที่เกี่ยวกับการแปล หรืออยากทำให้เครื่องสามารถพูดจาโต้ตอบได้ ก็ต้องมีข้อมูลเกี่ยวกับบทสนทนา เพราะฉะนั้น อันดับแรกก็คือ ภาษาศาสตร์มันช่วยในการตีกรอบโจทย์ของเราว่า ถ้าสมมติว่าจะทำโปรแกรมที่แชทกับเราได้ การโต้ตอบจะต้องเป็นไปในลักษณะไหน ภาษาเป็นอย่างไร จุดประสงค์คืออะไร”

“อันดับถัดมาคือการวิเคราะห์ภาษาซึ่งจะต้องทำในระดับต่างๆ ตั้งแต่ระดับย่อหน้า ระดับประโยค ระดับคำ ทั้งหมดนี้ต้องใช้ทฤษฎีทางภาษาศาสตร์มาจับทั้งนั้นเลย แต่ว่าก็ต้องยอมรับว่าช่วงนี้ เทคโนโลยีเน้นไปทางคอมพิวเตอร์เสียเยอะ แต่พื้นฐานของมันก็ยังคงอยู่ในภาษาศาสตร์”

อีกความสำคัญหนึ่งของภาษาศาสตร์คอมพิวเตอร์ที่คณะอักษรศาสตร์ให้ความสำคัญ คือการทำให้คณะนี้ยังคงสัมพันธ์สอดคล้องไปกับโลกในยุคดิจิทัล เพื่อสร้างทักษะที่อยู่ในศตวรรษนี้ให้กับนิสิต จึงเกิดเป็นสาขาใหม่ที่มีชื่อว่า เทคโนโลยีภาษา “คือการเอาภาษาศาสตร์มาจับกับเทคโนโลยีสารสนเทศต่างๆ”

ภาษาศาสตร์กับโลกดิจิทัลที่ต้องวิ่งตามให้ทัน

ผู้คนเห็นและได้สัมผัสกับพัฒนาการของนวัตกรรมด้วยมือของตัวเองจนเกิดเป็นความสะดวกสบายเช่นในปัจจุบัน โดยเฉพาะกับความล้ำหน้าในการสนทนาโต้ตอบและสื่อสารกับคอมพิวเตอร์เหมือนกับได้มีปฏิสัมพันธ์กับคนจริง คือก้าวกระโดดของวงการ “เพราะภาษาคือลักษณะเด่นเฉพาะมนุษย์ที่เราใช้ตัวนี้เป็นเครื่องมือสำหรับสื่อสาร พอสิ่งที่ไม่ใช่คนสามารถทำสิ่งนี้ได้ เราก็รู้สึกว่าสิ่งนี้น่าตื่นเต้น”

“สไลด์ที่สอนเปลี่ยนทุกปีเลย” อาจารย์อรรถพลเล่าแบบติดตลก “เพราะเทคโนโลยีมันเปลี่ยนเร็วจริงๆ โดยเฉพาะอย่างยิ่งเมื่อปี 2018 ตอนนั้นจบปริญญาเอกแล้ว มันมีเทคโนโลยีที่มาปฏิวัติวงการ ทำให้สิ่งที่เราเคยทำ วิธีเดิมๆ ที่เราเคยใช้ต้องโยนทิ้งหมด ตอนนี้เทคโนโลยีเก่าๆ เรียนไปเพื่อเป็นประวัติศาสตร์ ว่านี่คือสิ่งที่เราเคยคิดมา แล้วมันสร้างแรงบันดาลใจอะไรที่เราใช้ตอนนี้  เปลี่ยนไปเยอะมากทั้งแง่ของวิธีการคิด อัลกอริธึม และความแม่นยำ”

อาจารย์อรรถพลลงลึกถึงโมเดลตัวใหม่ที่ปฏิวัติและพาวงการภาษาศาสตร์คอมพิวเตอร์เปลี่ยนแปลงแบบพลิกโลก “มาจากพื้นฐานที่ว่า ถ้าเราจะทำความเข้าใจกับประโยคหนึ่งต้องใช้อะไรบ้าง วิเคราะห์อย่างไร แล้วนักวิทยาศาสตร์ผู้ค้นพบก็สร้างโมเดลตัวนี้ขึ้นมา พอรวมกับประสิทธิภาพของคอมพิวเตอร์ในยุคปัจจุบันที่ดีขึ้นมาก จึงเกิดเป็นเทคโนโลยีตัวนี้”

“วิธีการคือ เราให้คอมพิวเตอร์อ่านข้อมูลเป็นแสนล้านคำ อ่านเยอะๆ แล้วก็พยายามเรียนรู้จากสิ่งนั้นให้ได้มากที่สุด พอคอมพิวเตอร์ต้องรันนานๆ ก็ต้องมีกำลังสูง ปรากฏว่าทำไอเดียนี้สำเร็จ จึงกลายเป็นว่าเรามีคอมพิวเตอร์ที่มีความรู้ทางภาษาที่จะเอาไปประยุกต์กับการแปล การสรุปความ การวิเคราะห์ความรู้สึก การแบ่งประโยค การวิเคราะห์คำ” และเป็นจุดเริ่มต้นที่แตกแขนงออกไปสู่การใช้ภาษาศาสตร์คอมพิวเตอร์ในการพัฒนาโปรดักต์ใหม่ๆ ให้กับวงการดิจิทัล

อาชีพแห่งอนาคต ที่ต่อยอดไปได้หลากหลายสาขา

ภาษาศาสตร์คอมพิวเตอร์ ,อรรถพล ธำรงรัตนฤทธิ์, อักษรศาสตร์, จุฬาลงกรณ์มหาวิทยาลัย

จบสาขานี้จะทำอะไรได้บ้าง “ถ้าจะทำตรงสาย ก็จะเป็นสาย IT เพราะว่าเราเขียนโปรแกรมเป็น เรารู้ว่าคอมพิวเตอร์ทำงานอย่างไร เรารู้ว่าระบบกับข้อมูลต่างๆ ต้องจัดการอย่างไรบ้าง หรือจะเป็น Data Scientist หรือ Data Analyst เพราะเราให้เครื่องมือในการวิเคราะห์ข้อมูลต่างๆ ระหว่างการเรียนแล้ว ที่เหลือเรื่องพวกธุรกิจหรือการตลาดก็ต้องไปเรียนรู้เพิ่มเติมหน้างาน หรือจะทำงานสายภาษาศาสตร์ก็ได้ เพราะหลักสูตรครอบคลุมในเรื่องภาษาศาสตร์เป็นหลักด้วยเช่นกัน”

หากแบ่งหมวดหมู่ใหญ่ๆ ของการเรียน นิสิตจะต้องเรียนรู้ทั้งเรื่องภาษาศาสตร์และการเขียนโปรแกรม ซึ่งทั้งสองสิ่งมีจุดร่วมอยู่ที่การคิดเชิงวิเคราะห์​

“ภาษาศาสตร์จะเป็นการเรียนเรื่องการวิเคราะห์ประโยค การวิเคราะห์คำ การวิเคราะห์เสียง การวิเคราะห์ความหมาย หนึ่งประโยคประกอบด้วยอะไรบ้างถึงเกิดเป็นประโยคได้ มันมีการแยกเป็นส่วนๆ แล้วดูว่าเวลามันประกอบกันมันเกิดอะไรขึ้น เช่นเดียวกันกับการสอนในฝั่งโปรแกรมที่จะต้องเรียนรู้การจัดการโปรดักต์ทางดิจิทัลและฐานข้อมูลจำนวนมาก เราจะนำเสนอข้อมูลให้เป็นรูปแบบใด หรือทำอย่างไรให้ข้อมูลเป็นประโยชน์มากที่สุด”

อาจารย์อรรถพลยกตัวอย่างการนำภาษาศาสตร์คอมพิวเตอร์ไปใช้งานจริงกับการทำวิจัยการตลาด “ถ้าเป็นเมื่อก่อน พอเราได้คำตอบจากการวิจัยกลุ่ม จะต้องมีคนมาอ่านแล้วสรุปให้ฟัง แต่ของใหม่คือเราสามารถเอาคอมเมนต์จากหน้าเพจ ทวิตเตอร์ หรือหน้าร้านค้าจากหลายแหล่งแบบเรียลไทม์มาสรุปรวมกันได้โดยให้คอมพิวเตอร์เป็นตัวช่วยวิเคราะห์ แล้วตรวจสอบย้อนกลับไปได้ว่าความนิยมเริ่มต้นจากตรงไหน เพราะฉะนั้นอะไรที่เคยใช้คนอ่าน เราก็พยายามใช้เครื่องมือมาทำแทนทั้งเรื่องการวิเคราะห์ข้อมูล หรือแปลภาษา”

ภาษาศาสตร์คอมพิวเตอร์ ,อรรถพล ธำรงรัตนฤทธิ์, อักษรศาสตร์, จุฬาลงกรณ์มหาวิทยาลัย

เราถามถึงอนาคตของสายงานวิชานี้ ซึ่งอาจารย์ให้มุมมองที่กว้างไกลและชวนเราเปิดความคิดออกไปกว้างขึ้นกว่าที่เคย “ในมุมมองผม อยากได้คนที่ทำ Natural Language Processing ก็คือการวิเคราะห์ข้อมูลภาษาโดยคอมพิวเตอร์หลายๆ แบบ ซึ่งอันนี้เป็นทักษะที่หายากอย่างหนึ่ง และเป็นศัพท์ที่ค่อนข้างใหม่ จึงหาคนทำและผู้เชี่ยวชาญได้ค่อนข้างยาก ผมหวังว่า หลายคนที่จบไปแล้วจะเป็นนักวิทยาศาสตร์ข้อมูลได้จริงๆ เพราะเป็นศาสตร์ใหม่ เราสามารถสร้างมูลค่าจากข้อมูลเหล่านั้นได้จริง และเป็นเทรนด์ของเทคโนโลยีที่ยังไปต่อได้อีกเยอะ”

ต่อยอดจากวิชาเอกเทคโนโลยีภาษา นิสิตสามารถเลือกวิชาโทได้ตามความสนใจ ซึ่งก็กว้างขวางออกไปได้หลากหลายหมวดหมู่ จะเป็นการตลาด เศรษฐศาสตร์ หรืองานออกแบบ เพื่อให้ทักษะสอดคล้องเต็มที่ “เราเน้นการปฏิบัติเยอะ แต่เรื่องนี้ไม่ใช่แค่เทคนิคอย่างเดียว จะต้องไปอยู่ในบริบทอื่นๆ ตลอดเวลา หรืออาชีพใหม่ๆ พวกสายงานข้อมูล เราจะพูดถึง Digital Product เราไม่ได้สร้างข้าวของที่จับต้องได้ แต่สร้างผลิตภัณฑ์เชิงดิจิทัล เหล่านี้จะมีอุปสรรคอย่างไรบ้าง ต้องการการจัดการอย่างไร หรือการออกแบบ UX/UI อย่างไร อันนี้เป็นภาพรวมทักษะของคนจบหลักสูตรนี้ และต่อยอดได้ในเรื่องที่สนใจ”

“ผมว่าวิชานี้มีความเป็นปรัชญา” อาจารย์อรรถพลทิ้งท้าย “ความหมายของมันคืออะไร เราจะรู้ได้อย่างไรว่าสิ่งที่เราเข้าใจกับเขาเข้าใจมันตรงกัน ซึ่งความสำคัญอยู่ตรงที่ตอนเราเอาไปเขียนเป็นโปรแกรม จะรู้ได้อย่างไรว่าคอมพิวเตอร์เข้าใจอย่างที่คนพูดมาจริงๆ เพื่อให้สามารถแปลและสื่อสารได้ ก็มีผลต่อการดีไซน์การโต้ตอบ ซึ่งจะยากขึ้นไปอีกระดับ”

“หรือคำหนึ่งคำ อย่างคำว่า ‘โรบอต’ เมื่อก่อนเราจะเห็นภาพเป็นหุ่นกระป๋อง สมัยนี้เป็นแขนกลไปแล้ว การตีความมันต่างกัน อีกห้าสิบปีความหมายก็เปลี่ยนไปอีก เพราะความหมายคือสิ่งที่จับต้องไม่ได้ นี่คือความท้าทาย”

เรื่อง ณัฐนิช ชัยดี

ภาพ เอกรัตน์ ปัญญะธารา


อ่านเพิ่มเติม AiCE CMKL หลักสูตรวิศวกรรมแห่งอนาคต ที่ทักษะและความรู้ออกแบบตามผู้เรียน

Recommend