อาจารย์ ดร.อรรถพล ธำรงรัตนฤทธิ์: Computational Linguistics อาชีพที่ผสมผสานความลงตัวของวิทย์และศิลป์

อาจารย์ ดร.อรรถพล ธำรงรัตนฤทธิ์ เรียนจบชั้นมัธยมปลายในสายศิลป์ - ฝรั่งเศส จากนั้นได้ทุนของรัฐบาลไปเรียนต่อที่มหาวิทยาลัย Stanford ในเอกที่เรียกว่า Symbolic Systems ซึ่งเป็นสหสาขาวิชาที่รวมเอาภาษาศาสตร์ ปรัชญา จิตวิทยา และวิทยาศาสตร์คอมพิวเตอร์เข้าไว้ด้วยกัน หลังจากจบแล้วอาจารย์ได้เรียนต่อปริญญาโทและเอกในด้าน การประมวลภาษาธรรมชาติ หรือ NLP (Natural Language Processing) ได้ทำงานอยู่ใน Silicon Valley 2 ปีก่อนเลือกกลับมาประเทศไทย

 

ปัจจุบันอาจารย์ ดร.อรรถพล ธำรงรัตนฤทธิ์ สอนอยู่ที่ภาควิชาภาษาศาสตร์ คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย หลายคนอาจจะสงสัยว่าทำไมคณะอักษรศาสตร์จึงเกี่ยวข้องกับ Computer Science หรือ Computational Linguistics นั่นเป็นเพราะว่าวิชาที่อาจารย์อรรถพลสอนคือ ศาสตร์ที่นำทฤษฎีทางภาษาศาสตร์มารวมกับเทคโนโลยีต่าง ๆ เป็นการศึกษาที่ใช้การผสมผสานระหว่างทางวิทยาการคอมพิวเตอร์และทฤษฎีทางภาษาศาสตร์ได้อย่างลงตัว จะน่าสนใจเพียงใดตามไปอ่านบทสนทนาระหว่าง JobThai และ อาจารย์ ดร.อรรถพล พร้อมกันได้เลยค่ะ

 

 

  • Computational Linguistics คือการใช้คอมพิวเตอร์ในการวิเคราะห์ข้อมูลทางภาษาแทนคน 
  • Computational Linguistics เป็นศาสตร์ที่รวมเอาทั้งความรู้ทางวิทยาศาสตร์คือการใช้คอมพิวเตอร์ และทางศิลป์คือความเข้าใจในภาษาเข้ามาผสมผสานกันอย่าลงตัว
  • ศาสตร์ Computational Linguistics พยายามที่จะนำเทคโนโลยีเข้ามาทำให้การทำงานเป็นรูปแบบอัตโนมัติมากขึ้น เพื่อทดแทนแรงงานที่กำลังจะขาดแคลนในอนาคต
  • คนที่จะมาทำงานสาย Computational Linguistics ต้องมีใจรักทางด้านภาษา ชอบการวิเคราะห์ภาษา ส่วนทักษะทางคอมพิวเตอร์นั้นสามารถเรียนเพิ่มกันได้

 

 

อธิบาย Computational Linguistics ให้คนที่ไม่เคยรู้จักมาก่อนทราบหน่อยค่ะ

Computational Linguistics คือการใช้คอมพิวเตอร์วิเคราะห์ข้อมูลทางภาษา พูดให้เข้าใจง่ายก็คืออยากให้คอมพิวเตอร์สามารถเข้าใจภาษาและทำหน้าที่ทางด้านภาษาต่าง ๆ แทนคนได้ เช่น การตรวจเรียงความ จากที่ต้องให้ครูมานั่งอ่านและตรวจเองก็ใช้เทคโนโลยีเพื่อดูว่านักเรียนใช้คำถูกไหม มีการสะกดผิดไหม เขียนแล้วอ่านรู้เรื่องไหม มีการสลับตำแหน่งประโยคไหม เป็นการวิเคราะห์ทั้งในระดับคำและระดับประโยคเพื่อจะประเมินได้ว่างานมีคุณภาพดีมากน้อยแค่ไหน หรือการแปลหนังสือ การแปลภาพยนตร์ ที่จะสามารถนำเทคโนโลยีเข้ามาปรับใช้เพื่อการตรวจดูความหมายของการแปล และการสนทนาพูดคุยจากเดิมที่เราต้องโทรหาใครสักคนก็อาจเปลี่ยนไปสู่การใช้ Chatbot แทนได้

 

สาขา Computational Linguistics เกิดขึ้นมานานหรือยัง 

จริง ๆ เป็นศาสตร์ที่เกิดขึ้นมานานแล้วแต่ว่าเทคโนโลยีสมัยก่อนที่จะนำมาเสริมกับศาสตร์นี้ยังไม่ก้าวหน้ามากเท่าปัจจุบัน สมัยก่อนจะเน้นไปทางการใช้ทฤษฎีให้เกิดประโยชน์มากกว่า ยกตัวอย่างในสมัยนั้นก็คือ Chatbot หรือหุ่นยนต์นักสนทนาที่สามารถตอบคำถามเราได้ ฟังเราได้ มีมาตั้งแต่ 50 ปีที่แล้วแต่จะยังไม่เก่งเท่าในปัจจุบัน Chatbot สมัยนี้ได้รับเทคโนโลยีที่มาจาก Computer Science ที่ก้าวหน้ามาก ๆ ทำให้สามารถเข้าใจว่านี่คือคำถามชนิดใด จะไปหาคำตอบมาได้จากไหน หรือต้องการเป็นประโยคคำสั่งหรือเปล่า ตอนนี้มี Alexa Series ซึ่งเป็น Chatbot ที่รับคำสั่งจากเราได้ เขียน Text เปิดไฟ ปรับแอร์ เปิดตู้เย็น เรียกว่าเป็นความพยายามในการนำ AI มาใช้ให้มีบทบาทมากขึ้นนั่นเองครับ

 

 

มีอาชีพที่ใช้ศาสตร์ Computational Linguistics เฉพาะทางเลยไหม

แล้วแต่ว่าจะเน้นหนักไปทางไหนระหว่างทาง Engineering หรือ Linguistics มากกว่ากัน เพราะคนที่จะมาทำ Computational Linguistics ต้องสามารถเขียนโมเดลที่เข้าใจภาษาแทนคนได้ ส่วนใหญ่แล้วต้องเรียนมาทาง Computational Linguistics เฉพาะเลย โดยปกติจะหาคนที่เป็น Data Scientist แล้วมาทำงานด้านนี้ ซึ่งก็จะค่อนข้างหายากเพราะมันเฉพาะทางมาก ๆ หรือถ้าไม่หนักไปทาง Computational Linguistics ก็อาจจะเป็นคนที่คอยตรวจสอบข้อมูลว่ามันเรียบร้อยจริงไหม แล้วส่งต่อให้ Data Scientist ไปพัฒนาเป็นผลิตภัณฑ์ต่อได้ก็มี

 

ถ้าเป็นอาชีพ ก็จะมีอาชีพที่เราอาจไม่เคยได้ยินเลยแบบ Linguistic Data Manager ก็คือคนดูแลข้อมูลที่ไม่เกี่ยวข้องกับตัวเลขเลย แต่เป็นระบบภาษาของคนที่พิมพ์เข้ามาแล้วจัดระเบียบเพื่อให้คนอื่นนำไปใช้ต่อได้ง่าย หรืออาจจะเป็น Linguistic Annotator ก็คือคนที่ทำหน้าที่จัดระเบียบข้อมูลกรณีที่ Data Scientist อยากทดสอบโมเดลเพื่อไปวิเคราะห์เช่น เขาพูดเรื่องแย่หรือดีเกี่ยวกับบริษัท นอกจากนี้ยังมีคนเขียน Guideline ว่าดีแปลว่าอะไร พูดในแง่ดีคือมีลักษณะไหนบ้าง ต้องวิเคราะห์ภาษาและลงไปอ่านจริง ๆ เลยว่ามันจะมีปัญหาอะไรบ้าง เพราะถ้าข้อมูลพวกนี้คุณภาพแย่แล้วเอาไปทำต่อจะไม่มีทางรู้ข้อเท็จจริงเลยครับ

 

คนที่ทำงานในสาย Computational Linguistics มีหน้าที่ต้องทำอะไรบ้าง 

แล้วแต่ว่าได้โปรเจกต์มาแบบไหนและจะเน้นไปทางไหนมากกว่า เพราะศาสตร์ Computational Linguistics เป็นศาสตร์ที่ผสมระหว่างทาง Computer Science และทาง Linguistics ถ้าเราเน้นไปทางภาษามากกว่างานของเราก็จะไปในแนว Linguistics Annotation หรือไม่ก็ Linguistics Data Manager ถ้าเบนไปทาง Computer Science ก็จะเป็นในแนวของ Data Scientist แต่เราจะมีความเชี่ยวชาญในการวิเคราะห์ข้อมูลทางภาษามากกว่า ภาษามีความยากในตัวเองเพราะมันดิ้นได้แถมเป็นสิ่งที่ไม่มีโครงสร้างเราเลยต้องให้โครงสร้างกับมันโดยการใช้ทฤษฎีทางภาษาศาสตร์ว่าอันไหนเป็น Subject อันไหนเป็น Verb และอันไหนเป็น Object เพื่อให้เราวิเคราะห์ได้ 

 

อาชีพ Computational Linguistics ช่วยพัฒนาหรือสร้างผลิตภัณฑ์ทางภาษารูปแบบใด

จริง ๆ เทคโนโลยีทางภาษามี 2 ส่วนครับ 1. คืออาจจะเป็นแค่ส่วนส่วนหนึ่งของระบบใหญ่ หรือ 2. ก็คือนำไปเป็นระบบของมันเอง เช่น Google Search จริง ๆ ก็คือภาษาศาสตร์คอมพิวเตอร์แล้ว เพราะเดี๋ยวนี้เราสามารถพิมพ์คำถามลงไปตรง ๆ แล้วได้คำตอบกลับมาเลยแทนที่จะต้องไปหาคำตอบจากเว็บไซต์อื่น ทุกคนที่ใช้ Search อยู่ทุกวันนี้ก็เรียกว่าได้ใช้ผลิตภัณฑ์จาก Computational Linguistics อยู่แล้ว หรืออาจจะเป็นในรูปแบบของเครื่องแปลอัตโนมัติก็ถือว่าเป็นอีกหนึ่งผลิตภัณฑ์ที่เกี่ยวข้อง

 

 

คิดว่า Computational Linguistics มีความสำคัญอย่างไรต่อโลกปัจจุบัน และในอนาคตจะมีทิศทางไปในทางใด

มีอยู่ 2 ปัจจัยในการกำหนดว่าอนาคตของศาสตร์นี้จะเป็นอย่างไร คือ เทรนด์ตอนนี้เราพยายามจะ Automate ทุกอย่างที่ Automate ได้เพราะตลาดแรงงานเริ่มน้อยลงทุกทีแล้ว วัยที่เข้ามาทำงานจะเริ่มกลายเป็นสังคมผู้สูงอายุจึงต้องมีเทคโนโลยีมาช่วยมากขึ้น งานที่บ่งบอกถึงความเป็นมนุษย์มาก ๆ ก็คืออะไรที่เป็นหน้าที่ทางด้านภาษา เช่น พูดคุย ตอบคำถาม แปล หรือตรวจเรียงความถือว่าเป็นสิ่งที่ต้องใช้มนุษย์ทั้งนั้น ถ้าเราหวังจะ Automate มันก็ต้องใช้ศาสตร์ทาง Computational Linguistics เข้ามาให้มีบทบาทมากขึ้นเพื่อเราจะได้พัฒนาก่อนที่จะขาดแคลนแรงงานในหลาย ๆ ส่วนให้ทัน

 

อาชีพ Computational Linguistics ก็ใหม่มากในไทยเลยใช่ไหม

ใหม่มากในไทยครับและจริง ๆ ก็ใหม่มากกับทางฝั่ง Silicon Valley ด้วยเช่นกัน เพราะคนเพิ่งมารู้ว่าข้อมูลทางภาษามีความพิเศษของมันอยู่คือมันต้องวิเคราะห์ในอีกรูปแบบหนึ่งต่างจากข้อมูลทางสถิติ และอีกแขนงหนึ่งที่เพิ่งจะมาศึกษากันก็คือเรื่องการจัดระเบียบความรู้ต่าง ๆ ปัจจุบันในไทยก็พอมีคนที่ทำด้านนี้นะครับอย่าง Wongnai ก็พอมี Pantip ก็เริ่มทำบ้างเพราะเขามีกระทู้หลายหมวดหมู่จึงต้องมีคนมาจัดระเบียบตรงนี้ เรียกว่ายังเป็นจุดเริ่มต้นมีคนทำอยู่แค่หลักร้อยต้น ๆ ถ้าให้ประเมินกันจากการ Meetup เดือนละครั้งก็ต้องถือว่าเห็นหน้ากันหมดครับ รู้เลยว่าใครเป็นใครเพราะในวงการนี้ยังเล็กมาก

 

 

Computational Linguistics ดูแล้วเป็นศาสตร์ที่นำเอาทักษะที่ต่างกันมาก ๆ อย่างภาษาและคอมพิวเตอร์มารวมเข้าไว้ด้วยกัน คิดว่าอะไรคือความท้าทายของงานทางสายนี้

ความท้าทายของสายนี้คือสิ่งที่เรียกว่า Mental Blocked มันเป็นเหมือนกำแพงที่อยู่ในหัวว่า อ๋อ ฉันเป็นสายศิลป์ ฉันเป็นสายวิทย์ แต่ในความเป็นจริงงานสายนี้แก่นของมันคือเป็นการรวมทั้งวิทย์ทั้งศิลป์เข้าด้วยกัน เพราะไม่ว่าอย่างไรก็ตามเราต้องมานั่งอ่าน วิเคราะห์ภาษา วิเคราะห์ความหมาย ซึ่งเป็นสิ่งที่เรียกว่าเป็นสายศิลป์ แต่ในอีกทางหนึ่งก็คือยังต้องใช้ทักษะการเขียนโปรแกรม ใช้ความรู้ทางด้านสถิติ ซึ่งเราก็รู้ว่ามันเป็นทักษะทางด้านสายวิทย์ใช่มั้ยครับ แต่บางคนจะมี Mental Blocked ตรงนี้ว่าฉันเป็นอย่างหนึ่งแล้วฉันจะไม่เป็นอีกอย่างหนึ่ง ฉันไม่สามารถทำ 2 อย่างพร้อมกันได้ มันอยู่ที่ตัวเราเองมากกว่าที่เป็นอุปสรรคในการศึกษาตรงนี้ ผมจะบอกนิสิตตลอดเลยว่าเรียนได้ทุกคนจริง ๆ เพียงแค่ต้องเปิดใจว่าเดี๋ยวนี้การทำงานจะเป็นอะไรที่กว้างขึ้น ต้องใช้ทักษะรอบด้านต้องรู้ทั้งวิทย์และศิลป์

 

คนที่จะมาทำงานสาย Computational Linguistics ต้องมีทักษะอะไรบ้าง

อย่างแรกเลยคือต้องมีใจรักภาษา ชอบคลุกคลีกับข้อมูลทางภาษา ชอบการอ่านและวิเคราะห์ข้อมูลทางภาษาแล้วก็ต้องมีความถนัดที่เกี่ยวกับเชิงปริมาณซึ่งก็คือการแก้ปัญหา นอกจากนี้ทักษะที่ผมบอกไปแล้วเบื้องต้นว่าจำเป็นคือการเขียนโปรแกรมซึ่งเป็นหนึ่งในทักษะการแก้ปัญหา ถ้ายังไม่รู้เรื่องอะไรไม่ต้องกังวลเพราะความรู้ทุกอย่างสามารถเรียนทันกันได้หมดอยู่แล้ว แต่ส่วนที่เป็นทักษะจริง ๆ อย่างการแก้ปัญหา การคิดวิเคราะห์ของทางภาษา เหล่านี้ค่อนข้างจะเรียนรู้กันยาก สรุปก็คือคนที่จะมาทำงานสายนี้ได้อย่างน้อยเลยต้องรู้ภาษาศาสตร์สักส่วนหนึ่ง หรือไม่ก็มีพื้นฐานทางวิทยาศาสตร์คอมพิวเตอร์หรือเขียนโปรแกรมเป็น จะต้องรู้อย่างใดอย่างหนึ่งแล้วก็ไปเรียนอย่างอื่นเสริมเพื่อจะได้เอาไปใช้ต่อยอดได้

 

 

การทำงานสาย Computational Linguistics ทำให้เห็นมุมมองอะไร

จุดแข็งของงานแบบ Computational Linguistics คือมันเป็นศาสตร์ผสม ถ้าเราเรียนมาทางภาษาศาสตร์ก็จะมีเครื่องมืออยู่อย่างเดียวคือทฤษฎีที่เราเรียนมาซึ่งทำให้เรารู้วิธีวิเคราะห์คำและประโยค พอเราได้เครื่องมือใหม่ที่เป็นเครื่องมือทางด้านภาษาศาสตร์คอมพิวเตอร์จากฝั่ง Computer Science มาใช้ ทำให้เราสามารถนำทฤษฎีใหม่ ๆ มาวิเคราะห์ข้อมูลชุดเดิมเพื่อที่จะทำให้เป็นอัตโนมัติมากขึ้น มันจะทำให้เกิดคำถามว่าสิ่งที่เราทำจำเจทุกวันนั้นสามารถ Automate มันได้ไหม อันนี้เรียกว่าเป็นมุมมองใหม่เลย จากที่เราเคยทำอะไรด้วยมือตลอด คิดเองตลอด ลองใช้เครื่องมาทำดูได้ไหม อันนี้คือจุดแข็งของศาสตร์แบบสหสาขาวิชาคือการมองหนึ่งอย่างแต่ลองใช้ทฤษฎีและเครื่องมือหลายประเภทดู เหมือนเป็นการเปลี่ยนเลนส์เพื่อมองสิ่งเดียวกันให้มันแตกต่างออกไปครับ

 

อยากฝากอะไรถึงคนที่อ่านแล้วสนใจ อยากทำงานด้าน Computational Linguistics บ้าง

อย่างแรกเลยคืออยากให้ศึกษาเพิ่มว่ามันเอาไปทำงานด้านอะไรได้อีกบ้าง แล้วศึกษาดูว่าเราขาดทักษะไหน ถ้าเราอยากใช้เทคโนโลยีตรงนี้มาจับคู่กับอาชีพที่เรามีอยู่แล้วเราจะต้องรู้อะไรบ้าง ไม่ว่าจะขาดทักษะทางด้านเขียนโปรแกรม ทักษะทางด้านเขียนโมเดลต่าง ๆ ทางด้านสถิติ หรือการวิเคราะห์ข้อมูลทางภาษา พอเรารู้แล้วว่าขาดอะไรก็สามารถหาหนังสือมาอ่าน เดี๋ยวนี้ความรู้สามารถหาได้บนออนไลน์และอยู่บนมือถือของทุกคนแล้ว คลาสออนไลน์เยอะมากเราสามารถเลือกได้ตามที่ชอบเลย อยู่กับตัวเราแล้วว่าจะมีแรงขวนขวายแค่ไหน

 

ในโลกการทำงานสมัยใหม่ความรู้และข้อมูลเปลี่ยนแปลงรวดเร็วอยู่ตลอดเวลา นั่นหมายความว่าหากเรายังไม่ทะลายกำแพงความเชื่อที่ว่าคนจบสายศิลป์ก็ต้องทำงานด้านสายศิลป์ คนจบสายวิทย์ต้องทำงานด้านวิทย์เท่านั้นก็อาจทำให้เราตกขบวนรถของการพัฒนานี้ไป อย่างที่อาจารย์ ดร.อรรถพล ธำรงรัตนฤทธิ์ ได้พิสูจน์ให้เราเห็นแล้วว่าแม้จบสายศิลป์ก็สามารถหันมาทำงานด้านที่ต้องใช้ทักษะทางวิทยาศาสตร์ได้ เพราะการเปิดใจ มีความมุ่งมั่น และขวนขวายเรียนรู้สิ่งใหม่อยู่ตลอดเป็นส่วนช่วยให้ประสบความสำเร็จในอาชีพได้นั่นเอง

หากอ่านแล้วพบว่ามีเรื่องน่าสนใจที่ยังอยากค้นหาคำตอบ อยากรู้ Career Path ที่ละเอียดในสายงาน Computational Linguistics สามารถขอคำแนะนำเพิ่มเติมจาก อาจารย์ ดร. อรรถพล ธำรงรัตนฤทธิ์ ได้ที่ CareerVisa Thailand ค่ะ

สามารถอ่านเรื่องราวของอีกหนึ่งอาชีพน่าสนใจ ที่อาจารย์ ดร. อรรถพล จะมาบอกเล่าเรื่องราวของศาสตร์แห่งอนาคตที่กำลังมาถึงได้ในบทความ อาจารย์ ดร.อรรถพล ธำรงรัตนฤทธิ์: Data Scientist อาชีพมาแรงของโลกสมัยใหม่ เมื่อข้อมูลมีค่าดั่งทอง ค่ะ

 

JobThai มี Line แล้วนะคะ

ติดตามสาระความรู้สำหรับคนทำงาน ที่ย่อยง่าย อ่านสนุก และพูดคุยทุกแง่มุมเกี่ยวกับการทำงานอย่างใกล้ชิดที่

เพิ่มเพื่อน

tags : ภาษาศาสตร์, คนทำงาน, เคล็ดลับการทำงาน, computational linguistics, วิทย์, ศิลป์, career & tips, career focus



ติดตามข่าวสารและเรื่องราวดีๆ ทาง Email

ขอบคุณสำหรับการติดตาม