SCB 10X เปิดตัว “ไต้ฝุ่นอีสาน (Typhoon Isan)” AI เว่าอีสาน Open Source แรกของไทย นวัตกรรมทลายกำแพงภาษาที่ช่วยลดความผิดพลาดทางการแพทย์ ปลดล็อกเศรษฐกิจอีสาน และอนุรักษ์วัฒนธรรมสู่ยุคดิจิทัล
กระแสการขับเคลื่อนเทคโนโลยีปัญญาประดิษฐ์ในเวทีโลกมักมุ่งเน้นการแข่งขันด้านความเร็วและขีดความสามารถในการประมวลผลอันล้ำเลิศ หากแต่สิ่งที่มักถูกละเลยไปในสมการของความก้าวหน้านี้คือความเข้าใจมนุษย์ในระดับรากหญ้า โดยเฉพาะในกลุ่มประชากรจำนวนมากที่ไม่ได้ใช้ภาษากลางเป็นเครื่องมือหลักในการสื่อสาร ซึ่งเปรียบเสมือนกำแพงที่มองไม่เห็นกั้นขวางการเข้าถึงโอกาสทางเทคโนโลยี ล่าสุด SCB 10X จึงได้สร้างหมุดหมายใหม่ให้กับวงการนวัตกรรมไทยด้วยการเปิดตัว “ไต้ฝุ่นอีสาน” (Typhoon Isan) โมเดลภาษาอีสานรูปแบบ Open Source แห่งแรกของประเทศ
ความสำเร็จของโครงการนี้มิใช่เพียงความก้าวหน้าทางวิศวกรรมคอมพิวเตอร์ในการสร้างโมเดลภาษาขนาดใหญ่หรือ Large Language Model เท่านั้น แต่เป็นการทลายข้อจำกัดของภาษาที่มีทรัพยากรน้อย หรือ Low Resource Language เพื่อให้ปัญญาประดิษฐ์สามารถฟัง พูด และเข้าใจบริบทของภาษาถิ่นที่มีผู้ใช้งานกว่า 20 ล้านคน หรือคิดเปน 1 ใน 3 ของประชากรไทยได้อย่างลึกซึ้ง
–SCB 10X ผนึก สกศ. ส่ง AI ‘Typhoon’ ติวเด็กไทยสู้ศึก PISA
นัยสำคัญของ ไต้ฝุ่นอีสานจึงมีความหมายที่ลึกซึ้งเกินกว่าการเป็นเพียงซอฟต์แวร์ หากแต่เปรียบเสมือนการวางโครงสร้างพื้นฐานทางดิจิทัล หรือ Digital Infrastructure ที่สำคัญของประเทศ ซึ่งพร้อมจะปลดล็อกศักยภาพที่เคยถูกปิดกั้นด้วยกำแพงภาษาในหลายมิติให้เปิดกว้างขึ้น
ซึ่งประเด็นนี้ ผศ.ประเสริฐ วิจิตรนพรัตน์ รองคณบดีฝ่ายวิจัยฯ คณะเศรษฐศาสตร์ มหาวิทยาลัยขอนแก่น ได้ชี้ให้เห็นถึงมิติทางเศรษฐกิจว่านวัตกรรมนี้ทำหน้าที่เสมือนกุญแจดอกใหญ่เปิดประตูสู่ภูมิภาคที่มีมูลค่าผลิตภัณฑ์มวลรวมหรือ GDP สูงถึงร้อยละ 10 ของประเทศ โดยกลไกสำคัญคือการช่วยให้ภาคธุรกิจสามารถข้ามผ่านข้อจำกัดทางภาษา เพื่อสื่อสารกับผู้บริโภคท้องถิ่นได้อย่างลึกซึ้ง อันจะนำไปสู่การสร้างความไว้วางใจ หรือ Trust ซึ่งเป็นหัวใจของการทำธุรกิจที่ต้องอาศัยความใกล้ชิดและความเข้าใจในวิถีชีวิตของผู้คนอย่างแท้จริง การที่ AI สามารถสื่อสารภาษาถิ่นได้จะช่วยลดความรู้สึกห่างเหินและทำให้เทคโนโลยีกลายเป็นเรื่องที่เข้าถึงได้ง่ายสำหรับผู้ประกอบการรายย่อยและชาวบ้านในพื้นที่
นอกจากประโยชน์ในเชิงพาณิชย์แล้ว เทคโนโลยีนี้ยังมีบทบาทสำคัญอย่างยิ่งในมิติทางการแพทย์และสาธารณสุขด้วยการเข้ามาช่วยลดช่องว่างและความผิดพลาดในการสื่อสารระหว่างแพทย์กับคนไข้ โดยเฉพาะกลุ่มผู้สูงอายุที่ใช้ภาษาถิ่นเป็นหลัก การมีตัวช่วยที่เข้าใจศัพท์เฉพาะถิ่นจะช่วยลดโอกาสการวินิจฉัยโรคที่คลาดเคลื่อนจากความไม่เข้าใจศัพท์เฉพาะ เช่น อาการไข้กลับหรือความเชื่อท้องถิ่น ทำให้การรักษาพยาบาลมีความแม่นยำและปลอดภัยมากยิ่งขึ้น
หัวใจของปัญหา: เมื่อ “ภาษา” คือกำแพงที่มองไม่เห็น
ภาคตะวันออกเฉียงเหนือหรือภาคอีสาน เปรียบเสมือนพื้นที่ยุทธศาสตร์สำคัญของประเทศไทย ด้วยจำนวนประชากรที่มีสัดส่วนสูงถึง 1 ใน 3 ของประเทศ หรือกว่า 20 ล้านคน และเป็นแหล่งขับเคลื่อนทางเศรษฐกิจที่สร้างมูลค่าผลิตภัณฑ์มวลรวม หรือ GDP ได้ถึง 1 ใน 10 ของมูลค่ารวมทั้งประเทศ แม้ตัวเลขเหล่านี้จะสะท้อนถึงศักยภาพมหาศาล แต่ในความเป็นจริงกลับพบว่าการพัฒนาเทคโนโลยีส่วนใหญ่ยังคงถูกออกแบบโดยยึดโยงกับภาษาไทยมาตรฐานเป็นหลัก ส่งผลให้เกิดช่องว่างขนาดใหญ่ในการใช้งานจริง โดยเฉพาะเมื่อต้องนำเทคโนโลยีไปประยุกต์ใช้ในบริบทที่มีความละเอียดอ่อนสูงอย่างภาคบริการสาธารณสุข
ปัญหาความเหลื่อมล้ำทางภาษานี้ส่งผลกระทบอย่างชัดเจนในห้องตรวจโรค ซึ่งความแม่นยำในการสื่อสารหมายถึงความปลอดภัยของชีวิตผู้ป่วย น.พ.กิติภูมิจุฑาสมิต อดีตผู้อำนวยการโรงพยาบาลภูสิงห์ จังหวัดศรีสะเกษ ได้สะท้อนภาพปัญหาหน้างานจริงไว้อย่างน่าสนใจว่า แพทย์จบใหม่จำนวนมากที่ลงพื้นที่ปฏิบัติงานมักเป็นคนต่างถิ่นที่ไม่คุ้นเคยกับภาษาอีสาน เมื่อต้องทำหน้าที่รักษาคนไข้ โดยเฉพาะกลุ่มผู้สูงอายุในชนบทที่สื่อสารด้วยภาษาถิ่นเป็นหลัก กำแพงภาษาจึงกลายเป็นอุปสรรคสำคัญที่อาจนำไปสู่ความคลาดเคลื่อนในการวินิจฉัยโรคได้
กรณีศึกษาที่สะท้อนปัญหานี้ได้อย่างเป็นรูปธรรม คือการใช้คำศัพท์เฉพาะถิ่นในการบอกเล่าอาการเจ็บป่วยที่ไม่มีในตำราแพทย์แผนปัจจุบัน ตัวอย่างเช่นคำว่า “ไข้แด” ซึ่งคนไข้ใช้สื่อสารเพื่อบอกว่าตนเองมีอาการไข้กลับ หรืออาการทรุดลงหลังจากที่อาการเริ่มดีขึ้นแล้ว หรือคำว่า “ผิดกระดูก” ซึ่งเป็นโรคที่อิงอยู่กับความเชื่อท้องถิ่นเกี่ยวกับการรับประทานอาหารแสลงหรือพฤติกรรมบางอย่างที่ส่งผลกระทบต่อร่างกาย คำศัพท์เหล่านี้มักสร้างความสับสนให้กับแพทย์รุ่นใหม่ที่ไม่เข้าใจบริบททางวัฒนธรรม ทำให้ไม่สามารถประเมินอาการที่แท้จริงของผู้ป่วยได้ทันท่วงที
ดังนั้น การเข้ามาของนวัตกรรมปัญญาประดิษฐ์อย่าง ไต้ฝุ่นอีสาน จึงมีความหมายมากกว่าการเป็นเพียงเครื่องมือแปลภาษาทั่วไป หากแต่เป็นการทำหน้าที่เชื่อมโยงความเข้าใจในบริบททางวัฒนธรรมและวิถีชีวิตท้องถิ่นเข้าสู่ระบบการแพทย์สมัยใหม่ เทคโนโลยีนี้จะเข้ามาช่วยแปลความหมายของอาการเจ็บป่วยในภาษาถิ่นให้เป็นภาษาทางการแพทย์ที่ถูกต้อง ซึ่งในมิติของการสาธารณสุขนั้น ความเข้าใจที่แม่นยำย่อมหมายถึงประสิทธิภาพในการรักษาและการช่วยชีวิตคนให้ปลอดภัยมากยิ่งขึ้น
วิศวกรรมภาษาในแดนสนธยา: เบื้องหลังการสร้างมาตรฐานดิจิทัลให้ภาษาอีสาน
เบื้องหลังการพัฒนาปัญญาประดิษฐ์ให้สามารถสื่อสารภาษาอีสานได้อย่างเป็นธรรมชาติ นับเป็นความท้าทายทางวิศวกรรมระดับสูงที่วงการเทคโนโลยีเรียกว่าการจัดการกับภาษาที่มีทรัพยากรข้อมูลน้อย (Low Resource Language) อดิศัย ณ ถลาง Senior Linguist จาก SCB 10X อธิบายว่า ความยากของโจทย์นี้ไม่ได้อยู่ที่จำนวนผู้ใช้งานซึ่งมีอยู่มหาศาล แต่อยู่ที่อุปสรรคสำคัญเรื่องมาตรฐานการเขียนที่เป็นระบบ ซึ่งเป็นกำแพงที่ทีมวิจัยและพัฒนาของ SCB 10X ร่วมกับเครือข่ายพันธมิตร ต้องฝ่าฟันโจทย์หินถึงสามประการเพื่อให้โครงการนี้สำเร็จลุล่วง
อุปสรรคด่านแรกที่ทีมงานต้องเผชิญ คือการที่ภาษาอีสานมีสถานะเป็นภาษาพูดหรือ Spoken Language เป็นหลักเมื่อต้องแปลงเสียงเหล่านี้ให้กลายเป็นข้อมูลดิจิทัลในรูปแบบตัวอักษร จึงเกิดความลักลั่นทางภาษาขึ้นเนื่องจากขาดบรรทัดฐานที่ชัดเจน ชาวบ้านในแต่ละจังหวัดมักสะกดคำตามความคุ้นเคยของตนเองที่แตกต่างกันออกไป อาทิ คำปฏิเสธพื้นฐานอย่างคำว่า ‘บ่’ ที่บางแห่งอาจสะกดว่า ‘บ่อ’ หรือเขียนลดรูปเหลือเพียง ‘บ่’ ซึ่งความไม่สม่ำเสมอของข้อมูลเหล่านี้สร้างความสับสนให้กับระบบประมวลผลของคอมพิวเตอร์อย่างมหาศาล
ความซับซ้อนประการถัดมา คือเรื่องของ สัทศาสตร์ หรือระบบเสียง โดยเฉพาะการผันวรรณยุกต์ของภาษาอีสาน ที่มีเอกลักษณ์เฉพาะตัว และไม่สอดคล้องกับกฎเกณฑ์ของภาษาไทยภาคกลางอย่างตายตัว เพื่อแก้ปัญหานี้ ทีมงานจำเป็นต้องสร้างนวัตกรรมทางภาษา โดยร่วมมือกับนักภาษาศาสตร์ออกแบบตารางเทียบเสียง หรือ Matrix Table ขึ้นมาเพื่อใช้สอบทานความถูกต้องของระดับเสียง และทำงานร่วมกับนักภาษาศาสตร์จากมหาวิทยาลัยชั้นนำอย่างใกล้ชิด เพื่อกำหนดระบบการสะกดคำแบบมาตรฐาน หรือ Standard Spelling ขึ้นเป็นครั้งแรก ซึ่งถือเป็นการปฏิวัติวิธีคิดในการบันทึกภาษาถิ่นลงสู่ระบบดิจิทัล
นอกจากปัญหาเรื่องการเขียนแล้ว ความหลากหลายของสำเนียงยังเป็นอีกหนึ่งกำแพงสำคัญที่ต้องก้าวข้าม ดร.วริทธิ์ ศีริโชติดำรงค์ Research Scientist และ สิทธิพงศ์ ศรีไพศาลมงคล Lead AI Engineer จาก SCB 10X ได้เน้นย้ำถึงความสำคัญของข้อมูลที่นำมาเทรนโมเดลว่า ต้องไม่ใช่แค่การอ่านตามสคริปต์ (Reading Script) แต่ต้องเป็นบทสนทนาจริง (Conversational Data) เพื่อให้ AI เข้าใจธรรมชาติการพูด การรวบคำ หรือบริบททางอารมณ์ที่แท้จริง เพื่อให้ระบบสามารถจับใจความได้แม้จะมีการรวบคำ การใช้คำสร้อย หรือบริบททางอารมณ์ที่แท้จริงของผู้พูดในชีวิตประจำวัน
ความสำเร็จของโครงการไต้ฝุ่นอีสานในครั้งนี้ จึงมีคุณค่าที่เหนือกว่าการเป็นเพียงโมเดลปัญญาประดิษฐ์ทางภาษา แต่เปรียบเสมือนการวางรากฐานมาตรฐานภาษาอีสานฉบับดิจิทัล ทั้งในรูปแบบของพจนานุกรมเสียงและกฎเกณฑ์ที่เป็นสากล ซึ่งถือเป็นสมบัติทางข้อมูลชุดสำคัญให้กับประเทศไทยในการต่อยอดนวัตกรรมในอนาคต
พลังแห่ง “ความคือกัน“: กลยุทธ์ความไว้เนื้อเชื่อใจสู่โอกาสทางธุรกิจและเศรษฐกิจที่ทั่วถึง
ในโลกธุรกิจที่ขับเคลื่อนด้วยเทคโนโลยี สิ่งหนึ่งที่ยังคงเป็นหัวใจสำคัญไม่เปลี่ยนแปลงคือความไว้เนื้อเชื่อใจ หรือ Trust ซึ่งเป็นกุญแจดอกสำคัญในการเปิดประตูสู่ความสำเร็จ โดยเฉพาะในบริบทของสังคมไทยที่มีความละเอียดอ่อนทางวัฒนธรรม วิรินท์ ฉันทโรจน์ Head of Innovation Lab จาก SCBX ได้ชี้ให้เห็นถึงประเด็นที่สำคัญว่า การทำธุรกิจจะประสบความสำเร็จได้นั้น จำเป็นต้องอาศัยรากฐานของความเชื่อใจ และในพื้นที่ภาคอีสาน ความเชื่อใจนี้ถูกสร้างขึ้นผ่านคำว่า ความคือกัน หรือความรู้สึกของการเป็นพวกเดียวกัน ซึ่งเทคโนโลยีปัญญาประดิษฐ์ทางภาษาถิ่นกำลังเข้ามามีบทบาทสำคัญในการสร้างสะพานเชื่อมความรู้สึกนี้
การนำภาษาถิ่นมาประยุกต์ใช้ในเชิงธุรกิจเปรียบเสมือนการใช้กลยุทธ์สร้างความใกล้ชิด (Intimacy Strategy) ที่มีผลอย่างมหาศาลต่อภาคการเงินและการธนาคาร ตัวอย่างที่เห็นได้ชัดเจน คือกระบวนการติดตามหนี้หรือการพิจารณาสินเชื่อ ซึ่งหากสถาบันการเงินเลือกใช้ภาษาที่เป็นทางการหรือภาษาไทยมาตรฐาน อาจสร้างกำแพงความรู้สึกที่ดูห่างเหินและเข้าถึงยาก แต่ในทางตรงกันข้าม หากมีการสื่อสารด้วยภาษาถิ่นที่เข้าถึงใจ จะช่วยทลายกำแพงเหล่านั้นลงและเปลี่ยนสถานะจากคู่ค้าให้กลายเป็นคนกันเอง ซึ่งตามธรรมชาติของมนุษย์แล้ว ลูกหนี้มักเลือกที่จะชำระหนี้หรือให้ความร่วมมือกับคนที่ตนรู้สึกสนิทใจและไว้เนื้อเชื่อใจก่อนเสมอ การใช้ AI ที่เว่าอีสานได้จึงไม่ใช่แค่เรื่องของความทันสมัย แต่เป็นกุศโลบายในการบริหารความสัมพันธ์ลูกค้าที่ลึกซึ้ง
ยิ่งไปกว่านั้น การพัฒนาไต้ฝุ่นอีสานยังสะท้อนถึงวิสัยทัศน์ในการสร้างเศรษฐกิจที่นับรวมทุกคน (Inclusive Economy) โดยนวัตกรรมนี้จะทำหน้าที่เป็นโครงสร้างพื้นฐานทางดิจิทัล (Digital Infrastructure) ที่สำคัญของประเทศ ซึ่งจะช่วยให้คนตัวเล็กตัวน้อย เกษตรกร หรือผู้ประกอบการ SME ในพื้นที่ห่างไกล สามารถเข้าถึงบริการทางการเงินและเทคโนโลยีที่ซับซ้อนได้โดยปราศจากอุปสรรค พวกเขาไม่จำเป็นต้องพยายามดัดแปลงตนเองหรือฝืนใช้ภาษากลางที่ไม่คุ้นเคยเพื่อเข้าถึงแหล่งทุนหรือบริการต่าง ๆ อีกต่อไป ซึ่งถือเป็นการลดความเหลื่อมล้ำในการเข้าถึงโอกาส และช่วยให้เศรษฐกิจฐานรากสามารถเติบโตไปพร้อมกับกระแสโลกดิจิทัลได้อย่างเท่าเทียม
เจาะลึก 3 ขุมพลังเบื้องหลัง “ไต้ฝุ่นอีสาน” สู่การสร้างนวัตกรรมที่พูดจาภาษาเดียวกัน

การเปิดตัวไต้ฝุ่นอีสานในครั้งนี้ ไม่ได้เป็นเพียงการนำเสนอแนวคิดทางนามธรรม หากแต่เป็นการเผยโฉมชุดเครื่องมือทางเทคโนโลยีที่ทรงพลัง และพร้อมใช้งานจริงถึง 3 ส่วนหลัก ซึ่งเปรียบเสมือนจิ๊กซอว์ชิ้นสำคัญที่เข้ามาเติมเต็มระบบนิเวศของปัญญาประดิษฐ์ไทยให้สมบูรณ์ยิ่งขึ้น โดยเริ่มต้นจาก ส่วนแรกที่มีความสำคัญเปรียบเสมือนใบหูของระบบ นั่นคือ Typhoon Isan ASR หรือ Automatic Speech Recognition ซึ่งเป็นระบบถอดเสียงภาษาอีสานให้กลายเป็นข้อความ
ความน่าสนใจของระบบถอดเสียงนี้อยู่ที่ความยืดหยุ่นในการเลือกใช้งาน โดยทีมพัฒนาได้แยกย่อยออกเป็น 2 โมเดลย่อย เพื่อตอบโจทย์วัตถุประสงค์ที่แตกต่างกัน ได้แก่ โมเดลแบบ Realtime ที่ได้รับการปรับจูนให้มีความเร็วในการประมวลผลสูง เหมาะสำหรับการสนทนาโต้ตอบทันที และโมเดลแบบ Whisper ที่เน้นความแม่นยำสูงสุด เหมาะสำหรับการถอดความจากไฟล์เสียงที่ต้องการความถูกต้องของข้อมูลในทุกรายละเอียด
–SCB 10X เปิดเวที “Typhoon 2 Unveiled: Advancing AI Research in Thailand” เดินหน้าวิจัย AI ไทย
เมื่อมีหูที่รับฟังได้แล้ว ส่วนประกอบที่ขาดไม่ได้ลำดับถัดมาคือปากที่ใช้สื่อสาร ซึ่งทีมงานได้พัฒนา Typhoon Isan TTS หรือ Text-to-Speech ระบบสังเคราะห์เสียงเว้าอีสานขึ้นมา โดยเน้นการพัฒนาคุณภาพเสียงให้มีความเป็นธรรมชาติ มีจังหวะจะโคนและสำเนียงที่ใกล้เคียงกับมนุษย์ เพื่อลดความรู้สึกแข็งกระด้างแบบหุ่นยนต์และสร้างความคุ้นเคยให้กับผู้ฟัง นอกจากนี้ หัวใจสำคัญที่อยู่เบื้องหลังความฉลาดของโมเดลทั้งหมดคือ Isan Speech Corpus หรือชุดข้อมูลเสียงภาษาอีสานขนาดใหญ่ ที่ทาง SCB 10X ตัดสินใจเปิดให้เป็น Open Data หรือข้อมูลสาธารณะ เพื่อให้นักพัฒนาและนักวิจัยทั่วประเทศไทยสามารถนำทรัพยากรเหล่านี้ไปต่อยอดสร้างสรรค์นวัตกรรมใหม่ ๆ ได้ทันทีโดยไม่ต้องเริ่มนับหนึ่งใหม่
ไฮไลท์สำคัญที่สุดของการผนึกกำลังเครื่องมือทั้ง 3 ส่วนนี้ คือการนำมาประกอบร่างสร้างเป็น Voice Agent หรือตัวแทนปัญญาประดิษฐ์ที่สามารถโต้ตอบได้เสมือนมนุษย์ ซึ่งได้มีการสาธิตศักยภาพผ่านระบบผู้ช่วยอัจฉริยะสำหรับนัดหมายแพทย์ ที่สามารถสนทนากับผู้สูงอายุหรือคุณยายด้วยภาษาอีสานได้อย่างลื่นไหล ระบบไม่เพียงแต่รับฟังคำสั่ง แต่ยังมีความสามารถในการเข้าใจบริบทของอาการเจ็บป่วยที่ถูกเล่าผ่านภาษาถิ่น และสามารถตอบกลับด้วยน้ำเสียงที่แสดงออกถึงความห่วงใยและความเข้าใจ ซึ่งสะท้อนให้เห็นถึงความพร้อมของเทคโนโลยีที่จะถูกนำไปประยุกต์ใช้เพื่อยกระดับคุณภาพชีวิตของผู้คนในโลกความเป็นจริง
ผศ.ดร.สุมิตรา สุรรัตน์เดชา อาจารย์ประจำสาขาวิชาภาษาศาสตร์ สถาบันวิจัยภาษาและวัฒนธรรมเอเชีย มหาวิทยาลัยมหิดล ได้ทิ้งท้ายไว้อย่างน่าสนใจว่า “ไต้ฝุ่นอีสาน” เป็นมากกว่าซอฟต์แวร์ แต่มันคือจดหมายเหตุแห่งยุคดิจิทัลที่ช่วย “ชุบชีวิต” และ “อนุรักษ์” ภูมิปัญญาไม่ให้หายไป และเป็นเครื่องพิสูจน์ว่า เทคโนโลยีที่ดีที่สุด ไม่ใช่เทคโนโลยีที่ล้ำสมัยที่สุด แต่คือเทคโนโลยีที่ “เข้าใจมนุษย์ที่สุด” ไม่ว่าเขาคนนั้นจะพูดภาษาอะไรก็ตาม
ข่าวอื่น ๆ ที่น่าสนใจ
ฟองสบู่คือสนามสอบของเทคโนโลยี AI
Google Cloud เปิดตัว “PanyaThAI” ชู Agentic AI พลิกโฉมธุรกิจไทย




