Datuk Seri Anwar Ibrahim, Perdana Menteri Malaysia ketika merasmikan peluncuran Pejabat AI Kebangsaan di MITEC, Kuala Lumpur pada 12 Disember 2024.
Selama ini, ramai masyarakat Malaysia mengalami beberapa kesulitan bila cuba menterjemahkan ayat, laras perkataan atau mencipta imej dan video menggunakan kecerdasan buatan (AI) berbahasa Malaysia. Hasil terjemahan yang diminta akan bercampur aduk bahasa, jika imej pula lebih terarah kepada budaya dari negara jiran.
Ini kerana LLM bahasa yang sedia ada lebih terarah kepada negara jiran dan membuatkan terjemahan itu kurang tepat daripada segi laras bahasa dan budayanya. Masalah itu kini telah diatasi bila YTL telah membangunkan ilmu 0.1, Model Bahasa Besar (LLM) berbahasa Malaysia. Dibangunkan oleh anak Malaysia sendiri, kerjasama antara Universiti Malaya dan YTL.
Rajah ini daripada Github UMxYTL-AI-Labs
Mengapa ianya dinamakan ilmu 0.1? Menurut Github yang diusahakan bersama antara YTL dan Universiti Malaya, keberadaan Bahasa Malaysia telah dikenalpasti sebagai rendah dalam laman web. Hanya 0.1% sahaja. Kira-kira 500 kali lebih kecil berbanding Bahasa Inggeris dan 10 kali lebih kecil berbanding bahasa Indonesia dan Vietnam.
Rajah ini daripada Github UMxYTL-AI-Labs
LLM Bahasa Malaysia yang dikenali sebagai ilmu 0.1 ni mengunakan benchmark Seabench dan dua data set latihan LLM iaitu SeaLLM dan Sailor. Ilmu 0.1 dibentuk berdasarkan kurikulum pendidikan Malaysia yang mengandungi 22 subjek dan lima topik di semua peringkat pendidikan. Sejumlah 24,213 soalan daripada topik bahasa, kemanusiaan, STEM, sains sosial dan pelbagai lagi soalan digunakan dalam membangunkan ilmu 0.1 ini.
Rajah di atas ini adalah contoh bagaimana kecerdasan buatan (AI) diajarkan kepada ilmu 0.1 agar memahami struktur Bahasa Malaysia. Jika terjemahannya mengikut direct translation mengunakan model AI yang lain, besar kemungkinan maksud asal ayat akan lari dari maksud sebenar.
Disebabkan oleh input dan data yang dimasukkan ini adalah daripada konteks sebenar iaitu daripada kurikulum pendidikan yang ada di Malaysia, maka model ilmu 0.1 mendapat ketepatan tinggi dari segi bahasa, kemanusiaan, STEM dan lain-lain lagi dengan purata ketepatan 86.98, lebih tinggi dari Open AI GPT-4o (84.98), Open AI GPT-04 (80.11) dan 8 lagi model LLM yang lain.
Pengarah Eksekutif YTL AI Labs, Lou Yeoh
“Hari ini, kami dengan bangga memperkenalkan ILMU 0.1, Model Bahasa Besar (LLM) pertama Malaysia yang dibangunkan oleh rakyat Malaysia untuk rakyat Malaysia. Ilmu 0.1 mengungguli model-model LLM lain di dunia dalam Bahasa Melayu serta dalam memahami budaya dan konteks Malaysia” ujar Pengarah Eksekutif YTL AI Labs, Lou Yeoh ketika majlis peluncuran Pejabat AI Kebangsaan oleh Kementerian Digital pada hari ini di MITEC, Kuala Lumpur.
Majlis peluncuran Pejabat AI Kebangsaan itu disempurnakan oleh Perdana Menteri Datuk Seri Anwar Ibrahim. Dalam ucapannya, Datuk Seri Anwar menyatakan beliau telah berbincang dengan Jason dari NVIDIA bersama YTL, Microsoft, Google dan AWS berkaitan dengan soal nilai jatidiri Malaysia yang perlu ada dalam kecerdasan buatan (AI).
“Bukan hanya dimasukkan oleh pandangan barat atau timur atau sistem lain. Dimasukkan semuanya dari dunia, tetapi ada khusus daripada kita” kata Perdana Menteri. Model LLM Berbahasa Malaysia yang diluncurkan oleh YTL ini hadir tepat pada masanya untuk membolehkan budaya, laras bahasa dan konteks Malaysia dimasukkan dalam kecerdasan buatan.
Model LLM Bahasa Malaysia ini (ILMU 0.1) hadir bersama dengan sebuah pusat data hijau berkapasiti 500MW. Ini adalah kerjasama strategik antara YTL dengan NVIDIA untuk membawa GPU GB200 terpantas di dunia ke Malaysia. Keseluruhannya untuk memperkasakan AI di negara ini, YTL telah melabur lebih daripada RM20 bilion.
Kenanga Research melaporkan baru-baru ini pusat data AI YTL di Kulai akan beroperasi sepenuhnya pada suku kedua tahun 2025. Menurut Kenanga, pusat data ini akan memberikan keuntungan sejumlah RM987 juta bila beroperasi sepenuhnya dengan kapasiti 100MW pada 2027.
Bila infrastruktur dan perisian telah lengkap, maka keupayaan untuk mengoptimumkan ekonomi digital ini akan menguntungkan rakyat dan negara. Oleh kerana itulah, benarlah apa yang diungkapkan oleh Perdana Menteri, penggunaan teknologi kecerdarsan buatan (AI) tidak akan menyebabkan kehilangan pekerjaan malah turut memberi impak besar terhadap KDNK Malaysia.
Model LLM Bahasa Malaysia yang diperkenalkan oleh YTL dan Universiti Malaya ini adalah asas yang baik untuk membolehkan Malaysia menjadi peneraju AI di peringat Asia Tenggara bila Malaysia menjadi Pengerusi ASEAN tahun 2025 nanti. Selari dengan hasrat Perdana Menteri, Datuk Seri Anwar Ibrahim yang mahu meletakkan nama Malaysia sebagai antara 20 negara terbaik yang terkait dengan AI di mata dunia.