Mission: Impossible Language Models

আজকে যে গবেষণাপত্র পড়লাম সেইটা এতই ইন্টারেস্টিং যে পড়তে পড়তে আমার উপন্যাস পড়ার মত রোমাঞ্চ হচ্ছিল। তো যাক, এইটা ২০২৪ এ ACL এ সবচেয়ে ভাল গবেষণাপত্রের এওয়ার্ড পেয়েছে। যাইহোক যা বুঝলাম তুলে ধরছি।

এআই কি আসলেই ভাষা বোঝে? এই প্রশ্নটা নিয়ে পৃথিবীর সব বড় বড় বিজ্ঞানীরা দুই ভাগে ভাগ হয়ে গেছেন। একদলে আছেন বিখ্যাত ভাষাবিদ নোয়াম চমস্কি। তিনি খুব জোর গলায় বলেছেন যে চ্যাটজিপিটির মতো এআই মডেলগুলো আসলে ভাষার কিছুই বোঝে না। ওরা শুধু শব্দ পাশাপাশি সাজাতে পারে। তাঁর যুক্তি হলো, এআই নাকি 'আসল' মনুষের ভাষা (যেমন বাংলা বা ইংরেজি) আর একটা 'অসম্ভব' বা উদ্ভট ভাষার (যেমন, যে ভাষার নিয়ম হলো প্রতিটা বাক্য উল্টো করে বলতে হবে) মধ্যে পার্থক্য করতে পারে না। ওদেরকে যা শেখানো হবে, ওরা তাই শিখবে।

কিন্তু সম্প্রতি স্ট্যানফোর্ড ইউনিভার্সিটির একদল গবেষক ভাবলেন, আচ্ছা, কথাটা কি আসলেই সত্যি? চলুন, পরীক্ষা করে দেখা যাক।

ওরা যে গবেষণাটা করলেন, তার নাম দিলেন "মিশন: ইম্পসিবল ল্যাঙ্গুয়েজ মডেলস"। এই গবেষণাপত্রটা বেরোনোর সাথে সাথেই হৈচৈ ফেলে দেয় এবং এআই দুনিয়ার সবচেয়ে বড় কনফারেন্সগুলোর একটায় সেরা পেপারের পুরস্কার জিতে নেয়।

গবেষকদের প্ল্যানটা ছিল খুব সহজ কিন্তু দারুণ। ওরা ঠিক করলেন, এআই কে শুধু ভালো ভাষা নয়, কিছু জগাখিচুড়ি আর অসম্ভব ভাষাও শেখানোর চেষ্টা করবেন। তারপর দেখবেন এআই কী করে।

ওদের পরীক্ষাটা ছিল এইরকম:

ধাপ ১: একটা 'বাচ্চা' এআই নেওয়া হলো, অর্থ্যাত ছোট সাইজ, এখনোও কিছুই শিখে নাই এমন। তাঁরা জিপিটি-২ মডেল নিলেন। এই মডেলটাকে একদম গোড়া থেকে শেখাতে হবে, অনেকটা একটা শিশুর মতো যে কোনো ভাষা জানে না।
ধাপ ২: অসম্ভব সব ভাষা তৈরি করা হলো। এই ধাপটাই সবচেয়ে মজার। ওরা ইংরেজি ভাষাকে ভেঙেচুরে কয়েকটা উদ্ভট ভাষা তৈরি করলেন। যেমন:

ভাষা এক - র‍্যান্ডম শাফল___ মানে একটা বাক্যের সব শব্দকে পুরোপুরি এলোমেলো করে দেওয়া। ধরুন, "He cleans his room" হয়ে গেল "room cleans his he"। এই ভাষার কোনো মানে হয় না।
ভাষা দুই - রিভার্সড___ মানে পুরো বাক্যটাকেই উল্টো করে লেখা। "He cleans his room" হয়ে গেল, "room his cleans he"।
ভাষা তিন: কাউন্ট বেসড বা গোনার নিয়ম। এটা ছিল সবচেয়ে গুরুত্বপূর্ণ পরীক্ষা। মানুষের ভাষা সাধারণত নির্দিষ্ট কাঠামোর ওপর চলে (যেমন বিশেষ্যের পর ক্রিয়াপদ)। কিন্তু এই কৃত্রিম ভাষায় ওরা নিয়ম বানালেন গোনার ওপর। যেমন, ইংরেজিতে আমরা বলি "He cleans his room"। এখানে 'clean' এর সাথে 's' যোগ হয়েছে কারণ 'He' হলো থার্ড পারসন। এই 's' টা ক্রিয়াপদের ঠিক পাশেই বসে। গবেষকরা নিয়ম বানালেন, এই 's' টা ক্রিয়াপদের পাশে বসবে না। এটা বসবে ঠিক ৩টা শব্দ বা টোকেন পরে। তাহলে বাক্যটা দাঁড়াবে "He clean his room very 's well." এর মতো একটা কিছু। খেয়াল করেন 's বসা উচিত ছিল clean এর সাথে কিন্তু এই গোনার পদ্ধতিতে ৩ টা শব্দ পরে বসল। মানুষের কোনো ভাষাই এভাবে কাজ করে না। আমরা কথা বলার সময় এক দুই তিন চার করে শব্দ গুনি না। তাই এটা একটা 'অসম্ভব' ভাষা।

ধাপ ৩: গবেষকরা ওই 'বাচ্চা' এআই টিকে একেকবার একেকটা ভাষা শেখালেন। মানে, একটা এআই মডেলকে শুধু এলোমেলো ভাষা শেখানো হলো। আরেকটা মডেলকে শুধু ওই ৪ শব্দ পরের উদ্ভট ভাষা শেখানো হলো। আর সবশেষে একটা মডেলকে আসল, শুদ্ধ ইংরেজি ভাষা শেখানো হলো।

এবার ফলাফলের পালা। এআই কি সবগুলো ভাষাই সমানভাবে শিখতে পারলো? দেখা গেল, নোয়াম চমস্কির দাবি একদম ঠিক নয়।

এআই মডেলগুলো এই অসম্ভব ভাষাগুলো শিখতে গিয়ে রীতিমতো হিমশিম খাচ্ছে!

গবেষকরা যখন দেখলেন এআই কতটা 'কনফিউজড' বা বিভ্রান্ত হচ্ছে, তারা অবাক হলেন। যেখানে আসল ইংরেজি ভাষাটা এআই খুব সহজে এবং দ্রুত শিখে ফেলছে, সেখানে ওই এলোমেলো ভাষার বাক্য দেখে ও প্রায় কিছুই বুঝতে পারছে না।

সবচেয়ে বড় ধাক্কাটা খেল ওই '৪ শব্দ পরে' নিয়মটার ক্ষেত্রে। এআই কোনোভাবেই এই নিয়মটা ঠিকমতো ধরতে পারছিল না। ও বারবার চেষ্টা করছিল ক্রিয়াপদের ঠিক পরেই 's' টাকে বসাতে, কারণ এটাই স্বাভাবিক ভাষার নিয়ম। যখন ওকে জোর করে ৪ শব্দ পরে 's' বসাতে বাধ্য করা হলো, ও পুরো তালগোল পাকিয়ে ফেলল।

তবে এই গবেষণারও কিছু সীমাবদ্ধতা আছে, যা গবেষকরা নিজেরাই উল্লেখ করেছেন।

প্রথমত, এই পুরো পরীক্ষাটা চালানো হয়েছে শুধু জিপিটি-২ মডেলের ওপর, যা কিনা আজকের তুলনায় বেশ ছোট এবং পুরনো একটা মডেল। এখনকার বিশাল ক্ষমতাবান মডেল যেমন জিপিটি-৪ বা অন্য আর্কিটেকচারের মডেলগুলো এই অসম্ভব ভাষা শিখতে গিয়ে একই রকম সমস্যায় পড়বে কিনা, সেটা কিন্তু আমরা এই গবেষণা থেকে জানতে পারছি না।

দ্বিতীয়ত, গবেষকরা যতগুলো 'অসম্ভব' ভাষা তৈরি করেছেন, তার সবই করেছেন ইংরেজি ভাষাকে ভিত্তি ধরে। বাংলা, আরবি, চাইনিজ বা অন্য কোনো ভাষার ব্যাকরণগত কাঠামো ভেঙে যদি এমন উদ্ভট ভাষা তৈরি করা হতো, তাহলে এআই কী করতো, সেই পরীক্ষাটা করা হয়নি।

এর মানে কী দাঁড়ায়? এর মানে হলো, এই এআই মডেলগুলো চমস্কির বলা 'তোতাপাখি' নয়। ওদেরও একটা নিজস্ব 'অভ্যাস' বা 'পক্ষপাত' আছে। ওরা সব ভাষা সমানভাবে শেখে না।

ওরা সেই ভাষাই সহজে শেখে যেটা 'স্বাভাবিক' এবং মানুষের ভাষার মতো। ওরা এমন ভাষা পছন্দ করে যেখানে সম্পর্কিত শব্দগুলো কাছাকাছি থাকে। যেমন, 'clean' এর সাথের 's' টা 'clean' এর কাছেই থাকবে। ঠিক যেমনটা আমরা মানুষরা করি।

এই গবেষণাটা প্রথমবার হাতে কলমে প্রমাণ করল যে এআই মডেলগুলোরও ভাষা শেখার ব্যাপারে নিজস্ব পছন্দ-অপছন্দ আছে, যেটা আশ্চর্যজনকভাবে মানুষের ভাষার কাঠামোর সাথে মিলে যায়। ওরা হয়তো আমাদের ধারণার চেয়ে বেশি 'মানুষের মতো' করেই ভাষাকে চেনে।

আমার পার্সোনালি অবস্য এখানে আরও একটা অবজারভেশন আছে। দেখুন একটা মডেল যখন কিছুই জানে না তার মানে ইংরেজী ভাষাই বা কেন তার কাছে অর্থপূর্ণ হবে ? বাংলা ভাষায় "কর্তা কর্ম ক্রীয়া" হয়, ইংরেজীতে হয় "কর্তা ক্রীয়া কর্ম"। মানে হল বাংলায় যখন হয় "আমি ভাত খাই" যেখানে কর্তা আমি, কর্ম ভাত আর ক্রীয়া হল খাই। ইংরেজী করলে কী হয় ? I Eat Rice. শব্দে শব্দে বাংলা করলে কী হয় ? আমি খাই ভাত। কাব্যিক ভাবে মোটামুটি এইটার মানে থাকলেও স্বাভাবিক বাংলায় কিন্তু এভাবে জিনিসটা আমরা বলি না। "আমি ভাত খাই" ই বাংলার স্বাভাবিক ক্রমবিন্যাস। তাহলে ঐযে প্রথম পরীক্ষায় যে ইংরেজী ভাষার শব্দ উলটা পালটা অর্ডারে দেওয়ার কারনে মডেল বুঝতে পারেনি, আর মাল্টিলিংগুয়াল মডেলেরও বাংলা বুঝতে যে কষ্ট হয় এই দুটি বিষয়কে কি আমরা নিছকই কাকতালীয় বলে উড়িয়ে দিতে পারি ?

বিষয়টা এতই ইন্টারেস্টিং আমার কাছে যে এক্সপেরিমেন্ট করে দেখার লোভ সামলাতে পারছি না। কিন্তু উপযুক্ত কম্পিউটেশন পাওয়ার খুজে বের করা দুঃসাধ্য। কেউ যদি আগ্রহী থাকেন আর উপায় হাতে থাকে, আমার মাথায় একটা দারুন এক্সপেরিমেন্টের আইডিয়া আছে, করে দেখতে চাই। জানাবেন। ধন্যবাদ।

Mission: Impossible Language Models

Table of Contents

Share this article

Written by Sakhawat Adib

References

Mission: Impossible Language Models

AI মডেল কি গল্প লেখার প্রতিযোগিতায় মানুষ কে হারিয়ে দিতে পারবে? - "Measuring Psychological Depth in Language Models" - EMNLP 2024

জিপিটি ফোর কি একজন সাংবাদিকের মতো চিন্তা করতে পারে? EMNLP Outstanding Paper 2024

AI আমাদের বলা শব্দগুলোকে আলাদাভাবে চিনবে কেমন করে? - Tokenization in NLP

গবেষণাপত্র পড়ব কিভাবে ?

আর্টিফিসিয়াল ইন্টেলিজেন্স কি কৌতুহলী হতে পারে?