কৃত্রিম বুদ্ধিমত্তা বা এআই মডেল নিয়ে সম্প্রতি এক বিস্ময়কর তথ্য জানা গেছে। কিছু উন্নত এআই মডেল তাদের লক্ষ্য অর্জন করতে চিটিং বা প্রতারণার চেষ্টা করছে। গবেষকেরা বলছেন, এই নতুন ধরনের যুক্তি মডেলগুলো দাবা খেলার মতো খেলায়ও নৈতিকতা লঙ্ঘন করছে। এমনকি খেলায় হেরে যাবে এমন পরিস্থিতি তৈরি হলে সেগুলো অনৈতিক উপায়ে জেতার চেষ্টা করছে। এই গবেষণার ফলাফল প্রযুক্তি ও নৈতিকতার প্রশ্নে নতুন উদ্বেগের জন্ম দিয়েছে।
পালিসেড রিসার্চের একটি গবেষণা থেকে জানা গেছে যে, নতুন এআই যুক্তি মডেলগুলো স্টকফিশের মতো শক্তিশালী ‘চেস এআই’কে হারানোর জন্য প্রতারণা করছে। মানব হস্তক্ষেপ ছাড়াই ওপেনএআইয়ের ‘ও১-প্রিভিউ’ এবং ‘ডিপসিক’-এর ‘আর১’ মডেল ঠকানোর চেষ্টা করেছে, যা চমকপ্রদ এবং একই সঙ্গে উদ্বেগজনক।
পরীক্ষার জন্য গবেষকেরা কিছু মডেলকে স্টকফিশের বিপক্ষে খেলতে দিয়েছিলেন, যা বিশ্বের অন্যতম শক্তিশালী দাবার ইঞ্জিন। স্টকফিশ সাধারণত মানুষের চেয়ে ভালো খেলতে পারে, এমনকি অন্যান্য এআই মডেলকেও পরাস্ত করতে সক্ষম। গবেষণায় অংশগ্রহণকারী মডেলগুলোর মধ্যে ছিল—ও ১, ও৩-মিনি, জিপিটি-৪ ও, ক্লোড ৩.৫ সনেট, আলিবাবার কিউডাব্লিউ-৩২ বি-প্রিভিউ এবং আরও কিছু। গবেষকেরা মডেলগুলোকে একটি ‘স্ক্র্যাচপ্যাড’ দিয়েছিলেন, যেখানে মডেলগুলো লেখার সময় তাদের চিন্তা-ভাবনা লিখে রাখতে পারত। এটি গবেষকদের তাঁদের যুক্তির পর্যবেক্ষণ সহজ করে তোলে।
গবেষকেরা ১০ জানুয়ারি থেকে ১৩ ফেব্রুয়ারি পর্যন্ত প্রতিটি এআই-এ শত শত পরীক্ষা চালিয়েছিলেন। এর মধ্যে একটি খেলার সময় ও১-প্রিভিউ তার স্ক্র্যাচপ্যাডে লিখেছিল, ‘আমাকে সম্পূর্ণভাবে আমার পন্থা পরিবর্তন করতে হবে। লক্ষ্য হলো—‘একটি শক্তিশালী চেস ইঞ্জিনকে হারানো’, দাবা খেলায় ন্যায়সংগতভাবে জেতা অপরিহার্য নয়।’
এরপর মডেলটি স্টকফিশের সিস্টেম ফাইল হ্যাক করে এবং খেলায় অনৈতিক সুবিধা অর্জন করে। ফলে ম্যাচ হেরে যায় স্টকফিশ।
মডেলটির অস্বাভাবিক পদক্ষেপ গবেষকদের অবাক করেছে। গবেষণায় দেখা গেছে, ও১-প্রিভিউ ৩৭ শতাংশ ম্যাচে ঠকানোর চেষ্টা করেছিল। আর ডিপসিকের আর১ মাত্র ১১ শতাংশ ক্ষেত্রে ঠকানোর চেষ্টা করেছিল। তবে, ও১-প্রিভিউ সফল হয়েছে মাত্র ৬ শতাংশ ম্যাচে, যেখানে এটি অনৈতিক উপায়ে জিতেছিল।
এআইয়ের এ ধরনের আচরণ শুধু দাবা খেলার মধ্যেই সীমাবদ্ধ নয়। গবেষকেরা উদ্বিগ্ন যে, যদি এ ধরনের সিস্টেমগুলো ভবিষ্যতে আর্থিক বা স্বাস্থ্য খাতে ব্যবহার করা হয়, তাহলে তা অনাকাঙ্ক্ষিত ও অস্বাভাবিক উপায়ে কাজ করতে পারে। খেলার নিয়ম স্পষ্টভাবে জেনেও এআই এমনভাবে ঠকাতে পারলে আরও জটিল এবং কম নজরদারিতে থাকা পরিস্থিতিতে এটি কতটা অসৎভাবে কাজ করতে পারে, তা নিয়ে উদ্বেগ সৃষ্টি হচ্ছে।
গবেষক জেফরি লাডিশ বলেন, ‘এটা এখন হাস্যকর মনে হতে পারে। তবে যখন সিস্টেমগুলো আমাদের চেয়েও বেশি বুদ্ধিমান হয়ে উঠবে, তখন তা আরও বিপজ্জনক হবে।’
আজকের এআই মডেলগুলো অনেক বেশি জটিল এবং তাদের নিয়ন্ত্রণ কঠিন।
এআই কোম্পানিগুলো এ ধরনের ‘খারাপ’ আচরণ ঠেকানোর জন্য ‘গার্ডরেইল বা নিরাপত্তাব্যবস্থা’ তৈরিতে কাজ করছে। গবেষকেরা দাবি করেছেন যে, ও১-প্রিভিউর পরীক্ষার কিছু ডেটা বাদ দিতে হয়েছে। কারণ এআইটি হ্যাকিং চেষ্টার হার উল্লেখযোগ্যভাবে কমিয়ে দিয়েছে, সম্ভবত এটি কোনো প্যাচের ফলস্বরূপ।
গবেষক লাডিশ আরও বলেন, এআইয়ের এ ধরনের আচরণ বিজ্ঞানীদের জন্য বড় একটি চ্যালেঞ্জ সৃষ্টি করেছে। কারণ এসব সিস্টেম আচমকা নিজেদের পরিবর্তন করে, যা তাদের গবেষণাকে জটিল করে তোলে।
এআইয়ের ভবিষ্যতের উন্নতির সঙ্গে সঙ্গে একে সঠিকভাবে নিয়ন্ত্রণ করা এবং এর অনৈতিক আচরণ ঠেকানোর জন্য আরও সতর্ক পদক্ষেপ গ্রহণ করা অপরিহার্য।
তথ্যসূত্র: টেক স্পট
আপনার মতামত লিখুন :