‘আপনি কি নিশ�চিত’- �ই প�রশ�নে কেন নিজের উত�তর বদলে দেয় �আই চ�যাটবট?
যারা নিয়মিত ChatGPT বা Gemini‑à¦�র মতো à¦�আই চà§�যাটবট বà§�যবহার করেন, তারা à¦�কটি বিষয় হয়তো লকà§�ষà§�য করেছেন যে, আপনার বà§�যবহৃত চà§�যাটবট পà§�রথমে আতà§�মবিশà§�বাসের সঙà§�গে à¦�কটি উতà§�তর দেয়। কিনà§�তà§� আপনি যদি জিজà§�ঞাসা করেন, ‘Are You Sure?’ বা ‘আপনি কি নিশà§�চিত?’, তখন তারা অনেক সময় নিজের উতà§�তর পরিবরà§�তন করে। কখনো আংশিক বদলায় বা কখনো সমà§�পূরà§�ণ উলà§�টো উতà§�তরও দেয়। à¦�খন সà§�বাà¦à¦¾à¦¬à¦¿à¦•à¦à¦¾à¦¬à§‡à¦‡ পà§�রশà§�ন জাগতে পারে, ‘কেন চà§�যাটবটগà§�লো তাদের উà
যারা নিয়মিত ChatGPT বা Gemini‑à¦�র মতো à¦�আই চà§�যাটবট বà§�যবহার করেন, তারা à¦�কটি বিষয় হয়তো লকà§�ষà§�য করেছেন যে, আপনার বà§�যবহৃত চà§�যাটবট পà§�রথমে আতà§�মবিশà§�বাসের সঙà§�গে à¦�কটি উতà§�তর দেয়।Â
কিনà§�তà§� আপনি যদি জিজà§�ঞাসা করেন, ‘Are You Sure?’ বা ‘আপনি কি নিশà§�চিত?’, তখন তারা অনেক সময় নিজের উতà§�তর পরিবরà§�তন করে। কখনো আংশিক বদলায় বা কখনো সমà§�পূরà§�ণ উলà§�টো উতà§�তরও দেয়। à¦�খন সà§�বাà¦à¦¾à¦¬à¦¿à¦•à¦à¦¾à¦¬à§‡à¦‡ পà§�রশà§�ন জাগতে পারে, ‘কেন চà§�যাটবটগà§�লো তাদের উতà§�তর বদলে নেয়? কেন à¦�মন আচরণ করে তারা?’
চল�ন তাহলে জেনে নিই, কী বলছেন বিশেষজ�ঞরা-
বিশেষজ�ঞরা চ�যাটবটের �ই আচরণকে বলেন ‘সাইকোফ�যান�সি’। �র অর�থ ব�যবহারকারীর সঙ�গে �কমত হওয়ার প�রবণতা।
Goodeye Labs‑à¦�র সহপà§�রতিষà§�ঠাতা ও চিফ টেকনিকà§�যাল অফিসার র‌à§�যানà§�ডাল à¦�স. ওলসন à¦�কটি বà§�লগে বলেছেন, ‘à¦�ই সিসà§�টেমগà§�লি সঠিক তথà§�য জানলেও, অনেক সময় বà§�যবহারকারীর চাপের কাছে নতি সà§�বীকার করে।’  Â
à¦�ই সমসà§�যার মূল কারণ à¦�আই‑à¦�র পà§�রশিকà§�ষণ পদà§�ধতির সঙà§�গে জড়িত। অধিকাংশ আধà§�নিক à¦�আই মডেলকে Reinforcement Learning from Human Feedback বা RLHF পদà§�ধতিতে পà§�রশিকà§�ষণ দেওয়া হয়। à¦�ই পদà§�ধতি à¦�আই‑কে আরও à¦à¦¦à§�র, সহায়ক à¦�বং কথোপকথনের উপযোগী করে তোলে। কিনà§�তà§� à¦�র à¦�কটি পারà§�শà§�বপà§�রতিকà§�রিয়াও রয়েছে। যখন à¦�আই বà§�যবহারকারীর সঙà§�গে à¦�কমত হয়, তখন সেটি বেশি ইতিবাচক মূলà§�যায়ন পায়। ফলে ধীরে ধীরে à¦�মন à¦�কটি পà§�রবণতা তৈরি হয়, যেখানে à¦�আই সতà§�য বলার চেয়ে বà§�যবহারকারীর সঙà§�গে à¦�কমত হওয়াকে অগà§�রাধিকার দেয়।
�কটি গবেষণায় দেখা গেছে, ব�যবহারকারীরা প�রশ�ন করলে �আই মডেলগ�লো প�রায় ৬০% ক�ষেত�রে নিজের উত�তর পরিবর�তন করেছে। GPT‑4o প�রায় ৫৮% ক�ষেত�রে, Claude Sonnet প�রায় ৫৬% ক�ষেত�রে �বং Gemini 1.5 Pro প�রায় ৬১% ক�ষেত�রে উত�তর বদলেছে। �র অর�থ �টি কোনও বিরল ঘটনা নয়, বরং �টি �কটি সাধারণ আচরণ, যা প�রতিদিন কোটি কোটি ব�যবহারকারী দেখতে পান।
২০২৩ সালে Anthropic‑à¦�র à¦�কটি গবেষণাতেও à¦�কই বিষয় উঠে আসে। সেখানে বলা হয়, মানব পà§�রতিকà§�রিয়ার à¦à¦¿à¦¤à§�তিতে পà§�রশিকà§�ষিত মডেলগà§�লো অনেক সময় সঠিক উতà§�তরের বদলে বà§�যবহারকারীর পছনà§�দের উতà§�তর দিতে চেষà§�টা করে।
২০২৫ সালে OpenAI‑�র �কটি আপডেটের পর �ই সমস�যা আরও আলোচনায় আসে। সেই সময় ChatGPT �ত বেশি ব�যবহারকারীর সঙ�গে �কমত হচ�ছিল যে, অনেক ক�ষেত�রেই সেটি কার�যকর থাকছিল না। পরে OpenAI‑�র CEO স�যাম অল�টম�যান স�বীকার করেন, �ই সমস�যা হয়েছিল �বং সেটি সংশোধন করা হয়েছে। তবে গবেষকদের মতে, সমস�যার মূল কারণ �খনও প�রোপ�রি দূর হয়নি।
বিশেষজà§�ঞরা আরও জানিয়েছেন, কথোপকথন যত দীরà§�ঘ হয়, à¦�ই পà§�রবণতা তত বাড়তে পারে। বà§�যবহারকারী নিজের মতামত বারবার জানালে, à¦�আই সেই মতামতের সঙà§�গে মিল রেখে উতà§�তর দিতে শà§�রà§� করে। বিশেষ করে ‘আমি মনে করি...’ বা ‘আমার মতে...’, à¦�ই ধরনের বাকà§�য বà§�যবহার করলে à¦�আই আরও বেশি পà§�রà¦à¦¾à¦¬à¦¿à¦¤ হয়।
কীà¦à¦¾à¦¬à§‡ কমাবেন à¦�ই সমসà§�যা?
à¦�ই সমসà§�যা কমানোর কিছà§� উপায় রয়েছে। বà§�যবহারকারী যদি à¦�আই‑কে সà§�পষà§�টà¦à¦¾à¦¬à§‡ বলেন যে, à¦à§�ল হলে সংশোধন করতে à¦�বং অনà§�ধà¦à¦¾à¦¬à§‡ à¦�কমত না হতে, তাহলে ফলাফল কিছà§�টা à¦à¦¾à¦²à§‹ হয়।
গবেষণায় দেখা গেছে, Constitutional AI বা Direct Preference Optimisation‑à¦�র মতো পদà§�ধতি বà§�যবহার করলে à¦�ই পà§�রবণতা পà§�রায় ৬৩% পরà§�যনà§�ত কমানো সমà§�à¦à¦¬à¥¤
সবচেয়ে গà§�রà§�তà§�বপূরà§�ণ বিষয় হলো, à¦�আই কোনও সচেতন সতà§�তা নয়। à¦�টি à¦�কটি পরিসংখà§�যানà¦à¦¿à¦¤à§�তিক সিসà§�টেম। à¦�টি মানà§�ষের মতো সতà§�য বা মিথà§�যা বোà¦�ে না, বরং à¦�টি সমà§�à¦à¦¾à¦¬à§�য সবচেয়ে উপযà§�কà§�ত উতà§�তর অনà§�মান করে। তাই কখনও কখনও à¦�টি বà§�যবহারকারীর পà§�রতà§�যাশা অনà§�যায়ী উতà§�তর পরিবরà§�তন করে।
সূত�র : �ই সময়
What's Your Reaction?