‘আপনি কি নিশ�চিত’- �ই প�রশ�নে কেন নিজের উত�তর বদলে দেয় �আই চ�যাটবট?

যারা নিয়মিত ChatGPT বা Gemini‑à¦�র মতো à¦�আই চà§�যাটবট বà§�যবহার করেন, তারা à¦�কটি বিষয় হয়তো লকà§�ষà§�য করেছেন যে, আপনার বà§�যবহৃত চà§�যাটবট পà§�রথমে আতà§�মবিশà§�বাসের সঙà§�গে à¦�কটি উতà§�তর দেয়।  কিনà§�তà§� আপনি যদি জিজà§�ঞাসা করেন, ‘Are You Sure?’ বা ‘আপনি কি নিশà§�চিত?’, তখন তারা অনেক সময় নিজের উতà§�তর পরিবরà§�তন করে। কখনো আংশিক বদলায় বা কখনো সমà§�পূরà§�ণ উলà§�টো উতà§�তরও দেয়। à¦�খন সà§�বাভাবিকভাবেই পà§�রশà§�ন জাগতে পারে, ‘কেন চà§�যাটবটগà§�লো তাদের উà

‘আপনি কি নিশ�চিত’- �ই প�রশ�নে কেন নিজের উত�তর বদলে দেয় �আই চ�যাটবট?

যারা নিয়মিত ChatGPT বা Gemini‑�র মতো �আই চ�যাটবট ব�যবহার করেন, তারা �কটি বিষয় হয়তো লক�ষ�য করেছেন যে, আপনার ব�যবহৃত চ�যাটবট প�রথমে আত�মবিশ�বাসের সঙ�গে �কটি উত�তর দেয়। 

কিন�ত� আপনি যদি জিজ�ঞাসা করেন, ‘Are You Sure?’ বা ‘আপনি কি নিশ�চিত?’, তখন তারা অনেক সময় নিজের উত�তর পরিবর�তন করে। কখনো আংশিক বদলায় বা কখনো সম�পূর�ণ উল�টো উত�তরও দেয়। �খন স�বাভাবিকভাবেই প�রশ�ন জাগতে পারে, ‘কেন চ�যাটবটগ�লো তাদের উত�তর বদলে নেয়? কেন �মন আচরণ করে তারা?’

চল�ন তাহলে জেনে নিই, কী বলছেন বিশেষজ�ঞরা-

বিশেষজ�ঞরা চ�যাটবটের �ই আচরণকে বলেন ‘সাইকোফ�যান�সি’। �র অর�থ ব�যবহারকারীর সঙ�গে �কমত হওয়ার প�রবণতা।

Goodeye Labs‑�র সহপ�রতিষ�ঠাতা ও চিফ টেকনিক�যাল অফিসার র‌�যান�ডাল �স. ওলসন �কটি ব�লগে বলেছেন, ‘�ই সিস�টেমগ�লি সঠিক তথ�য জানলেও, অনেক সময় ব�যবহারকারীর চাপের কাছে নতি স�বীকার করে।’   

�ই সমস�যার মূল কারণ �আই‑�র প�রশিক�ষণ পদ�ধতির সঙ�গে জড়িত। অধিকাংশ আধ�নিক �আই মডেলকে Reinforcement Learning from Human Feedback বা RLHF পদ�ধতিতে প�রশিক�ষণ দেওয়া হয়। �ই পদ�ধতি �আই‑কে আরও ভদ�র, সহায়ক �বং কথোপকথনের উপযোগী করে তোলে। কিন�ত� �র �কটি পার�শ�বপ�রতিক�রিয়াও রয়েছে। যখন �আই ব�যবহারকারীর সঙ�গে �কমত হয়, তখন সেটি বেশি ইতিবাচক মূল�যায়ন পায়। ফলে ধীরে ধীরে �মন �কটি প�রবণতা তৈরি হয়, যেখানে �আই সত�য বলার চেয়ে ব�যবহারকারীর সঙ�গে �কমত হওয়াকে অগ�রাধিকার দেয়।

�কটি গবেষণায় দেখা গেছে, ব�যবহারকারীরা প�রশ�ন করলে �আই মডেলগ�লো প�রায় ৬০% ক�ষেত�রে নিজের উত�তর পরিবর�তন করেছে। GPT‑4o প�রায় ৫৮% ক�ষেত�রে, Claude Sonnet প�রায় ৫৬% ক�ষেত�রে �বং Gemini 1.5 Pro প�রায় ৬১% ক�ষেত�রে উত�তর বদলেছে। �র অর�থ �টি কোনও বিরল ঘটনা নয়, বরং �টি �কটি সাধারণ আচরণ, যা প�রতিদিন কোটি কোটি ব�যবহারকারী দেখতে পান।

২০২৩ সালে Anthropic‑�র �কটি গবেষণাতেও �কই বিষয় উঠে আসে। সেখানে বলা হয়, মানব প�রতিক�রিয়ার ভিত�তিতে প�রশিক�ষিত মডেলগ�লো অনেক সময় সঠিক উত�তরের বদলে ব�যবহারকারীর পছন�দের উত�তর দিতে চেষ�টা করে।

২০২৫ সালে OpenAI‑�র �কটি আপডেটের পর �ই সমস�যা আরও আলোচনায় আসে। সেই সময় ChatGPT �ত বেশি ব�যবহারকারীর সঙ�গে �কমত হচ�ছিল যে, অনেক ক�ষেত�রেই সেটি কার�যকর থাকছিল না। পরে OpenAI‑�র CEO স�যাম অল�টম�যান স�বীকার করেন, �ই সমস�যা হয়েছিল �বং সেটি সংশোধন করা হয়েছে। তবে গবেষকদের মতে, সমস�যার মূল কারণ �খনও প�রোপ�রি দূর হয়নি।

বিশেষজ�ঞরা আরও জানিয়েছেন, কথোপকথন যত দীর�ঘ হয়, �ই প�রবণতা তত বাড়তে পারে। ব�যবহারকারী নিজের মতামত বারবার জানালে, �আই সেই মতামতের সঙ�গে মিল রেখে উত�তর দিতে শ�র� করে। বিশেষ করে ‘আমি মনে করি...’ বা ‘আমার মতে...’, �ই ধরনের বাক�য ব�যবহার করলে �আই আরও বেশি প�রভাবিত হয়।

কীভাবে কমাবেন �ই সমস�যা?

�ই সমস�যা কমানোর কিছ� উপায় রয়েছে। ব�যবহারকারী যদি �আই‑কে স�পষ�টভাবে বলেন যে, ভ�ল হলে সংশোধন করতে �বং অন�ধভাবে �কমত না হতে, তাহলে ফলাফল কিছ�টা ভালো হয়।

গবেষণায় দেখা গেছে, Constitutional AI বা Direct Preference Optimisation‑�র মতো পদ�ধতি ব�যবহার করলে �ই প�রবণতা প�রায় ৬৩% পর�যন�ত কমানো সম�ভব।

সবচেয়ে গ�র�ত�বপূর�ণ বিষয় হলো, �আই কোনও সচেতন সত�তা নয়। �টি �কটি পরিসংখ�যানভিত�তিক সিস�টেম। �টি মান�ষের মতো সত�য বা মিথ�যা বো�ে না, বরং �টি সম�ভাব�য সবচেয়ে উপয�ক�ত উত�তর অন�মান করে। তাই কখনও কখনও �টি ব�যবহারকারীর প�রত�যাশা অন�যায়ী উত�তর পরিবর�তন করে।

সূত�র : �ই সময়

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow