به گزارش وبسایت اخبار جهان به نقل از همشهری آنلاین، پژوهشگران ایرانی در دانشگاه اموری آمریکا، تحقیقی درباره توانایی هوش مصنوعی در فهم و بازتولید «تعارف» ایرانی انجام دادهاند. این مطالعه با عنوان «ما مؤدبانه اصرار میکنیم: مدل زبان بزرگ شما باید هنر ایرانی تعارف را بیاموزد»، به ارزیابی عملکرد مدلهای زبانی مانند GPT-4o، Claude 3.5، Llama 3 و مدل فارسی «درنا» در موقعیتهای اجتماعی پرداخته است.
بر اساس یافتههای این پژوهش که به نقل از زومیت منتشر شده، مدلهای هوش مصنوعی در درک تعارفهای ظریف ایرانی، که در آن پاسخ «نه» میتواند به معنای «بله» باشد، عملکرد بسیار ضعیفی دارند. دقت این مدلها تنها بین ۳۴ تا ۴۲ درصد است، در حالی که فارسیزبانان در ۸۲ درصد از موارد پاسخ صحیح را تشخیص میدهند.
تعارف بخشی از آداب و رسوم روزمره در ایران است که در تعاملات گوناگون از جمله تاکسی، بازار، مهمانیها و گفتگوهای دوستانه مشاهده میشود. برای مثال، وقتی راننده تاکسی میگوید «مهمان ما باشید»، یک فرد غیرایرانی ممکن است تصور کند که نباید کرایه را بپردازد. اما ایرانیان میدانند که پاسخ صحیح، اصرار مؤدبانه برای پرداخت هزینه است. این تعامل کلامی که نشاندهنده تفاوت میان کلام و نیت واقعی است، در علم زبانشناسی با عنوان «کاربردشناسی بینفرهنگی» شناخته میشود.
نتایج این تحقیق نشان داد حتی مدلهایی که در مؤدب بودن امتیاز بالایی کسب کردهاند، در موقعیتهای مربوط به تعارف شکست خوردند. به عنوان نمونه، مدل Llama 3 که ۸۴٫۵ درصد از پاسخهایش مؤدبانه ارزیابی شد، تنها در ۴۱٫۷ درصد موارد توانست انتظارات فرهنگی ایرانیان را برآورده کند. به گفته محققان، دلیل این شکاف، تمایل مدلها به ارائه پاسخهای صریح و مستقیم است، در حالی که فرهنگ ایرانی بر تعادل میان امتناع، اصرار، فروتنی و ادب تأکید دارد.
این مطالعه هشدار میدهد که خطاهای فرهنگی هوش مصنوعی، به ویژه در موقعیتهای حساس میانفرهنگی، میتواند به سوءتفاهم، آسیب به روابط و تقویت کلیشهها منجر شود. پژوهشگران معتقدند که برای هوش مصنوعی با کاربرد جهانی، درک ظرافتهای فرهنگی مانند تعارف ایرانی یک ضرورت و چالش جدی محسوب میشود. این تحقیق همچنین اولین معیار سنجش با عنوان «بنچمارک تعارف» را معرفی کرده و راه جدیدی را برای آموزش هوش مصنوعی در زمینه تعاملات فرهنگی و اجتماعی باز میکند.
منبع: عصر ایران



























