شناسه : 32351
۱۳ آبان ۱۴۰۳ - ۱۳:۱۰
۰ دیدگاه

مدل های جدید هوش مصنوعی به کاربر دروغ می‌گویند

معیار جدید شرکت اوپن ای آی حاکی از آن است که مدل های هوش مصنوعی این شرکت و همچنین دیگر همتایان آن از پاسخگویی درست به سوالات ناتوان هستند و همه آنها توهم دارند.

به گزارش تیکنا و به نقل از فیوچریسم، شرکت اوپن ای آی یک معیار جدید به نام «پرسش و پاسخ ساده» (SimpleQA) ارائه کرده که هدف آن اندازه گیری دقت خروجی مدل های هوش مصنوعی خود و شرکت های دیگر است.

این شرکت هوش مصنوعی با انجام چنین اقدامی نشان داد مدل های جدید فناوری مذکور در فراهم کردن پاسخ درست به سوالات عملکرد بدی دارند. نسخه هوش مصنوعی o۱-preview این شرکت که ماه گذشته ارائه شد در آزمون جدید به نرخ موفقیت ۴۲.۷ درصد دست یافت.

به بیان دیگر حتی برترین مدل های بزرگ زبانی که به تازگی معرفی شده اند احتمال زیادی دارد به جای پاسخ درست، جوابی اشتباه به کاربر بدهند. با توجه به آنکه این فناوری در بسیاری از وجوه مختلف زندگی انسان ها نفوذ کرده، چنین امری نگران کننده است.

مدل های هوش مصنوعی رقیب مانند محصول شرکت «آنتروپیک» در آزمون SimpleQA امتیاز پایین تری کسب کردند، به طوریکه مدل تازه منتشر شده Claude-۳.۵-sonnet این شرکت فقط به ۲۸.۹ درصد سوالات پاسخ درست داد. با این وجود مدل مذکور بیشتر تمایل داشت عدم قطعیت خود را نشان دهد و از پاسخ دادن خودداری کند، که این امر با توجه به نتایج ناامید کننده احتمالا گزینه بهتری است.

در این میان اوپن ای آی متوجه شد مدل های هوش مصنوعی خود این شرکت توانمندی هایشان را فراتر از حد معمول تخمین می زنند. این ویژگی احتمالا سبب می شود تا مدل ها نسبت به پاسخ های اشتباهی که می سازند، اطمینان بیشتری داشته باشند.

مدل های زبانی بزرگ از مدت ها قبل با اشتباهات یا «توهمات» دست وپنجه نرم می کنند. این اصطلاحی است که شرکت های هوش مصنوعی برای تمایل محصولاتشان به تولید پاسخ های بی ربط به کارمی برند.

جدیدترین یافته های اوپن ای آی یک نشانه نگران کننده مهم در خود دارد و حاکی از آن است که مدل های زبانی بزرگ نمی توانند حقیقت را بیان کنند.

لینک کوتاه :

https://tiecna.com/?p=32351

برچسب ها

هوش مصنوعی

خبرهای مشابه

گوگل شکایت خودکشی نوجوان با تشویق هوش مصنوعی را تسویه کرد

پانسمان ایرانی جایگزین نمونه سوئدی شد؛ در انتظار ۲۸ میلیارد تومان برای نجات بیماران پروانه‌ای

۳۰ روز تا اعزام فضانوردان به ماه

خبرهای مشابه

۱۸ دی ۱۴۰۴

گوگل شکایت خودکشی نوجوان با تشویق هوش مصنوعی را تسویه کرد

گوگل و یک استارت آپ هوش مصنوعی شکایت مادری که مدعی شده بود پسر نوجوانش با تشویق هوش چت باتی به خودکشی تشویق شده را تسویه کردند.

۱۷ دی ۱۴۰۴

پانسمان ایرانی جایگزین نمونه سوئدی شد؛ در انتظار ۲۸ میلیارد تومان برای نجات بیماران پروانه‌ای

یک شرکت دانش‌بنیان موفق به ساخت پانسمانی شده است که برای ترمیم انواع زخم‌ها، از جمله زخم‌های دیابتی، سوختگی‌ها، جراحات جنگی و زخم‌های تروماتیک طراحی شده است.

۱۷ دی ۱۴۰۴

۳۰ روز تا اعزام فضانوردان به ماه

اگر جدول زمانبندی فعلی ماموریت های ناسا درست باشد، ماموریت فضانوردی آتی این سازمان احتمالاً یک ماه دیگر انجام می شود.

ثبت دیدگاه

دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.