سایت خبری
famaserver
  • صفحه اصلی
سایت خبری

سرتیتر خبرها

انتشار نسخه ویژه نابینایان «آمارکورد» با صدای صالح میرزاآقایی

5 ماه پیش

دیدار با تهیه‌کننده پیشکسوت در خانه سینما با ذکر چند خاطره

5 ماه پیش

گرافیست مشهور ایرانی به دنیای بازیگری قدم گذاشت

6 ماه پیش

جایزه‌ای تخصصی برای پاسداری از زبان فارسی در رسانه ملی

6 ماه پیش

رادیو مقاومت افتتاح شد/ رادیو مقاومت؛ روایت استقامت در دفاع مقدس ۱۲ روزه 

6 ماه پیش

وقتی اندیشه روی صحنه می‌آید/ ۵۱ چکیده مقاله به مرحله نهایی داوری جشنواره تئاتر فجر راه یافت

6 ماه پیش

کارگردان مشهور علیه بازیگر مشهور: نقش تو بی‌اثر بود!

6 ماه پیش

اگر می‌خواهید کلیشه‌ای نشوید، جنسیت‌تان را عوض کنید/ راز کارگردان مردی که فیلم‌هایش تم زنانه دارند

6 ماه پیش

زنی در آستانه فروپاشی روانی/ نگاهی به «کلسیم»

7 ماه پیش

کرملین: طرح صلح ۱۹ ماده‌ای درباره اوکراین را دریافت نکرده‌ایم

7 ماه پیش

بازی سوپر ماریو به بنچمارکی برای مقایسه عملکرد مدل‌های هوش مصنوعی تبدیل شد

زمان انتشار: 5 مارس 2025 ساعت 18:54

دسته بندی: علمی فناوری

شناسه خبر: 868137

زمان مطالعه: 6 دقیقه

بازی سوپر ماریو به بنچمارکی برای مقایسه عملکرد مدل‌های هوش مصنوعی تبدیل شد

بازی سوپر ماریو به بنچمارکی برای مقایسه عملکرد مدل‌های هوش مصنوعی تبدیل شد

به گزارش خبرگزاری recive و براساس گزارش دیجیاتو، محققان گروه «Hao AI Lab» در دانشگاه کالیفرنیا سن دیگو، هوش مصنوعی را وارد دنیای بازی‌های کلاسیک کردند و مدل‌های هوش مصنوعی مطرح را در نسخه‌ای خاص از «Super Mario Bros» به چالش کشیدند. این نسخه از بازی که در شبیه‌ساز اجرا می‌شد، به کمک فریم‌ورک داخلی «GamingAgent» به هوش مصنوعی امکان کنترل مستقیم ماریو را می‌داد.

عملکرد ضعیف مدل‌های گوگل و OpenAI

در این رقابت بین هوش مصنوعی‌های شناخته‌شده، مدل Claude 3.7 از شرکت آنتروپیک بهترین عملکرد را داشت و پس از آن نسخه Claude 3.5 قرار گرفت. مدل‌های معروفی مانند جمینای ۱.۵ پرو از گوگل و GPT-4o از OpenAI نتوانستند چندان خوب عمل کنند.

نکته جالب اینکه مدل‌ها برای هدایت ماریو باید دستورات را به‌صورت کدهای پایتون تولید می‌کردند. GamingAgent به مدل‌ها اطلاعات اولیه‌ای مثل اینکه مانع یا دشمن نزدیک است، به چپ بپر و اسکرین‌شات‌هایی از محیط بازی ارائه می‌کرد. سپس مدل‌ها باید با تحلیل این داده‌ها، استراتژی‌هایی برای عبور از موانع، جمع‌آوری سکه‌ها و پیشرفت در مراحل طراحی می‌کردند.

رقابت مدل‌های هوش مصنوعی

یکی از نکات جالب عملکرد ضعیف‌تر مدل‌های مبتنی‌بر استدلال گام‌به‌گام مانند نسخه GPT-4o reasoning نسبت به مدل‌های معمولی بود. برخلاف انتظار، مدل‌های استدلالگر که در حل مسائل پیچیده‌تر و تفکر منطقی عملکرد بهتری دارند، در محیط‌های بلادرنگ (real-time)، مثل بازی سوپر ماریو، با مشکل مواجه شدند. علت اصلی این ضعف زمان‌بر بودن تصمیم‌گیری است که گاهی چند ثانیه طول می‌کشد و در بازی‌هایی مثل ماریو تفاوت پرش موفق یا سقوط را رقم می‌زند.

استفاده از بازی برای مقایسه عملکرد مدل‌های هوش مصنوعی

استفاده از بازی‌ها برای بنچمارک‌کردن هوش مصنوعی کار جدیدی نیست و از دهه‌ها پیش وجود داشته اما برخی کارشناسان معتقدند مقایسه عملکرد AI در بازی‌ها با پیشرفت واقعی در هوش مصنوعی عمومی گمراه‌کننده است. بازی‌ها نسبت به دنیای واقعی انتزاعی‌تر و ساده‌ترند و حجم داده‌های در دسترس برای تمرین نیز تقریباً بی‌نهایت است.

این آزمایش‌های نمایشی و رقابت‌های گیمینگ به بخشی از آن چیزی تبدیل شده‌اند که «آندری کارپاتی»، پژوهشگر ارشد و هم‌بنیان‌گذار OpenAI، آن را بحران ارزیابی توصیف می‌کند. کارپاتی در پستی در شبکه اجتماعی ایکس نوشت:«راستش را بخواهید، دیگر نمی‌دانم باید به کدام معیارها نگاه کنم. خلاصه اینکه اصلاً نمی‌دانم این مدل‌ها دقیقاً چقدر خوب‌اند.»

این آزمایش در شرایطی انجام شده که شرکت‌ها به‌دنبال روش‌های جدیدی برای ارزیابی هوش مصنوعی فراتر از معیارهای سنتی مثل MMLU یا BIG-bench هستند. بازی‌های بلادرنگ شاید معیار کاملی نباشند اما نشان می‌دهند مدل‌های زبانی هنوز در تلفیق سرعت تصمیم‌گیری و استدلال منطقی، چالش‌های اساسی دارند.

۲۲۷۲۲۷

حتما بخوانید : «شهر گمشده طلا» پیدا شد / عکس
اشتراک گذاری

اخبار مرتبط

  • خانه‌های متحرک ۱۰۰ میلیاردی معرفی شدند 8 ماه پیش
  • مقام روس از ایلان ماسک خواست برای اتصال روسیه و آمریکا تونل زیردریایی بسازد 8 ماه پیش
  • هواوی ارزان‌ترین گوشی تاشو را معرفی کرد
    هواوی ارزان‌ترین گوشی تاشو را معرفی کرد 8 ماه پیش
  • فروش اینترنت ماهواره‌ای در همسایگی ایران کلید خورد
    فروش اینترنت ماهواره‌ای در همسایگی ایران کلید خورد 8 ماه پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • آذربایجان شرقی 257
  • آذربایجان غربی 189
  • اجتماعی 8698
  • اخبار 24777
  • اخبار استانها 2901
  • اردبیل 354
  • اصفهان 506
  • اقتصادی 8298
  • البرز 475
  • بین المللی 8411
  • تکنولوژی 1046
  • تهران 22
  • چهارمحال و بختیاری 1216
  • خراسان رضوی 563
  • خوزستان 1688
  • زنجان 226
  • سبک زندگی 117
  • سلامت 76
  • سمنان 3016
  • سیاسی 10664
  • سیستان و بلوچستان 10
  • علمی فناوری 5086
  • فارس 338
  • فرهنگ و هنر 9376
  • فیلم 12771
  • قزوین 910
  • قم 63
  • کردستان 744
  • کرمان 1344
  • کرمانشاه 620
  • کهگیلویه و بویراحمد 85
  • گلستان 33
  • گیلان 698
  • لرستان 214
  • مازندران 207
  • مرکزی 5
  • موبایل 403
  • میزبانی وب 11
  • هرمزگان 264
  • همدان 459
  • ورزشی 20144
  • یزد 171

جدیدترین مقالات

  • ادارات، مدارس و دانشگاه‌های مشهد و خراسان رضوی فردا (چهارشنبه، ۱۰ دی ۱۴۰۴) تعطیل شد 4 ماه پیش
  • انتشار نسخه ویژه نابینایان «آمارکورد» با صدای صالح میرزاآقایی 5 ماه پیش
  • روشنی مدیر جدید پخش فرآورده های نفتی در البرز
    روشنی مدیر جدید پخش فرآورده های نفتی در البرز 5 ماه پیش
  • کرج باید به هویت تاریخی و فرهنگی خود ببالد
    کرج باید به هویت تاریخی و فرهنگی خود ببالد 5 ماه پیش
  • از اول دی‌ اعتبار مالیاتی فقط با فاکتور الکترونیکی محاسبه می‌شود 5 ماه پیش

لینکهای پیشنهادی

سرور مجازی |  هاست ویندوز | هاست لاراول | دانلود رایگان نرم افزار

میزبانی در هاست لینوکس فاماسرور