سایت خبری
famaserver
  • خانه
  • اخبار ورزشی
  • اخبار استانها
  • اجتماعی
  • فرهنگ و هنر
  • اقتصادی
  • سیاسی
  • بین الملل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

دیدار دبیران فجر با استاد حسن ریاحی/ مرور خاطرات و ایده‌های نو برای جشنواره

دیدار دبیران فجر با استاد حسن ریاحی/ مرور خاطرات و ایده‌های نو برای جشنواره

4 ساعت پیش
نامه خانه سینما به ریاست قوه قضاییه/ دفاع ما از همکاران بازیگرمان، فریادی برای حراست از حریم تمام شهروندان ایرانی است

نامه خانه سینما به ریاست قوه قضاییه/ دفاع ما از همکاران بازیگرمان، فریادی برای حراست از حریم تمام شهروندان ایرانی است

4 ساعت پیش
سن فقط یه عدده… اگر حسابت پُر باشه!/ «دیازپام»؛ کمدی جدید سینما

سن فقط یه عدده… اگر حسابت پُر باشه!/ «دیازپام»؛ کمدی جدید سینما

4 ساعت پیش
پشت پرده خلق آثار هنری/ «پشتِ بوم» جهان ذهنی هنرمندان را نشان می‌دهد

پشت پرده خلق آثار هنری/ «پشتِ بوم» جهان ذهنی هنرمندان را نشان می‌دهد

4 ساعت پیش
۱۲ روز جنگ روی بوم‌های شلاق‌خورده/ سیاه و سفید، سکوت و آشوب را روایت می‌کند

۱۲ روز جنگ روی بوم‌های شلاق‌خورده/ سیاه و سفید، سکوت و آشوب را روایت می‌کند

4 ساعت پیش
قصه یک آنارشیست در تئاتر شهر

قصه یک آنارشیست در تئاتر شهر

4 ساعت پیش
چرا سکه‌ها نرسید؟/ معاون ارشاد و داستان تابلوهای پرطمطراق

چرا سکه‌ها نرسید؟/ معاون ارشاد و داستان تابلوهای پرطمطراق

4 ساعت پیش
تهران رکورد زد! ۱۰ نمایش بخش تازه‌های دیگرگونه‌های اجرایی تئاتر فجر نهایی شدند

تهران رکورد زد! ۱۰ نمایش بخش تازه‌های دیگرگونه‌های اجرایی تئاتر فجر نهایی شدند

4 ساعت پیش
واکنش مردم به فحاشی خداداد عزیزی روی آنتن زنده چه بود؟

واکنش مردم به فحاشی خداداد عزیزی روی آنتن زنده چه بود؟

4 ساعت پیش
درخواست شاهسواری از اهالی سینما/ دعوت عمومی برای نجات اسناد جشنواره فجر

درخواست شاهسواری از اهالی سینما/ دعوت عمومی برای نجات اسناد جشنواره فجر

4 ساعت پیش

Home » بازی سوپر ماریو به بنچمارکی برای مقایسه عملکرد مدل‌های هوش مصنوعی تبدیل شد

بازی سوپر ماریو به بنچمارکی برای مقایسه عملکرد مدل‌های هوش مصنوعی تبدیل شد

زمان انتشار: 5 مارس 2025 ساعت 18:54

دسته بندی: علمی و فناوری

شناسه خبر: 868137

زمان مطالعه: 6 دقیقه

بازی سوپر ماریو به بنچمارکی برای مقایسه عملکرد مدل‌های هوش مصنوعی تبدیل شد

بازی سوپر ماریو به بنچمارکی برای مقایسه عملکرد مدل‌های هوش مصنوعی تبدیل شد

به گزارش خبرگزاری recive و براساس گزارش دیجیاتو، محققان گروه «Hao AI Lab» در دانشگاه کالیفرنیا سن دیگو، هوش مصنوعی را وارد دنیای بازی‌های کلاسیک کردند و مدل‌های هوش مصنوعی مطرح را در نسخه‌ای خاص از «Super Mario Bros» به چالش کشیدند. این نسخه از بازی که در شبیه‌ساز اجرا می‌شد، به کمک فریم‌ورک داخلی «GamingAgent» به هوش مصنوعی امکان کنترل مستقیم ماریو را می‌داد.

عملکرد ضعیف مدل‌های گوگل و OpenAI

در این رقابت بین هوش مصنوعی‌های شناخته‌شده، مدل Claude 3.7 از شرکت آنتروپیک بهترین عملکرد را داشت و پس از آن نسخه Claude 3.5 قرار گرفت. مدل‌های معروفی مانند جمینای ۱.۵ پرو از گوگل و GPT-4o از OpenAI نتوانستند چندان خوب عمل کنند.

نکته جالب اینکه مدل‌ها برای هدایت ماریو باید دستورات را به‌صورت کدهای پایتون تولید می‌کردند. GamingAgent به مدل‌ها اطلاعات اولیه‌ای مثل اینکه مانع یا دشمن نزدیک است، به چپ بپر و اسکرین‌شات‌هایی از محیط بازی ارائه می‌کرد. سپس مدل‌ها باید با تحلیل این داده‌ها، استراتژی‌هایی برای عبور از موانع، جمع‌آوری سکه‌ها و پیشرفت در مراحل طراحی می‌کردند.

رقابت مدل‌های هوش مصنوعی

یکی از نکات جالب عملکرد ضعیف‌تر مدل‌های مبتنی‌بر استدلال گام‌به‌گام مانند نسخه GPT-4o reasoning نسبت به مدل‌های معمولی بود. برخلاف انتظار، مدل‌های استدلالگر که در حل مسائل پیچیده‌تر و تفکر منطقی عملکرد بهتری دارند، در محیط‌های بلادرنگ (real-time)، مثل بازی سوپر ماریو، با مشکل مواجه شدند. علت اصلی این ضعف زمان‌بر بودن تصمیم‌گیری است که گاهی چند ثانیه طول می‌کشد و در بازی‌هایی مثل ماریو تفاوت پرش موفق یا سقوط را رقم می‌زند.

استفاده از بازی برای مقایسه عملکرد مدل‌های هوش مصنوعی

استفاده از بازی‌ها برای بنچمارک‌کردن هوش مصنوعی کار جدیدی نیست و از دهه‌ها پیش وجود داشته اما برخی کارشناسان معتقدند مقایسه عملکرد AI در بازی‌ها با پیشرفت واقعی در هوش مصنوعی عمومی گمراه‌کننده است. بازی‌ها نسبت به دنیای واقعی انتزاعی‌تر و ساده‌ترند و حجم داده‌های در دسترس برای تمرین نیز تقریباً بی‌نهایت است.

این آزمایش‌های نمایشی و رقابت‌های گیمینگ به بخشی از آن چیزی تبدیل شده‌اند که «آندری کارپاتی»، پژوهشگر ارشد و هم‌بنیان‌گذار OpenAI، آن را بحران ارزیابی توصیف می‌کند. کارپاتی در پستی در شبکه اجتماعی ایکس نوشت:«راستش را بخواهید، دیگر نمی‌دانم باید به کدام معیارها نگاه کنم. خلاصه اینکه اصلاً نمی‌دانم این مدل‌ها دقیقاً چقدر خوب‌اند.»

این آزمایش در شرایطی انجام شده که شرکت‌ها به‌دنبال روش‌های جدیدی برای ارزیابی هوش مصنوعی فراتر از معیارهای سنتی مثل MMLU یا BIG-bench هستند. بازی‌های بلادرنگ شاید معیار کاملی نباشند اما نشان می‌دهند مدل‌های زبانی هنوز در تلفیق سرعت تصمیم‌گیری و استدلال منطقی، چالش‌های اساسی دارند.

۲۲۷۲۲۷

حتما بخوانید : «شهر گمشده طلا» پیدا شد / عکس
اشتراک گذاری

اخبار مرتبط

  • بشقاب‌پرنده در قطب جنوب / اسناد محرمانه لو رفته چه می‌گوید؟
    بشقاب‌پرنده در قطب جنوب / اسناد محرمانه لو رفته چه می‌گوید؟
    Notice: Undefined variable: first_id in /var/www/recive.ir/wp-content/themes/news-wp/single.php on line 64
    5 ساعت پیش
  • بحران زوال عقل در ژاپن / ربات‌ها به داد انسان‌های سرگردان می‌رسند
    بحران زوال عقل در ژاپن / ربات‌ها به داد انسان‌های سرگردان می‌رسند
    Notice: Undefined variable: first_id in /var/www/recive.ir/wp-content/themes/news-wp/single.php on line 64
    5 ساعت پیش
  • محموله سری چین برای «اینترنت ملی» شلیک شد
    محموله سری چین برای «اینترنت ملی» شلیک شد
    Notice: Undefined variable: first_id in /var/www/recive.ir/wp-content/themes/news-wp/single.php on line 64
    5 ساعت پیش
  • شلیک «سایه مرگ» /سلاحی که هیچ پدافندی آن را نمی‌بیند!
    شلیک «سایه مرگ» /سلاحی که هیچ پدافندی آن را نمی‌بیند!
    Notice: Undefined variable: first_id in /var/www/recive.ir/wp-content/themes/news-wp/single.php on line 64
    5 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • آذربایجان شرقی 470
  • آذربایجان غربی 378
  • اجتماعی 10352
  • اخبار استانها 2901
  • اخبار بورس 604
  • اخبار تکنولوژی 1607
  • اخبار روز 5
  • اخبار ورزشی 25500
  • اردبیل 1337
  • اصفهان 1663
  • اقتصادی 10680
  • البرز 476
  • ایلام 503
  • بوشهر 6
  • بین الملل 10734
  • تبلیغات 34
  • تهران 969
  • چند رسانه ای 0
  • چهارمحال و بختیاری 1545
  • خراسان جنوبی 47
  • خراسان رضوی 1745
  • خراسان شمالی 49
  • خوزستان 2115
  • دسته‌بندی نشده 1
  • زنجان 781
  • سبک زندگی 135
  • سلامت 1149
  • سمنان 3526
  • سیاسی 12272
  • سیستان و بلوچستان 68
  • عکس 24
  • علمی و فناوری 6389
  • فارس 1126
  • فرهنگ و هنر 11389
  • قزوین 1591
  • قم 418
  • کاریکاتور 137
  • کردستان 1518
  • کرمان 2043
  • کرمانشاه 1497
  • کهگیلویه و بویراحمد 760
  • گلستان 548
  • گیلان 1579
  • لرستان 214
  • مازندران 314
  • مرکزی 36
  • موبایل 404
  • میزبانی و هاستینگ 28
  • هرمزگان 976
  • همدان 1503
  • یزد 716

جدیدترین مقالات

  • اصفهان در مسیر تبدیل شدن به پایتخت تئاتر ایران
    اصفهان در مسیر تبدیل شدن به پایتخت تئاتر ایران 6 ساعت پیش
  • مدارس و دانشگاه‌های ۸ شهر اصفهان سه شنبه و چهارشنبه تعطیل است/تداوم پایش واحدهای آلاینده
    مدارس و دانشگاه‌های ۸ شهر اصفهان سه شنبه و چهارشنبه تعطیل است/تداوم پایش واحدهای آلاینده 6 ساعت پیش
  • موافقت شورای شهر اصفهان با اخذ وام برای تأمین مالی پروژه‌های اتوبوسرانی و مترو
    موافقت شورای شهر اصفهان با اخذ وام برای تأمین مالی پروژه‌های اتوبوسرانی و مترو 6 ساعت پیش
  • عضو شورای شهر اصفهان: رسانه ها در موضوع آب به سکوت وادار شده‌اند/ نتیجه سکوت، متهم کردن اصفهانی‌هاست
    عضو شورای شهر اصفهان: رسانه ها در موضوع آب به سکوت وادار شده‌اند/ نتیجه سکوت، متهم کردن اصفهانی‌هاست 6 ساعت پیش
  • شهرداری اصفهان فکری به حال حفاظت از محور تاریخی «چهارباغ» کند
    شهرداری اصفهان فکری به حال حفاظت از محور تاریخی «چهارباغ» کند 6 ساعت پیش

لینکهای پیشنهادی

سرور مجازی |  هاست ویندوز | هاست لاراول | دانلود رایگان نرم افزار

میزبانی در هاست لینوکس فاماسرور