خانه

خبر خوب برای xAI؛ آیا Grok بالاخره در پاسخ به سوالات Baldur’s Gate از ChatGPT جلو زد؟

آیلین سرهنگی

02 اسفند 1404

دنیای مدل‌های هوش مصنوعی فقط درباره چت‌بات‌های عمومی و کاربردهای سازمانی نیست؛ گاهی رقابت سر چیزی است که شاید در نگاه اول عجیب به نظر برسد: راهنمای بازی‌های ویدیویی!

طبق گزارشی جدید، شرکت xAI که توسط Elon Musk تأسیس شده و اخیراً توسط SpaceX خریداری شده، تمرکز ویژه‌ای روی بهبود پاسخ‌های چت‌بات خود، یعنی Grok درباره بازی معروف Baldur’s Gate 3 داشته است.

ماجرای تأخیر در انتشار مدل به خاطر یک بازی

طبق گزارش منتشرشده، سال گذشته عرضه یکی از نسخه‌های مدل Grok چند روز به تأخیر افتاد. دلیلش چه بود؟ نارضایتی ایلان ماسک از کیفیت پاسخ‌های چت‌بات درباره جزئیات Baldur’s Gate.

گفته می‌شود حتی مهندسان ارشد از پروژه‌های مهم دیگر کنار کشیده شدند تا پاسخ‌های مربوط به این بازی را بهبود دهند. برای بعضی از مهندسانی که انتظار داشتند روی مسائل بنیادی هوش مصنوعی کار کنند، این موضوع احتمالاً کمی عجیب بوده است.

اما سؤال مهم‌تر اینجاست: آیا این تلاش نتیجه داد؟

مقایسه Grok با ChatGPT، Claude و Gemini

برای بررسی عملکرد Grok، مجموعه‌ای از سوالات عمومی درباره Baldur’s Gate طراحی شد و پاسخ‌های آن با سه مدل بزرگ دیگر مقایسه شد:

ChatGPT
Claude
Gemini

این مقایسه غیررسمی که به شوخی «BaldurBench» نام گرفته، نشان داد Grok واقعاً عملکرد قابل قبولی دارد. پاسخ‌هایش دقیق و کاربردی بودند، هرچند پر از اصطلاحات تخصصی گیمرها مثل DPS یا save-scumming.

از نظر سبک پاسخ‌دهی هم تفاوت‌ها جالب بود:

ChatGPT بیشتر سراغ بولت‌پوینت و پاسخ‌های خلاصه می‌رود.
Gemini علاقه زیادی به بولد کردن کلمات کلیدی دارد.
Claude محتاط‌تر است و حتی نگران اسپویل شدن داستان بازی برای کاربر بود!

Grok هم عاشق جدول و تحلیل‌های تئوریک است؛ دقیقاً همان چیزی که از یک مدل مورد علاقه ایلان ماسک انتظار می‌رود.

چرا این موضوع مهم است؟

شاید در نگاه اول، تمرکز روی پاسخ‌های مربوط به یک بازی ویدیویی موضوعی حاشیه‌ای به نظر برسد. اما از منظر فنی، این مسئله نشان می‌دهد که مدل‌های زبانی بزرگ چگونه در حوزه‌های تخصصی بهینه‌سازی می‌شوند.

وقتی یک شرکت تصمیم می‌گیرد در یک دامنه خاص به «برابری عملکرد» با رقبا برسد، معمولاً یعنی آن حوزه برایش اهمیت استراتژیک دارد. در این مورد، گزارش‌ها نشان می‌دهد xAI مشخصاً روی این بخش کار کرده تا Grok از رقبا عقب نماند.

نتیجه؟ Grok حالا تقریباً هم‌سطح مدل‌های مطرح دیگر در پاسخ به سوالات مربوط به Baldur’s Gate عمل می‌کند.

رقابت مدل‌های هوش مصنوعی وارد فاز جدیدی شده

قبلاً رقابت بین مدل‌ها بیشتر حول توانایی‌های عمومی، کدنویسی یا تولید محتوا بود. حالا اما شاهد رقابت در حوزه‌های خاص و حتی سرگرمی هستیم.

این یعنی:

مدل‌ها به سمت تخصصی‌تر شدن حرکت می‌کنند
معیارهای ارزیابی غیررسمی هم اهمیت پیدا کرده‌اند
رقابت بین OpenAI، Anthropic، گوگل و xAI وارد جزئی‌ترین لایه‌ها شده است

در نهایت، شاید این رقابت از یک بازی شروع شده باشد، اما پیامش روشن است: هر حوزه‌ای که کاربران برایش اهمیت قائل باشند، می‌تواند به میدان جدی رقابت مدل‌های هوش مصنوعی تبدیل شود.

#هوش_مصنوعی #ایلان_ماسک #بازی_ویدیویی #مدل_زبانی

#BaldursGate

#AI #xAI #Grok #ElonMusk #ChatGPT #Claude #Gemini #BaldursGate3

آیلین سرهنگی

متخصص حوزه فناوری با تمرکز بر هوش مصنوعی، یادگیری ماشین و زیرساخت‌های نرم‌افزاری، در تیم فنی یک شرکت فعال در زمینه فناوری‌های نوین فعالیت می‌کنم و تلاش دارم تا با تولید محتوای دقیق، کاربردی و به‌روز، مفاهیم پیچیده‌ی تکنولوژی را به زبان ساده برای همه ارائه کنم.