شرط‌بندی بزرگ سیلیکون‌ولی روی «محیط‌های شبیه‌سازی»؛ آیا این همون چیزی هست که عامل‌های هوش مصنوعی رو متحول می‌کنه؟

آیلین سرهنگی
31 شهریور 1404
47
0

سال‌هاست غول‌های تکنولوژی وعده‌ی عامل‌های هوش مصنوعی (AI Agents) رو می‌دن؛ ربات‌هایی که خودشون کارها رو انجام بدن. اما اگه همین امروز سراغ ChatGPT Agent یا مرورگر Comet پرپلکسی برید، می‌بینید هنوز با اون رویای کامل فاصله زیادی داریم.

حالا راه‌حلی که همه روش تمرکز کردن، چیزی به اسم محیط‌های تقویتی (RL Environments) ـه؛ شبیه‌سازی‌هایی که درست مثل یه زمین بازی، به AI اجازه می‌دن کارهای چندمرحله‌ای رو تمرین کنه.


محیط RL دقیقاً چیه؟

تصورش کن شبیه یه «بازی ویدیویی خسته‌کننده» باشه! مثلاً محیطی که یه مرورگر کروم شبیه‌سازی می‌کنه و از AI می‌خواد از آمازون جوراب بخره.

AI باید توی منوها بچرخه، محصول درست رو انتخاب کنه و خرید رو تکمیل کنه. اگه درست پیش بره، پاداش می‌گیره. اگه اشتباه کنه، محیط باید اون خطا رو تشخیص بده و بازخورد بده. همین باعث می‌شه طراحی این محیط‌ها خیلی پیچیده‌تر از دیتاست‌های معمولی باشه.


چرا همه استارتاپ‌ها دنبالشن؟
  1. شرکت‌های بزرگ مثل OpenAI، گوگل و Anthropic دارن میلیاردها دلار روی این حوزه خرج می‌کنن.
  2. استارتاپ‌هایی مثل Mechanize و Prime Intellect وارد بازی شدن و حتی حقوق‌های نیم میلیون دلاری برای مهندس‌ها در نظر گرفتن!
  3. غول‌های دیتالیبلینگ مثل Scale AI، Surge و Mercor هم دارن خودشون رو با این موج هماهنگ می‌کنن.

سرمایه‌گذارا امیدوارن یکی از این شرکت‌ها تبدیل به «Scale AI برای محیط‌ها» بشه؛ یعنی بازیگر اول این حوزه.


پتانسیل و چالش‌ها

مزایا:

  1. به جای اینکه AI فقط جواب متنی بده، می‌تونه توی شبیه‌سازی‌ها ابزارها رو استفاده کنه، وب‌گردی کنه و نرم‌افزارها رو کنترل کنه.
  2. مسیر پیشرفت مدل‌ها رو بعد از افت بازده دیتاست‌های سنتی دوباره باز می‌کنه.

چالش‌ها:

  1. محیط‌ها خیلی پرهزینه و پیچیده‌ان.
  2. مشکل Reward Hacking وجود داره؛ جایی که AI به جای انجام درست کار، راه تقلبی برای گرفتن پاداش پیدا می‌کنه.
  3. حتی اندری کارپاتی (سرمایه‌گذار Prime Intellect و محقق سابق تسلا/اوپن‌اِی‌آی) هم گفته: «به محیط‌ها خوش‌بینم، ولی به RL به طور کلی بدبین.»


به نظر میاد نبرد بعدی AI دیگه سر مدل‌های زبانی خالص نیست، بلکه سر اینه که چه کسی بتونه بهترین محیط‌های شبیه‌سازی رو بسازه. سیلیکون‌ولی این بار روی چیزی شرط بسته که شاید بتونه نسل بعدی عامل‌های هوشمند رو از حرف به عمل برسونه.




#AI #RL #ReinforcementLearning #AIagents #ScaleAI #Anthropic #OpenAI #SiliconValley


#هوش_مصنوعی #عامل_هوشمند #یادگیری_تقویتی #سیلیکون_ولی #تکنولوژی

آیلین سرهنگی

آیلین سرهنگی

متخصص حوزه فناوری با تمرکز بر هوش مصنوعی، یادگیری ماشین و زیرساخت‌های نرم‌افزاری، در تیم فنی یک شرکت فعال در زمینه فناوری‌های نوین فعالیت می‌کنم و تلاش دارم تا با تولید محتوای دقیق، کاربردی و به‌روز، مفاهیم پیچیده‌ی تکنولوژی را به زبان ساده برای همه ارائه کنم.
پیشنهاد میشود بخوانید
هزینه اجرای مدل‌های هوش مصنوعی چرا ناگهان انفجاری شد؟ نقش پنهان DRAM و بازی جدید حافظه در AI
29 بهمن 1404
0
0
هزینه اجرای مدل‌های هوش مصنوعی چرا ناگهان انفجاری شد؟ نقش پنهان DRAM و بازی جدید حافظه در AI
آیلین سرهنگی
وقتی صحبت از هزینه‌های زیرساخت هوش مصنوعی می‌شود، همه ذهن‌ها سریع می‌رود سمت GPU و نام‌هایی مثل انویدیا. اما واقعیت این ...

هوش مصنوعی

مهندسان سابق SpaceX با جذب ۵۰ میلیون دلار، بازار دیتاسنترهای AI را هدف گرفتند؛ Mesh Optical چه برنامه‌ای دارد؟
29 بهمن 1404
0
0
مهندسان سابق SpaceX با جذب ۵۰ میلیون دلار، بازار دیتاسنترهای AI را هدف گرفتند؛ Mesh Optical چه برنامه‌ای دارد؟
آیلین سرهنگی
سه مهندس سابق SpaceX که روی لینک‌های ارتباط نوری ماهواره‌های Starlink کار می‌کردند، حالا با یک استارتاپ جدید وارد میدان ...

هوش مصنوعی

خرید Koyeb توسط Mistral AI؛ شروع جاه‌طلبی بزرگ برای ساخت ابر هوش مصنوعی اروپایی؟
29 بهمن 1404
0
0
خرید Koyeb توسط Mistral AI؛ شروع جاه‌طلبی بزرگ برای ساخت ابر هوش مصنوعی اروپایی؟
آیلین سرهنگی
در حالی که رقابت جهانی در حوزه زیرساخت هوش مصنوعی داغ‌تر از همیشه شده، شرکت فرانسوی Mistral AI اولین خرید رسمی خود را ان...

هوش مصنوعی

سه گجت پوشیدنی هوش مصنوعی اپل در راه است؛ عینک AI، ایرپاد هوشمند و پین مرموز چه زمانی عرضه می‌شوند؟
29 بهمن 1404
0
0
سه گجت پوشیدنی هوش مصنوعی اپل در راه است؛ عینک AI، ایرپاد هوشمند و پین مرموز چه زمانی عرضه می‌شوند؟
آیلین سرهنگی
به نظر می‌رسد Apple نمی‌خواهد از موج گجت‌های پوشیدنی مبتنی بر هوش مصنوعی عقب بماند. طبق گزارش‌های جدید، این شرکت در حال ...

هوش مصنوعی

یک پیام بگذارید
نام و نام خانوادگی
آدرس ایمیل
متن نظر

به کمک نیاز دارید؟ با ما تماس بگیرید

کرج عظیمیه طالقانی شمالی کوچه شهید مسعود شجاعی (رز) برج قائم 2 واحد 1

02632558409

09124287589

afrino.co@gmail.com

ما را دنبال کنید
logo-samandehi

تمامی حقوق این سایت محفوظ و متعلق به شرکت "توسعه دانش رایا آفرینش" است.

An error has occurred. This application may no longer respond until reloaded. Reload 🗙