به گزارش تیکنا و به نقل از Wired، شرکت OpenAI یک مدل هوش مصنوعی جدید به نام OpenAI o1 معرفی کرده است که قابلیت استدلال و حل مسائل پیچیده را به صورت گامبهگام دارد. این مدل به جای تولید پاسخ فوری، با “فکر کردن با صدای بلند” یا استدلال در چند مرحله به پاسخ نهایی میرسد، مشابه روشی که انسانها از آن استفاده میکنند. OpenAI این مدل را به عنوان یک پارادایم جدید معرفی کرده که نسبت به مدلهای قبلی برای حل مسائل منطقی و پیچیده عملکرد بهتری دارد.
این مدل، که در داخل شرکت OpenAI با کد “Strawberry” شناخته میشود، به عنوان مکمل مدل GPT-4o توسعه یافته است، نه به عنوان جایگزین آن. در حالی که GPT-5 که در حال توسعه است، به میزان زیادی بزرگتر از GPT-4 خواهد بود، اما انتظار میرود که از فناوری استدلال جدید OpenAI o1 نیز بهرهمند شود. به طور کلی، OpenAI معتقد است که در آینده، ترکیبی از افزایش مقیاس و بهبود استدلال به پیشرفتهای هوش مصنوعی کمک خواهد کرد.
مدلهای زبان بزرگ (LLM) مانند GPT-4 معمولاً از شبکههای عصبی عظیم استفاده میکنند که با مقادیر زیادی دادههای متنی آموزش دیدهاند. با این حال، آنها اغلب در مسائل سادهای مانند ریاضیات ابتدایی که نیاز به استدلال دارند، دچار مشکل میشوند. OpenAI o1 از روش یادگیری تقویتی بهره میگیرد، که در آن مدل به ازای ارائه پاسخهای صحیح بازخورد مثبت و به ازای اشتباهات بازخورد منفی دریافت میکند. این روش به مدل کمک میکند تا استراتژیهای خود را برای رسیدن به پاسخهای درست بهبود بخشد. این تکنیک در گذشته به رایانهها کمک کرده بود تا بازیها را با مهارت فوقالعاده انجام دهند و وظایف پیچیدهای مانند طراحی تراشههای رایانهای را مدیریت کنند.
در یک نمایش عملی از مدل OpenAI o1 توسط مارک چن، معاون رئیس تحقیق در OpenAI، چندین مسئله پیچیده حل شد که مدل قبلی GPT-4o قادر به حل آنها نبود. یکی از این مسائل، یک معمای پیچیده ریاضی بود که در آن مدل جدید توانست به درستی به جواب برسد. در واقع، این مدل در یادگیری نحوه استدلال بهبود یافته و دیگر تنها به تقلید از الگوهای تفکر انسانی نمیپردازد.
OpenAI ادعا میکند که مدل o1 در مقایسه با GPT-4o در حوزههایی مانند ریاضیات، فیزیک، شیمی، زیستشناسی و کدنویسی بسیار بهتر عمل میکند. به عنوان مثال، در آزمون American Invitational Mathematics Examination (AIME)، GPT-4o تنها ۱۲ درصد از مسائل را حل کرد، در حالی که مدل o1 توانست ۸۳ درصد از مسائل را حل کند.
با این حال، مدل جدید کندتر از GPT-4o است و همیشه عملکرد بهتری ندارد. به عنوان مثال، برخلاف GPT-4o که توانایی جستجو در وب را دارد و همچنین قادر به پردازش تصاویر و صداهاست (چندرسانهای)، مدل o1 فاقد این قابلیتهاست.
بهبود قابلیتهای استدلال مدلهای زبان بزرگ مدتی است که یکی از موضوعات تحقیقاتی داغ بوده است و رقبای OpenAI نیز به دنبال مسیرهای مشابهی هستند. برای مثال، گوگل در پروژه AlphaProof از یادگیری تقویتی برای حل مسائل ریاضی دشوار استفاده کرده است. AlphaProof با استفاده از دادههای درست توانست مسائل ریاضی را حل کند، اما چالش کلیدی این است که همیشه پاسخهای درست برای تمام موقعیتها در دسترس نیست.
OpenAI با مدل جدید خود توانسته است سیستم استدلال عمومیتری ارائه دهد که میتواند در تمام حوزهها به طور نسبی عملکرد خوبی داشته باشد. نوح گودمن، استاد دانشگاه استنفورد، معتقد است که برای آموزش عمومیتر این مدلها، ممکن است نیاز به ترکیب دادههای دستساز و مدلهای زبان با پرسشهای دقیق داشته باشیم.
در نتیجه، معرفی OpenAI o1 به عنوان یک گام بزرگ در بهبود تواناییهای استدلال هوش مصنوعی دیده میشود. با این حال، هنوز راههای زیادی برای بهبود باقی است و ترکیب دو پارادایم مختلف، یعنی مقیاس بزرگ و استدلال گامبهگام، احتمالاً مسیری کلیدی برای پیشرفت آینده خواهد بود.