هوش مصنوعی جدید اول فکر میکند بعد پاسخ میدهد !
هوش مصنوعی جدید اول فکر میکند بعد پاسخ میدهد !
شرکت Open Ai در حال ساخت هوش مصنوعی جدیدی که میتواند استدلال کند، بر خلاف مدل های قبلی این هوش مصنوعی کاملا مانند انسان قدرت استدلال دارد و به خوبی قادر به حل سوالات ریاضی سخت خواهد بود.

به گزارش تیکنا و به نقل از Wired، شرکت OpenAI یک مدل هوش مصنوعی جدید به نام OpenAI o1 معرفی کرده است که قابلیت استدلال و حل مسائل پیچیده را به صورت گام‌به‌گام دارد. این مدل به جای تولید پاسخ فوری، با “فکر کردن با صدای بلند” یا استدلال در چند مرحله به پاسخ نهایی می‌رسد، مشابه روشی که انسان‌ها از آن استفاده می‌کنند. OpenAI این مدل را به عنوان یک پارادایم جدید معرفی کرده که نسبت به مدل‌های قبلی برای حل مسائل منطقی و پیچیده عملکرد بهتری دارد.

این مدل، که در داخل شرکت OpenAI با کد “Strawberry” شناخته می‌شود، به عنوان مکمل مدل GPT-4o توسعه یافته است، نه به عنوان جایگزین آن. در حالی که GPT-5 که در حال توسعه است، به میزان زیادی بزرگ‌تر از GPT-4 خواهد بود، اما انتظار می‌رود که از فناوری استدلال جدید OpenAI o1 نیز بهره‌مند شود. به طور کلی، OpenAI معتقد است که در آینده، ترکیبی از افزایش مقیاس و بهبود استدلال به پیشرفت‌های هوش مصنوعی کمک خواهد کرد.

مدل‌های زبان بزرگ (LLM) مانند GPT-4 معمولاً از شبکه‌های عصبی عظیم استفاده می‌کنند که با مقادیر زیادی داده‌های متنی آموزش دیده‌اند. با این حال، آن‌ها اغلب در مسائل ساده‌ای مانند ریاضیات ابتدایی که نیاز به استدلال دارند، دچار مشکل می‌شوند. OpenAI o1 از روش یادگیری تقویتی بهره می‌گیرد، که در آن مدل به ازای ارائه پاسخ‌های صحیح بازخورد مثبت و به ازای اشتباهات بازخورد منفی دریافت می‌کند. این روش به مدل کمک می‌کند تا استراتژی‌های خود را برای رسیدن به پاسخ‌های درست بهبود بخشد. این تکنیک در گذشته به رایانه‌ها کمک کرده بود تا بازی‌ها را با مهارت فوق‌العاده انجام دهند و وظایف پیچیده‌ای مانند طراحی تراشه‌های رایانه‌ای را مدیریت کنند.

در یک نمایش عملی از مدل OpenAI o1 توسط مارک چن، معاون رئیس تحقیق در OpenAI، چندین مسئله پیچیده حل شد که مدل قبلی GPT-4o قادر به حل آن‌ها نبود. یکی از این مسائل، یک معمای پیچیده ریاضی بود که در آن مدل جدید توانست به درستی به جواب برسد. در واقع، این مدل در یادگیری نحوه استدلال بهبود یافته و دیگر تنها به تقلید از الگوهای تفکر انسانی نمی‌پردازد.

OpenAI ادعا می‌کند که مدل o1 در مقایسه با GPT-4o در حوزه‌هایی مانند ریاضیات، فیزیک، شیمی، زیست‌شناسی و کدنویسی بسیار بهتر عمل می‌کند. به عنوان مثال، در آزمون American Invitational Mathematics Examination (AIME)، GPT-4o تنها ۱۲ درصد از مسائل را حل کرد، در حالی که مدل o1 توانست ۸۳ درصد از مسائل را حل کند.

با این حال، مدل جدید کندتر از GPT-4o است و همیشه عملکرد بهتری ندارد. به عنوان مثال، برخلاف GPT-4o که توانایی جستجو در وب را دارد و همچنین قادر به پردازش تصاویر و صداهاست (چندرسانه‌ای)، مدل o1 فاقد این قابلیت‌هاست.

بهبود قابلیت‌های استدلال مدل‌های زبان بزرگ مدتی است که یکی از موضوعات تحقیقاتی داغ بوده است و رقبای OpenAI نیز به دنبال مسیرهای مشابهی هستند. برای مثال، گوگل در پروژه AlphaProof از یادگیری تقویتی برای حل مسائل ریاضی دشوار استفاده کرده است. AlphaProof با استفاده از داده‌های درست توانست مسائل ریاضی را حل کند، اما چالش کلیدی این است که همیشه پاسخ‌های درست برای تمام موقعیت‌ها در دسترس نیست.

OpenAI با مدل جدید خود توانسته است سیستم استدلال عمومی‌تری ارائه دهد که می‌تواند در تمام حوزه‌ها به طور نسبی عملکرد خوبی داشته باشد. نوح گودمن، استاد دانشگاه استنفورد، معتقد است که برای آموزش عمومی‌تر این مدل‌ها، ممکن است نیاز به ترکیب داده‌های دست‌ساز و مدل‌های زبان با پرسش‌های دقیق داشته باشیم.

در نتیجه، معرفی OpenAI o1 به عنوان یک گام بزرگ در بهبود توانایی‌های استدلال هوش مصنوعی دیده می‌شود. با این حال، هنوز راه‌های زیادی برای بهبود باقی است و ترکیب دو پارادایم مختلف، یعنی مقیاس بزرگ و استدلال گام‌به‌گام، احتمالاً مسیری کلیدی برای پیشرفت آینده خواهد بود.