به گزارش تیکنا و به نقل از Nature محققان ابزاری مبتنی بر هوش مصنوعی ساختهاند که توانست در عرض چند ساعت ۴۰۰۰ ایدهی تحقیقاتی جدید ارائه دهد. یک تولیدکنندهی ایده که توسط هوش مصنوعی نیرو گرفته بود، ایدههای پژوهشی بیشتری نسبت به ۵۰ دانشمند که بهطور مستقل کار میکردند، مطرح کرد. این یافتهها طبق یک پیشچاپ که در ماه جاری در arXiv منتشر شده، به دست آمده است.
ایدههای تولیدشده توسط انسان و هوش مصنوعی توسط داورانی که از منشأ هر ایده اطلاع نداشتند، ارزیابی شدند. این داوران ایدههای تولید شده توسط هوش مصنوعی را به عنوان ایدههای جذابتر از ایدههای انسانی ارزیابی کردند، با این حال ایدههای هوش مصنوعی از نظر قابلیت اجرایی امتیاز کمتری کسب کردند.
اما دانشمندان به محدودیتهای این مطالعه که هنوز توسط همتایان بررسی نشده است، اشاره میکنند. این مطالعه فقط روی یک حوزهی تحقیقاتی متمرکز بود و از شرکتکنندگان انسانی خواسته شد تا بهسرعت ایدههایی را ارائه کنند، که احتمالاً مانع از آن شد که آنها بهترین ایدههای خود را ارائه دهند.
هوش مصنوعی در علم
تلاشهای گستردهای در حال انجام است تا بررسی شود که چگونه مدلهای زبانی بزرگ (LLM) میتوانند در انجام وظایف پژوهشی مانند نگارش مقالات، تولید کد و جستجوی ادبیات علمی مورد استفاده قرار گیرند. با این حال، ارزیابی اینکه آیا این ابزارهای هوش مصنوعی میتوانند زوایای جدیدی برای تحقیقات ارائه دهند، دشوار است. دلیل آن این است که ارزیابی ایدهها بسیار ذهنی است و نیاز به گردآوری پژوهشگرانی دارد که تخصص لازم برای ارزیابی دقیق این ایدهها را دارند.
این پروژهی یک ساله یکی از بزرگترین تلاشها برای ارزیابی این موضوع است که آیا مدلهای زبانی بزرگ میتوانند ایدههای پژوهشی نوآورانهتری نسبت به انسانها تولید کنند. این پروژه به رهبری Chenglei Si، دانشمند علوم کامپیوتر در دانشگاه استنفورد کالیفرنیا انجام شده است.
تیم تحقیقاتی بیش از ۱۰۰ پژوهشگر در حوزه پردازش زبان طبیعی را جذب کرد. ۴۹ نفر از آنها مأمور شدند تا بر اساس یکی از هفت موضوع تعیینشده، ایدههایی را در طول ۱۰ روز توسعه دهند و به نگارش درآورند. بهعنوان انگیزه، به هر شرکتکننده ۳۰۰ دلار برای هر ایده پرداخت شد و به پنج ایده برتر ۱۰۰۰ دلار پاداش تعلق گرفت.
در همین حال، پژوهشگران یک تولیدکنندهی ایدهی هوش مصنوعی با استفاده از Claude 3.5، یک مدل زبانی بزرگ توسعهیافته توسط Anthropic در سانفرانسیسکو، کالیفرنیا، ساختند. آنها از این ابزار هوش مصنوعی خواستند تا مقالاتی را که به هفت موضوع پژوهشی مرتبط هستند، با استفاده از موتور جستجوی مبتنی بر هوش مصنوعی Semantic Scholar بیابد. سپس این ابزار ۴۰۰۰ ایده برای هر موضوع پژوهشی تولید کرد و دستور داد تا نوآورانهترین ایدهها رتبهبندی شوند.
داوران انسانی
در مرحله بعد، ایدههای تولیدشده توسط انسان و هوش مصنوعی بهطور تصادفی به ۷۹ داور اختصاص داده شد. این داوران هر ایده را از نظر تازگی، جذابیت، قابلیت اجرا و اثربخشی پیشبینیشده ارزیابی کردند. برای اینکه داوران از منشأ ایدهها اطلاع نداشته باشند، پژوهشگران از یک مدل زبانی بزرگ دیگر استفاده کردند تا سبک نگارش و لحن هر دو نوع ایده را بدون تغییر در خود ایدهها یکسانسازی کنند.
بهطور میانگین، داوران ایدههای تولیدشده توسط هوش مصنوعی را بهعنوان ایدههای جدیدتر و هیجانانگیزتر از ایدههای انسانی ارزیابی کردند. با این حال، زمانی که تیم ۴۰۰۰ ایدهی تولیدشده توسط هوش مصنوعی را با دقت بیشتری بررسی کردند، دریافتند که تنها حدود ۲۰۰ ایده واقعاً منحصر به فرد بودند، که نشان میدهد با افزایش تولید ایدهها توسط هوش مصنوعی، نوآوری کمتری در آنها مشاهده میشود.
بر اساس نظرسنجی Si، اکثر شرکتکنندگان اعتراف کردند که ایدههای ارائهشده توسط آنها نسبت به ایدههایی که در گذشته تولید کردهاند، متوسط بودند.
این نتایج نشان میدهد که مدلهای زبانی بزرگ ممکن است بتوانند ایدههایی تولید کنند که کمی جدیدتر از ایدههای موجود در ادبیات علمی باشند. اما اینکه آیا آنها میتوانند ایدههای انسانی نوآورانهترین را شکست دهند، هنوز یک سوال باز است.
در کل به نظر میرسد در آینده ای نزدیک هوش مصنوعی قادر به تولید ایده های بهتر از تمامی شاخصه ها نسبت به انسان باشد و این اتفاق منجر به سرعت بخشیدن به پیشرفت در علم میشود. ممکن است تبعات این اتفاق به مرور زمان باعث شود راهبری برای مسائل حل نشده ی انسان در علم بوجود آید یا دنیا وارد مسائل جدیدی در این حوزه ها بشود.