به گزارش تیکنا و به نقل از انگجت، این مخزن داده که توسط یک شرکت غیرانتفاعی به نام EleutherAI ابداع شده، حاوی متن ویدئوهای بیش از ۴۸ هزار کانال یوتیوب است که اپل، انویدیا، آنتروپیک و شرکت های دیگر از آن استفاده کرده اند.
یافته های تحقیق «پروف نیوز»(Proof news) یک واقعیت ناراحت کننده از هوش مصنوعی را نشان می دهد؛ این فناوری به طور کلی براساس دادهای کاربران بدون رضایت یا پرداخت مبلغی به آنها ساخته شده است.
مخزن داده مذکور حاوی هیچ گونه ویدئو یا تصاویری از یوتیوب نیست اما رونویسی از ویدئوهای بزرگترین خالقان محتوای این پلتفرم و همچنین ناشران اخبار بزرگ مانند نیویورک تایمز، بی بی سی و ای بی سی نیوز را در بر دارد.
یکی از این خالقان محتوا مارکوس برانلی در پلتفرم ایکس نوشت: اپل داده های مربوط به هوش مصنوعی خود را از چند شرکت جمع آوری کرده است. یکی از شرکت ها انبوهی از متون رونویسی شده از ویدئوهای یوتیوب از جمله محتوای من را استخراج کرده است.
سخنگوی گوگل نیز اظهارات پیشین نیل موهان مدیر ارشد اجرایی یوتیوب مبنی بر آنکه استفاده شرکت ها از داده های این پلتفرم برای آموزش مدل های هوش مصنوعی ناقض قوانین است را تکرار کرد. اپل، انویدیا و آنتروپیک به درخواست ها برای اظهار نظر پاسخی نداده است.