به گزارش گروه فناوری پیشرفته تیکنا؛ به گفته متا مدلSeamlessM4T (که مخفف ترجمه ماشینی انبوه چند زبانه و چندوجهی است) می تواند گفتار به متن و متن به متن را برای نزدیک به ۱۰۰ زبان ترجمه کند. این مدل برای عملکردهای گفتار به گفتار و متن به گفتار، ۱۰۰ زبان ورودی را تشخیص داده و آنها را به ۳۵ زبان خروجی تبدیل می کند.
متا گفت: «ساخت یک مترجم زبان جهانی، چالش برانگیز است زیرا سیستم های گفتار به گفتار و گفتار به نوشتار موجود تنها بخش کوچکی از زبان های جهان را پوشش می دهند.»
این شرکت اعلام کرده که این مدل نشان دهنده پیشرفت قابل توجهی است زیرا این مدل جدید کل کار ترجمه را یکجا انجام می دهد، برخلاف سایر مدل های ترجمه بزرگ که ترجمه را در سیستم های مختلف تقسیم می کنند.
یکی از ویژگی های جالب این مدل، البته اگر بتواند به درستی کار کند، توانایی آن در زمانی است شخصی با دو یا چند زبان صحبت کند و آن ها را در هم آمیزد. به عنوان مثال، متا در یک ویدئو نشان داد که این مدل بلافاصله بین هندی، تلوگو و انگلیسی تفاوت قائل می شود.
این مدل بر اساس مدل های ترجمه قبلی از متا ساخته شده است. این شرکت سال گذشته، مدل ترجمه ماشینی متن به متن خود را که از ۲۰۰ زبان پشتیبانی می کرد معرفی کرد.
متا گفت در حین توسعه SeamlessM4T، سیستمی ساخته است که کلمات حساس ونامناسب را شناسایی می کند. متا کلمات نامناسب را به عنوان مواردی تعریف می کند که ترجمه ممکن است باعث ایجاد نفرت، خشونت، ناسزا یا سوء استفاده شود.
محققان همچنین سعی کردند مجموعه داده هایی را که برخی از ناسزاها را اشتباه ترجمه می کنند، پاکسازی کنند.
متا ادعا می کند که سوگیری جنسیتی را در زبان ها نیز تشخیص می دهد و گفت این مدل می تواند تعصب جنسیتی را در ترجمه ها محدود کند.
این شرکت بسیاری از مدل های هوش مصنوعی خود را به صورت کم و بیش منبع باز برای توسعه دهندگان و محققان منتشر کرده است. اخیراً آدیوکرفت را منتشر کرده است، کدی که امکان تولید متن به صدا را فراهم می کند. متا همچنین دسترسی به مدل زبان بزرگ خود ال لاما۲ را فراهم کرده است.
انتهای پیام/