چاپ

سیاست و بازاریابی - زومیت / مایکروسافت با همکاری انویدیا، مدل زبانی قدرتمندی با 105 لایه‌ و 530 میلیارد پارامتر ایجاد کرده؛ این مدل زبانی مجهز به 280 پردازنده گرافیکی A100 انویدیا است.
انویدیا و مایکروسافت 20 مهر 1400 ادعا می‌کنند که بزرگ‌ترین و قدرتمند‌ترین مدل زبانی یکپارچه موجود را با عنوان مدل تولید زبان طبیعی مگاترون تورینگ (Megatron-Turing Natural Language Generation) ایجاد کرده‌اند.
مدل زبانی، مدلی برای تمایز بین کلمات و عباراتی است که در گفتار ممکن است مشابه به نظر برسند؛ به‌عنوان مثال، در انگلیسی عبارات «recognize speech» و «wreck a nice beach» تقریبا شبیه به هم تلفظ می‌شوند؛ اما معانی مختلفی دارند.
از مدل‌های زبانی در تشخیص گفتار، ترجمه‌های ماشینی، تجزیه و تحلیل دستورهای گفتاری برای دستگاه‌های هوشمند، تشخیص دست خط، بازیابی اطلاعات و سایر برنامه‌ها استفاده می‌شود.
مدل‌های زبانی با استفاده از هوش مصنوعی به تشخیص ابهامات گفتاری مانند مثال بالا کمک خواهند کرد.
به گزارش ZDnet، مدل زبانی مگاترون تورینگ، 105 لایه و 530 میلیارد پارامتر دارد و روی سخت‌افزار ابررایانه‌ای مانند سلین (Selene) اجرا می‌شود.

سیاست و بازاریابی

برای اینکه درک بهتری از قدرت این مدل زبانی داشته باشیم، می‌توان آن را با مدل زبانی GPT-3 مقایسه کرد. GPT-3 مدل زبانی خود‌همبسته‌ای است که از یادگیری عمیق برای تولید محتوای متنی شبیه به انسان استفاده می‌کند؛ این مدل 175 میلیارد پارامتر دارد.
مایکروسافت و انویدیا مشخصات این مدل زبانی را این‌گونه توضیح داده‌اند:
هر ماکت این مدل زبانی مجهز به 280 پردازنده گرافیکی A100 انویدیا است که هر گره، برش خاص 8 سویه دارد و در کل گره‌ها 35 مسیر موازی پردازش دیده شده است.
این مدل زبانی روی 15 مجموعه داده با 339 میلیارد توکن آموزش دیده و قادر است توضیح بدهد که چرا هرچه مدل‌ بزرگ‌تر باشد برای عملکرد بهتر آموزش کمتری نیاز خواهد داشت.
اما مدل مگاترون تورینگ مانند همه مدل‌های زبانی، در به‌کارگیری هوش مصنوعی با خطاهای سیستماتیکی همراه است.
مایکروسافت و انویدیا درباره مشکلات مدل‌های زبانی گفتند:
مدل‌های قدرتمند زبانی هر روز بیشتر از قبل پیشرفت می‌کنند؛ اما هنوز برخی از خطاهای سیستماتیک وجود دارد. طبق مشاهدات ما، کلیشه‌های زبانی باعث ایجاد این خطاها در هوش مصنوعی به‌کاررفته در مدل زبانی مگاترون تورینگ می‌شوند و ما خود را متعهد می‌دانیم تا راه حلی برای این مشکل ارائه کنیم.
مایکروسافت در سال 2016 (1395) با استفاده از فناوری یادگیری ماشین، فعالیت باتی به نام Tay را در توییتر آغاز کرد تا تعامل آن را با انسان‌ها آزمایش کند؛ اما این بات در کمتر از 24 ساعت، ادبیاتش تغییر و توییت‌هایی نژادپرستانه‌ای منتشر کرد.
شما تابه‌حال چه مشکلاتی با مدل‌های زبانی به‌کاررفته در دستیارهای صوتی اطراف خود مشاهده کرده‌اید؟