انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است نکات خواندني

بزرگنمايي:

سیاست و بازاریابی - دیجیاتو / این مدل جدید باوجود اندازه کوچک‌تر عملکردی بهتر از DeepSeek R1 دارد.
متا همچنان درگیر پاسخ به پرسش‌ها و انتقادات درباره خانواده مدل‌های جدید Llama 4 است اما شرکت انویدیا با معرفی مدل زبان بزرگ (LLM) متن‌باز و قدرتمند، توجه‌ها را به خود جلب کرده است. این مدل که Llama-3.1 Nemotron Ultra نام دارد، بر پایه نسخه قبلی مدل‌های Llama-3.1-405B-Instruct متا توسعه یافته و به گفته انویدیا، عملکردی نزدیک به برترین مدل‌های موجود دارد.
مدل Llama-3.1-Nemotron-Ultra-253B-v1 با 253 میلیارد پارامتر برای وظایفی مانند استدلال پیشرفته، پیروی از دستورات و ایفای نقش دستیار هوش مصنوعی طراحی شده است.
این مدل نخستین‌ بار مارس در کنفرانس سالانه GTC انویدیا معرفی شده بود و اکنون کامل و متن‌باز در پلتفرم Hugging Face در دسترس قرار گرفته است. کد مدل، وزن‌ها و داده‌های پس از آموزش آن نیز عمومی منتشر شده‌اند.

سیاست و بازاریابی

بازار

مدل جدید انویدیا با استفاده از فرایند جستجوی معماری عصبی (NAS) توسعه یافته که در آن نوآوری‌هایی مانند حذف لایه‌های توجه، شبکه‌های Fused feedforward و فشرده‌سازی متغیر در ساختار مدل اعمال شده‌اند. این معماری به گونه‌ای طراحی شده که مدل با کاهش مصرف حافظه و منابع محاسباتی، همچنان کیفیت خروجی بالایی ارائه دهد و بتوان آن را فقط با 8 کارت گرافیک H100 اجرا کرد.
علاوه‌بر H100، این مدل با معماری‌های پیشرفته‌تر انویدیا مانند B100 و Hopper نیز سازگار بوده و در حالت‌های دقت BF16 و FP8 عملکرد مطلوبی دارد.
انویدیا برای ارتقای توانایی‌های مدل از فرایند پس‌آموزش چندمرحله‌ای بهره برده که شامل آموزش نظارت‌شده در حوزه‌هایی مانند ریاضی، تولید کد، چت و استفاده از ابزارها بوده است. همچنین برای بهبود عملکرد در دنبال‌کردن دستورات و توانایی استدلال، از الگوریتم GRPO (بهینه‌سازی نسبی سیاست گروهی) استفاده شده است.
عملکرد مدل جدید انویدیا در برابر رقبا

مدل جدید انویدیا در آزمون‌های معتبر مختلف عملکرد خیره‌کننده‌ای داسته است. برای مثال، در آزمون MATH500، عملکرد مدل از 80.40 درصد در حالت عادی به 97 درصد در حالت استدلال افزایش یافته است. همچنین در آزمون AIME25، امتیاز آن از 16.67 درصد به 72.50 درصد و در LiveCodeBench از 29.03 درصد به 66.31 درصد رسیده است.
این مدل در پاسخ به پرسش‌های عمومی (GPQA) در حالت استدلال فعال به امتیاز 76.01 درصد دست یافته که از DeepSeek R1 (با امتیاز 71.5 درصد) پیشی گرفته است. همچنین در آزمون IFEval برای پیروی از دستورات، امتیاز 89.45 درصد در برابر 83.3 درصد رقیب ثبت شده و در LiveCodeBench نیز اندکی بهتر عمل کرده است.
البته باید توجه کرد که مدل DeepSeek R1 در برخی آزمون‌های ریاضی سنگین همچنان بهتر عمل می‌کند، ازجمله در AIME25 با امتیاز 79.8 درصد برابر 72.50 درصد مدل انویدیا.
این مدل از زبان‌های متعددی ازجمله انگلیسی، آلمانی، فرانسوی، ایتالیایی، پرتغالی، هندی، اسپانیایی و تایلندی پشتیبانی می‌کند و برای کاربردهایی مانند چت‌بات، ساخت عامل‌های هوش مصنوعی، تولید کد و تولید با روش بازیابی-افزوده (RAG) قابل‌استفاده است.

چهارشنبه ۲۰ فروردين ۱۴۰۴ - ۲۰:۳۱:۴۶
۴۵ بازديد
سیاست و بازاریابی

https://www.siasatvabazaryabi.ir/Fa/News/773371/

گوشی‌های گوگل به قابلیتی کاربردی مجهز می‌شوند؛ رونمایی Pixel VIP

کدام گوشی برای پابجی موبایل خوب است؟ 20 گزینه‌ برای پابجی‌بازها

سیستم جادوی بازی The Blood of Dawnwalker درون‌مایه واقع‌گرایانه خواهد داشت

بازی مسابقه‌ای Forza برمی‌گردد، اما نه خیلی زود

آخرين مطالب

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است نکات خواندني

نظرات شما

ساير مطالب

مدل ارزان‌تر مک‌بوک ایر M4 اپل عرضه شد

تلاش برای افزایش فروش؛ گلکسی A56 سرانجام وارد بازار آمریکا می‌شود

چه می‌شود اگر بیگ بنگ آغاز جهان نبوده باشد؟

پنگوئن‌های امپراتور سریع‌تر از حد تصور در مسیر انقراض پیش می‌روند

میان‌رده مجهزبه هوش مصنوعی؛ گوشی جدید سامسونگ به‌زودی معرفی می‌شود

مشخصات پردازنده و رم ردمی K80 اولترا لو رفت؛ همان‌ چیزی که انتظار داشتیم

یک رایانه بدون سیلیکون ساخته شد

از وعده تا واقعیت؛ آیا ترامپ می‌تواند رویای مریخی خود را محقق کند؟

تحول در کنترل آنتی‌بیوتیک‌ها با استفاده از نور

این دستگاه برداشت آب بدون برق یا فیلتر کار می‌کند

4 دلیل که چرا نتایج بنچمارک‌های CPU آنقدر که فکر می‌کنید، مهم نیستند

چشم مایکروسافت به جیب گیمرها؛ ایکس‌باکس گیم‌پس باردیگر گران می‌شود

عملکرد بهتر Elden Ring Nightreign نسبت به Shadow of the Erdtree در استیم

تصاویر و اطلاعات جدیدی از پوکو F7 لو رفت!

عملکرد قابل توجه یک واکسن در از بین بردن سرطان لوزالمعده

اگر تلخی را تلخ‌تر حس می‌کنید، در معرض این بیماری‌ها هستید!

فروش Devil May Cry 5 از مرز 10 میلیون نسخه گذشت

عکس یک عکاس نجومی از مرداب کیهانی

مراسم تشییع و خاکسپاری شهدای والامقام خرم‌آباد فردا برگزار می‌شود

مسئولین ادارات در جهت حل مشکلات جامعه ایثارگری اهتمام داشته باشند

بیش از 63٪ از بازیکنان Stellar Blade از کشور چین هستند

شهاب‌سنگ‌ها و دنباله ماهواره‌ها بر فراز رود لیمای

موکب شهدای سادات در راهپیمایی عید سعید غدیر خم برگزار شد

چگونه از قابلیت های هوش مصنوعی جمینای گوگل در گوشی استفاده کنیم؟

سونی همچنان به توسعه بازی‌های آنلاین ادامه می‌دهد

بازنگری در فرضیه پخت‌وپز؛ هدف واقعی انسان‌های اولیه از به‌کارگیری آتش چه بود؟

شاید کلید درمان سرطان در فضا پنهان شده باشد!

تبلت گیمینگ جدید شیائومی با تراشه قدرتمند مدیاتک رؤیت شد

وفاداران پنهان به نظم؛ چرا برخی افراد در هر صورت همواره تابع قانون هستند؟

پلی‌ استیشن به موفقیت نینتندو سوییچ 2 واکنش نشان داد

تنها نسخه Playstation بازی‌های آینده ایکس‌ باکس به‌ صورت فیزیکی عرضه می‌شود

پردازنده کوانتومی چینی Zuchongzhi 3.0 معرفی شد؛ هزار تریلیون بار سریع‌تر از ابررایانه‌های امروزی

چه تیپ‌های شخصیتی بیشتر به دنبال اینفلوئنسر شدن هستند؟

شهادت فرزند برومند شهرستان دشتی استان بوشهر در حمله متجاوزانه صهیونیست به خاک ایران

بازی Firebreak بر روی پلی‌استیشن 5 پرو با وضوح 4K اجرا خواهد شد

این 2 گوشی ارزشمند و ارزان، برای کارهای روزمره مناسب‌اند

فراهم شدن امکان گفتگوی لحظه‌ای برای مردی فلج با یک فناوری جدید

دندان‌های ما از زره بدن ماهیانی تکامل یافته‌اند که 465 میلیون سال پیش زندگی می‌کردند

مشخصات تراشه تبلت جدید سامسونگ لو رفت

دانشمندان روس جزیره‌ای جدید را در دریای خزر کشف کرده‌اند

خانه‌سازی در میان برف؛ بازی سرگرم‌کننده Winter Burrow رایگان شد

میان‌رده جدید سامسونگ با پردازنده 2 سال پیش عرضه می‌شود؟

کشف پژوهشگران ایرانی: زنی جوان 6هزار سال پیش در خوزستان کشته شد؛ اما کسی نمی‌داند چرا

پیام تسلیت مدیر کل بنیاد مازندران در پی شهادت جمعی از فرماندهان و مردم بی گناه در حمله تروریستی رژیم صهیونی به خاک کشورمان

زمان برچیدن رژیم جعلی صهیونیستی فرا رسیده است

نسخه بتای نرم‌افزار استیم برای مک منتشر شد

آیفون XS از امروز یک گوشی «قدیمی» به‌حساب می‌آید

بمب ساعتی: اسیدیته‌ دریا به سطح بحرانی رسیده و کل اکوسیستم‌ها را تهدید می‌کند

شناگر سمنانی مدال طلای جهانی‌اش را به شهید مدافع حرم، شهید عباس دانشگر تقدیم کرد

دیدار مدیر کل بنیاد شهید و امور ایثارگران مازندران با خانواده شهید سید عبدالله حسینی در رامسر

تبليغات