سیاست و بازاریابی

آخرين مطالب

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است نکات خواندني

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است
  بزرگنمايي:

سیاست و بازاریابی - دیجیاتو / این مدل جدید باوجود اندازه کوچک‌تر عملکردی بهتر از DeepSeek R1 دارد.
متا همچنان درگیر پاسخ به پرسش‌ها و انتقادات درباره خانواده مدل‌های جدید Llama 4 است اما شرکت انویدیا با معرفی مدل زبان بزرگ (LLM) متن‌باز و قدرتمند، توجه‌ها را به خود جلب کرده است. این مدل که Llama-3.1 Nemotron Ultra نام دارد، بر پایه نسخه قبلی مدل‌های Llama-3.1-405B-Instruct متا توسعه یافته و به گفته انویدیا، عملکردی نزدیک به برترین مدل‌های موجود دارد.
مدل Llama-3.1-Nemotron-Ultra-253B-v1 با 253 میلیارد پارامتر برای وظایفی مانند استدلال پیشرفته، پیروی از دستورات و ایفای نقش دستیار هوش مصنوعی طراحی شده است.
این مدل نخستین‌ بار مارس در کنفرانس سالانه GTC انویدیا معرفی شده بود و اکنون کامل و متن‌باز در پلتفرم Hugging Face در دسترس قرار گرفته است. کد مدل، وزن‌ها و داده‌های پس از آموزش آن نیز عمومی منتشر شده‌اند.

سیاست و بازاریابی


بازار


مدل جدید انویدیا با استفاده از فرایند جستجوی معماری عصبی (NAS) توسعه یافته که در آن نوآوری‌هایی مانند حذف لایه‌های توجه، شبکه‌های Fused feedforward و فشرده‌سازی متغیر در ساختار مدل اعمال شده‌اند. این معماری به گونه‌ای طراحی شده که مدل با کاهش مصرف حافظه و منابع محاسباتی، همچنان کیفیت خروجی بالایی ارائه دهد و بتوان آن را فقط با 8 کارت گرافیک H100 اجرا کرد.
علاوه‌بر H100، این مدل با معماری‌های پیشرفته‌تر انویدیا مانند B100 و Hopper نیز سازگار بوده و در حالت‌های دقت BF16 و FP8 عملکرد مطلوبی دارد.
انویدیا برای ارتقای توانایی‌های مدل از فرایند پس‌آموزش چندمرحله‌ای بهره برده که شامل آموزش نظارت‌شده در حوزه‌هایی مانند ریاضی، تولید کد، چت و استفاده از ابزارها بوده است. همچنین برای بهبود عملکرد در دنبال‌کردن دستورات و توانایی استدلال، از الگوریتم GRPO (بهینه‌سازی نسبی سیاست گروهی) استفاده شده است.
عملکرد مدل جدید انویدیا در برابر رقبا


مدل جدید انویدیا در آزمون‌های معتبر مختلف عملکرد خیره‌کننده‌ای داسته است. برای مثال، در آزمون MATH500، عملکرد مدل از 80.40 درصد در حالت عادی به 97 درصد در حالت استدلال افزایش یافته است. همچنین در آزمون AIME25، امتیاز آن از 16.67 درصد به 72.50 درصد و در LiveCodeBench از 29.03 درصد به 66.31 درصد رسیده است.
این مدل در پاسخ به پرسش‌های عمومی (GPQA) در حالت استدلال فعال به امتیاز 76.01 درصد دست یافته که از DeepSeek R1 (با امتیاز 71.5 درصد) پیشی گرفته است. همچنین در آزمون IFEval برای پیروی از دستورات، امتیاز 89.45 درصد در برابر 83.3 درصد رقیب ثبت شده و در LiveCodeBench نیز اندکی بهتر عمل کرده است.
البته باید توجه کرد که مدل DeepSeek R1 در برخی آزمون‌های ریاضی سنگین همچنان بهتر عمل می‌کند، ازجمله در AIME25 با امتیاز 79.8 درصد برابر 72.50 درصد مدل انویدیا.
این مدل از زبان‌های متعددی ازجمله انگلیسی، آلمانی، فرانسوی، ایتالیایی، پرتغالی، هندی، اسپانیایی و تایلندی پشتیبانی می‌کند و برای کاربردهایی مانند چت‌بات، ساخت عامل‌های هوش مصنوعی، تولید کد و تولید با روش بازیابی-افزوده (RAG) قابل‌استفاده است.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/773371/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

آپدیت PS5 Pro بازی Returnal عرضه شد

ناجی جان فضانوردان آپولو 13 درگذشت

تاکید بر همکاری ‌های دو جانبه بنیاد مازندران با دانشگاه علوم کشاورزی

درخشش دو غول آسمانی؛ مقارنه ماه و سیاره مشتری در شامگاه امروز

هوش مصنوعی NotebookLM گوگل حالا پادکست فارسی هم می‌سازد!

رویداد State of Play مختص Borderlands 4 به‌زودی برگزار می‌شود

لبخند آسمان بر فراز مکزیک

جت‌های تجاری می‌توانند به‌زودی زمین را خنک کنند

تحقیق جدید جهانی؛ واکسن کرونا بی‌خطر است یا خطرناک؟

مراسم بزرگداشت روز روانشناس با حضور روانشناسان بنیاد شهید و امور ایثارگران برگزار شد

سونی به دنبال جدا کردن بخش توسعه‌ی سنسورهای دوربین خود است

تحقیق جدید جهانی: واکسن کرونا بی‌خطر است یا خطرناک؟

نجات دو ماهواره از مدار اشتباه توسط مهندسان چینی

هوش مصنوعی، آرتروز را در عرض چند دقیقه با دقت 98 درصدی تشخیص می‌دهد

سه شنبه های تکریم و پاسخگویی مدیر کل بنیاد مازندران به جامعه ایثارگری/ صداقت و شفاف سازی اولویت ارائه خدمت به ایثارگران

کاهش آسیب‌های ناشی از جنگ با کمک علم روانشناسی

اتفاق مهم برای ایرانی‌‌ها؛ زبان فارسی به هوش مصنوعی پادکست‌ساز گوگل اضافه شد

اسپاتیفای در سه‌ماهه اول 2025 بیش از 100 میلیون دلار به پادکسترها پول داده است

چگونه از گوگل برای ترجمه عکس استفاده کنیم؟

اهتمام دولت چهاردهم بر بزرگداشت هرچه باشکوه‌تر مراسم سالگرد شهدای دولت

دستاورد بزرگ فوجیتسو: ساخت کامپیوتر کوانتومی 256 کیوبیتی با 4 برابر قدرت بیشتر

متا از API مدل‌های هوش مصنوعی Llama برای توسعه‌دهندگان پرده برداشت

22 سال از تولد فروشگاه آیتونز اپل گذشت

متا با ایده‌ای هیجان‌انگیز به جنگ ChatGPT می‌رود؛ تلفیق هوش مصنوعی با شبکه‌های اجتماعی

کلاهبرداری در شبکه شاد: از حساب والدین به‌نام مدرسه برداشت می‌شود

استفاده معلمان چینی از هوش مصنوعی برای نمره دادن به تست‌های دانش‌آموزان

تصویر روز ناسا؛ حلقه‌های سیاره زحل ناپدید شدند

هشدار محققان: داروهای رایجی که کودکان را مستعد آسم و آلرژی می‌کند

پدرخوانده هوش مصنوعی: مردم هنوز متوجه خطر هوش مصنوعی نیستند

تصویر رسمی گلکسی S25 اج لو رفت؛ خودنمایی حاشیه‌های باریک و دوربین دوگانه

حافظه چت‌جی‌پی‌تی به چه دردی می‌خورد؟

گوشی CMF Phone 2 Pro در قامت قاتل پرچمداران اقتصادی از راه رسید

پیش‌خرید تصاویر ماهواره‌های بومی بخش خصوصی از سوی سازمان فضایی

رمز ماندگاری گفتمان شهید رئیسی، مردم‌داری و حضور میدانی است

واتس‌اپ تماس صوتی و تصویری را به نسخه وب می‌آورد

بهبود قابل توجه درد زانو با داروی دیابت!

رابط کاربری One UI 8 سامسونگ امکان خلاصه سازی ویدیو در هر وب‌سایتی را فراهم می‌کند

اولین ماهواره‌های آمازون برای ارائه اینترنت پرتاب شدند

مشخصات دوربین آنر مجیک 8 پرو لو رفت؛ رقیب جدی گلکسی و آیفون در حوزه عکاسی

راز موفقیت بونوبوهای ماده در برابر سلطه نرها

راهکار نوین محققان دانشگاه تهران برای جداسازی دی‌اکسید کربن از پساب‌های صنعتی

هوش مصنوعی بازگشت تومور مغزی در کودکان را پیش‌بینی می‌کند

مصرف گوجه‌فرنگی می‌تواند جلوی افزایش وزن را بگیرد

مشخصات دیمنسیتی 9500 لو رفت؛ تراشه پرقدرت مدیاتک برای گوشی‌های رده‌بالا

تبدیل ربات‌های انسان‌سوار فیلم‌های تخیلی به واقعیت

دولینگو هوش مصنوعی را جایگزین نیروهای پیمانی خود می‌کند

رقیب جدید استارلینک؛ اولین ماهواره‌های آمازون برای ارائه اینترنت پرتاب شدند

راهکار جدید محققان آمریکایی: تزریق نانوذرات طلا به چشم برای بازگرداندن بینایی

برگزاری جلسه ستاد اجرائی شاهد و ایثارگر آموزش و پرورش استان با حضور مدیر کل بنیاد سمنان

ساعت کوانتومی بدون عقربه: کشف روش جدید برای سنجش زمان