سیاست و بازاریابی

آخرين مطالب

انقلاب انویدیا در هوش مصنوعی با پاسخ‌دهی 32 برابر سریع‌تر به کاربران نکات خواندني

انقلاب انویدیا در هوش مصنوعی با پاسخ‌دهی 32 برابر سریع‌تر به کاربران
  بزرگنمايي:

سیاست و بازاریابی - ایسنا / انویدیا از اولین هوش مصنوعی «طولانی‌متن» (long-context AI) جهان رونمایی کرده است که می‌تواند همزمان به 32 برابر کاربران بیشتری خدمات در لحظه ارائه دهد.
این سیستم جدید به‌طور ویژه برای پردازنده گرافیکی بلک‌ول (Blackwell) طراحی شده و با استفاده از روشی نوآورانه به نام هلیکس (Helix)، بازنویسی و درک متن‌های خیلی طولانی را متحول می‌کند و استاندارد جدیدی برای تعامل سریع و هم‌زمان با کاربران متعدد ایجاد می‌کند. بلک‌ول جدیدترین پردازنده گرافیکی انویدیا با قدرت و سرعت بالا برای اجرای مدل‌های بزرگ هوش مصنوعی است.
بازار
قدرتی نو برای پردازش متن‌های عظیم
به نقل از آی‌ای، انویدیا یک روش جدید و قدرتمند به نام موازی‌سازی هلیکس (Helix Parallelism) ارائه کرده است که می‌تواند به‌طور چشمگیری عملکرد مدل‌های هوش مصنوعی را هنگام پردازش متن‌های بسیار طولانی بهبود بخشد.
این روش به مدل‌های هوش مصنوعی این امکان را می‌دهد که میلیون‌ها کلمه را به‌طور هم‌زمان پردازش کنند. برای مثال زمانی که یک چت‌بات یا دستیار هوش مصنوعی باید کل یک دایرهالمعارف یا مکالمه چندماهه را بررسی کند و درعین‌حال پاسخ‌هایی بسیار سریع بدهد.
هلیکس به‌طور ویژه برای هماهنگی با پردازنده‌های گرافیکی جدید انویدیا به نام بلک‌ول طراحی شده که پهنای باند حافظه بسیار بالا و قدرت محاسباتی فوق‌العاده‌ای دارند.
مشکل اصلی: پردازش حافظه زیاد و سنگین
وقتی مدل‌های هوش مصنوعی بزرگ می‌خواهند پاسخ جدید تولید کنند، باید تمام متن‌های قبلی را که به آن‌ها داده شده بررسی کنند این مجموعه‌ی قبلی «کانتکست» یا متن زمینه (context) نامیده می‌شود.
برای هر کلمه جدید، مدل باید بارها و بارها حافظه‌ای به نام KV cache را بخواند، که حاوی همه توکن‌ها یا کلمات قبلی است. این خواندن مکرر باعث فشار شدید به حافظه واحد پردازش گرافیکی (GPU) می‌شود. علاوه بر این، مدل باید در هر مرحله مقادیر عظیمی از داده‌ها را برای بخش شبکه تغذیه پیش ‌رو (FFN) دوباره از حافظه بارگیری کند، که باعث کندی شدید، مخصوصا در برنامه‌های زنده مانند چت‌بات‌ها می‌شود.
تاکنون، برنامه‌نویسان از روشی به نام موازی‌سازی تِنسوری (Tensor Parallelism) استفاده می‌کردند تا این فشار را بین چند واحد پردازش گرافیکی پخش کنند، اما بعد از یک حد خاص، واحدهای پردازش گرافیکی مجبور می‌شوند نسخه‌های تکراری از حافظه KV را نگه دارند، که باعث می‌شود فشار حافظه بیشتر هم بشود.
هلیکس چطور این مشکل را حل می‌کند؟
هلیکس با جدا کردن دو بخش اصلی مدل یعنی توجه یا attention و شبکه تغذیه پیش ‌رو آن‌ها را به‌طور مستقل اجرا می‌کند. در مرحله توجه (attention)، هلیکس با استفاده از روشی جدید به نام KV Parallelism (KVP) حافظه KV را بین واحدهای پردازش گرافیکی تقسیم می‌کند، بدون اینکه تکراری ایجاد شود.
به زبان ساده به‌جای اینکه هر واحد پردازش گرافیکی مجبور باشد کل حافظه قبلی را بخواند، فقط بخشی از آن را پردازش می‌کند. سپس، همین واحدها به حالت قبلی (TP) برمی‌گردند تا بخش شبکه تغذیه پیش ‌رو را اجرا کنند این یعنی استفاده‌ی هوشمندانه از منابع، بدون اینکه واحدهای پردازش بیکار بمانند.
هلیکس از اتصال‌های پرسرعت انویدیا مثل NVLink و NVL72 استفاده می‌کند تا داده‌ها را بین واحدهای پردازش گرافیکی به‌سرعت جابه‌جا کند. همچنین تکنیکی به نام HOP-B را معرفی می‌کند که محاسبات و انتقال اطلاعات را هم‌زمان انجام می‌دهد، تا تاخیرها باز هم کمتر شوند.
جهشی بزرگ در عملکرد
در شبیه‌سازی‌هایی که با یک مدل بسیار بزرگ به نام DeepSeek-R1 671B انجام شده که مدلی با ظرفیت پردازش یک میلیون توکن یا کلمه است، مشخص شد که هلیکس می‌تواند تا 32 برابر بیشتر از روش‌های قبلی به کاربران هم‌زمان پاسخ دهد و این بدون افزایش تاخیر انجام می‌شود.
در بارهای کاری سبک یعنی وقتی کاربران زیادی به‌طور هم‌زمان فعال نیستند، هلیکس می‌تواند زمان پاسخ‌دهی را تا 1.5 برابر کاهش دهد. حتی وقتی اندازه متن‌ها به میلیون‌ها کلمه برسد، هلیکس همچنان استفاده از حافظه را کنترل‌شده نگه می‌دارد و سرعت پردازش را ثابت نگه می‌دارد. این سیستم حافظه KV را به‌صورت چرخشی به‌روزرسانی می‌کند تا از فشار ناگهانی روی حافظه یا شلوغی بیش از حد واحدهای پردازش جلوگیری شود.
نتیجه نهایی
هلیکس به مدل‌های هوش مصنوعی امکان می‌دهد که در عین بزرگ شدن، سریع هم بمانند بدون اینکه عملکرد در لحظه(real-time) قربانی شود. این یعنی دستیارهای مجازی و ربات‌های حقوقی هوش مصنوعی اکنون می‌توانند با وجود بارهای عظیم، همچنان پاسخ‌گو، سریع و حاضر باقی بمانند.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/780992/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

یک گوشی ارزان سامسونگ آپدیت امنیتی دریافت کرد

راه رفتن مجدد کودک فلج 8 ساله با درمان جدید سلولی

شهدای اخیر گلستان نماد وحدت و همبستگی اقوام و مذاهب مختلف کشورند

هوش مصنوعی سامسونگ وارد 400 میلیون دستگاه هوشمند می‌شود

اثری از «گالیله» رکورد زد

دیدار استاندار گیلان و سخنگوی وزارت خارجه با خانواده شهید دانشمند هسته‌ای

گوشی قدرتمند شیائومی آپدیت HyperOS 2.2 را دریافت کرد

این گوشی‌ها تا 2 هفته دیگر آپدیت بزرگ HyperOS شیائومی را دریافت می‌کنند

نگاهی به یکی از ابزارهای ‌مورداعتماد در آزمایشگاه‌های شیمی که ممکن است گمراهمان کند!

گوگل رقیب گلکسی زد فولد 7 را با 16 گیگابایت رم و تراشه اختصاصی عرضه می‌کند

جشن 3 سالگی تلسکوپ «جیمز وب» با سحابی «پنجه گربه»

الهام‌گرفتن از iOS 26؟ پلیر جدید یوتیوب با طراحی شیشه‌ای معرفی شد

هوش مصنوعی تا 20 سال دیگر اکثر شغل‌ها را نابود می‌کند

بررسی انواع مشکلات و خرابی‌های احتمالی کنسول های بازی (PS و XBOX)

کودکان علیه گوشی؛ یک مطالعه از رفتار تأمل‌برانگیز نسل جدید پرده برداشت

ارزان ترین مانیتور 240 هرتزی دنیا با قیمت زیر 100 دلار عرضه شد

*مدیرعامل بیمه دی: شهدای اخیر گلستان، نماد وحدت و همبستگی اقوام و مذاهب مختلف کشورند

تاثیر غیرمنتظره سدسازی؛ حجم عظیم آب‌های ذخیره‌شده قطب‌های زمین را تغییر داده است

صفحه آبی مرگ پس از 40 سال حذف شد؛ ورود صفحه مشکی مرگ به ویندوز 11

چرا از حشرات می‌ترسیم؟

احتمال عرضه نسخه نسل نهمی بازی Red Dead Redemption 2 قوت گرفت

این سگ رباتیک چینی با سرعت خارق‌العاده‌اش شما را شگفت‌زده می‌کند!

از باندل محدود پلی استیشن 5 با طرح Ghost of Yotei رونمایی شد

دانشمندان زمان شروع کوچک شدن جهان را تخمین زدند

دوبله ژاپنی Ghost of Yotei واقع‌گرایانه خواهد بود

مدلی خاص از آیفون 17 پرو و پرو مکس صرفا در چین فروخته خواهد شد

آیا غول‌های باستانی بخشی از واقعیت تاریخی آمریکا هستند؟

توسعه‌دهنده: حالت اول شخص از ابتدا برای Indiana Jones and the Great Circle درنظر گرفته شده بود

5 حقیقت شگفت انگیز درباره نحوه کار هوش مصنوعی

تکریم معاون توسعه مدیریت و منابع بنیاد شهید و امور ایثارگران از خانواده های شهدای مازندران

بازی Ghost of Yotei تمرکز بی‌سابقه بر ایجاد آزادی بیشتر برای بازیکنان خواهد داشت

افزایش اضطراب، افسردگی و وابستگی در مبتلایان به کرونا

ادای احترام به اسطوره‌ های ایثار در زاهدان

سازنده گوشی‌های نوکیا از بازار موبایل آمریکا خارج شد

چیزی که در مغز همه افراد «سایکوپات» مشترک است

گوشی جدید سامسونگ انتخابی جذاب برای گیمرها است

آخرین نگاه به زحل؛ روایت ناگفته از پایان باشکوه کاوشگر کاسینی ناسا

نه! ظرفیت رم آیفون بیشتر نمی‌شود

دانشمندان روشی نوین برای ساخت‌وساز پایدار در مریخ کشف کرده‌اند: پرورش جلبک

طراحی شیائومی 16 پرو مکس لو رفت؛ پرچمدار چینی برای رقابت با آیفون و گلکسی

ذوب یخ‌ها موجی از فوران‌های آتشفشانی را به دنبال دارد

مدل طلایی-صورتی یکی از گوشی‌های جذاب شیائومی معرفی شد

آیا رفتار یخ در فضا در مقایسه با زمین متفاوت است؟

آیا این گوشی ارزان بعدی شیائومی است؟

سرگذشت نیکولا تسلا؛ نابغه‌ای که تاریخ در حقش کم‌لطفی کرد

«پاک‌کن جادویی شیائومی» با قابلیت‌هایی جدید آپدیت شد

در انتظار عرضه اولین آیفون تاشو؛ تولید نمایشگر گوشی بعدی اپل شروع شد

ابداع پوستی برای ربات‌ها که همه چیز را حس می‌کند

باریک‌ترین آیفون تاریخ به پردازنده‌ای «حرفه‌ای» مجهز می‌شود

نقش هوش مصنوعی در مرور و راستی‌آزمایی مطالعات