سیاست و بازاریابی | توانایی‌های نویدبخش مدل هوش مصنوعی «GPT 5.2»

توانایی‌های نویدبخش مدل هوش مصنوعی «GPT 5.2» نکات خواندني

بزرگنمايي:

سیاست و بازاریابی - ایسنا /شرکت «اوپن‌ای‌آی» روز پنجشنبه از عرضه مدل هوش مصنوعی «GPT 5.2» خبر داد و خاطرنشان کرد که این مدل دارای توانایی‌های قابل توجهی در بسیاری از زمینه‌ها خواهد بود.
در بحبوحه رقابت شدید با شرکت‌هایی مانند «گوگل»، «سم آلتمن»(Sam Altman)، مدیرعامل شرکت «اوپن‌ای‌آی»(OpenAI) در تلاش همه‌جانبه برای تسریع عرضه یک مدل جدید، «کد قرمز» صادر کرد. اکنون مدل هوش مصنوعی GPT 5.2 رسماً عرضه شده است و افراد کنجکاو در حال بررسی توانایی‌های آن برای به‌روزرسانی طراحی مدل‌های پیشرفته و کارهایی هستند که مدل‌های زبانی بزرگ می‌توانند برای ما انجام دهند.
بازار
سخنگوی اوپن‌ای‌آی در اطلاعیه رسمی این مدل که روز پنجشنبه منتشر شد، با اشاره به عملکرد نسخه 5.2 در معیارهای SWE-Bench و آزمایش‌های ARC توضیح داد: این مدل در ایجاد صفحات گسترده، ساخت ارائه‌ها، نوشتن کد، درک تصاویر، درک متن‌های طولانی، استفاده از ابزارها و مدیریت پروژه‌های پیچیده و چندمرحله‌ای بهتر عمل می‌کند.
اوپن‌ای‌آی در قسمتی از این اطلاعیه اظهار کرد که پلتفرم‌های هوش مصنوعی «نوشن»(Notion)، «باکس»(Box)، «شاپیفای»(Shopify)، «هاروی»(Harvey) و «زوم»(Zoom) شاهد برتری GPT 5.2 در عملکرد پیشرفته استدلال بلندمدت بوده‌اند، «دیتابریکس»(Databricks)، «هکس»(Hex) و «تریپل ویل»(Triple Whale) از کار ماهرانه آن در علوم داده عاملی و وظایف تحلیل اسناد خوششان آمده است و «کاگنیشن»(Cognition)، «رپ»(Warp)، «چارلی لبز»(Charlie Labs)، «جت‌برینز»(JetBrains) و «اوگمنت کد»(Augment Code) شاهد عملکرد عالی این مدل در کدنویسی عاملی بوده‌اند.
اعضای اوپن‌ای‌آی توضیح دادند که نسخه 5.2 را به منظور کمک به وظایف حرفه‌ای رایج و فراهم کردن ارزش اقتصادی بیشتر برای کاربران ایجاد کرده‌اند. با آنچه یکی از منتقدان انتزاع قوی‌تر، تعادل و پاسخ‌های راهبردی واضح‌تر و واقع‌گرایانه‌تر و اطلاعات مفهومی عمیق‌تر نامیده است، این مدل می‌تواند روی وظایفی مانند جداول سرمایه و برنامه‌ریزی نیروی کار تمرکز کند. این منتقد خاطرنشان کرد نسخه 5.2 برای وظایفی که نیاز به درجه بالایی از قابلیت‌های تحلیلی یا استدلال ریاضی دارند، عالی است.
از نظر ارزش، یک نظرسنجی سازمانی روی GPT اوپن‌ای‌آی نشان داد که مدل‌های پیشین چیزی حدود 40 تا 60 دقیقه در روز برای کاربران حرفه‌ای صرفه‌جویی می‌کنند و انتظار می‌رود صرفه‌جویی 5.2 در زمان از این مقدار هم بیشتر باشد.
علاوه بر آزمون‌های SWE و ARC، روش‌های مشخص دیگری نیز برای بررسی تکامل مدل وجود دارد. اوپن‌ای‌آی در اوایل سال جاری، مفهوم GDPVal را برجسته کرد و از ایده تولید ناخالص داخلی برای توضیح نقش مدل‌های زبانی بزرگ در کسب‌وکار بهره برد. این شرکت اظهار کرد: ارزیابی‌های پیشین هوش مصنوعی مانند آزمون‌های دانشگاهی چالش‌برانگیز و چالش‌های رقابتی کدنویسی در پیشبرد مرزهای قابلیت‌ استدلال مدل ضروری بوده‌اند، اما اغلب در نوع وظایفی که بسیاری از افراد در کار روزمره خود انجام می‌دهند، کم می‌آورند. ما برای پر کردن این شکاف، در حال توسعه ارزیابی‌هایی هستیم که قابلیت‌های واقع‌بینانه‌تر و مرتبط با اقتصاد را بررسی می‌کنند.
تقریباً به نظر می‌رسد که این کد به ‌طور ویژه برای ChatGPT 5.2 نوشته شده و این همان چیزی است که اعضای شرکت درباره قدرت این مدل تبلیغ می‌کنند. این کد، دامنه کاربرد مشخصی دارد. GDPVal مجموعه‌ای از 44 شغل در 9 صنعت برتر مؤثر در تولید ناخالص داخلی آمریکا را به همراه 1320 وظیفه تخصصی پوشش می‌دهد.
بخش دیگری از آنچه اوپن‌ای‌آی درباره بررسی گسترده معیارهای GDPVal و کاربردی بودن آن در مقایسه با سایر معیارها می‌گوید، به این شرح است: GDPval هم از نظر واقع‌گرایی و هم از نظر تنوع وظایف مورد ارزیابی، متمایز است. برخلاف سایر ارزیابی‌های مرتبط با ارزش اقتصادی که بر حوزه‌های ویژه تمرکز دارند، GDPval وظایف و مشاغل زیادی را پوشش می‌دهد و برخلاف معیارهایی که شامل ایجاد مصنوعی وظایف به سبک یک امتحان یا آزمون دانشگاهی هستند، GDPval بر وظایف مبتنی بر نتایج قابل تحویل تمرکز می‌کند که یک کار یا محصول واقعی هستند یا یک محصول کاری مشابه به شمار می‌روند.
یکی دیگر از پیشرفت‌هایی که کاربران درباره نسخه 5.2 به آن اشاره می‌کنند، مربوط به یادگیری ماشینی کلاسیک است که مهندسان در آن توانایی یک برنامه را برای هم‌گرایی یا ادغام اطلاعات به روشی هدفمند بررسی کردند. روش‌های بسیاری برای فکر کردن درباره این موضوع وجود دارد؛ از تحلیل چگونگی درک داده‌های بصری توسط یک ارگانیسم بیولوژیکی گرفته تا توجه به این که چگونه تغییرات ابعادی بر نتیجه توجه یک شبکه عصبی تأثیر می‌گذارند، اما برخی از کاربران اولیه ادعا می‌کنند نسخه 5.2 در هم‌گرایی، انسجام و هدف قرار دادن نتیجه‌ای که منطقی است، بهتر عمل می‌کند. برخی از انسان‌ها نیز در این زمینه بهتر از دیگران هستند.
این موارد تنها بخشی از نکات شنیده‌شده درباره GPT 5.2 هستند و مطمئنا به‌روزرسانی‌های بسیاری برای آن ارائه خواهد شد.

دوشنبه ۲۴ آذر ۱۴۰۴ - ۱۰:۱۲:۴۰
۷ بازديد
سیاست و بازاریابی

https://www.siasatvabazaryabi.ir/Fa/News/787859/

گرمایش زمین همچنان توقف‌ناپذیر؛ 2025 دومین سال گرم ثبت‌شده در تاریخ بود

هزینه تعویض نمایشگر گوشی جدید سامسونگ، معادل قیمت آیفون 17 پرو است

تاریخ عرضه بازی‌های جدید سری Resident Evil فاش شد

قابلیتی ساده اما مهم به Red Dead Redemption 2 اضافه شد

آخرين مطالب

توانایی‌های نویدبخش مدل هوش مصنوعی «GPT 5.2» نکات خواندني

نظرات شما

ساير مطالب

باگ عجیب آیفون؛ برخی از عکس‌های گالری، قرمز شده‌اند!

مایکروسافت فعلاً برنامه‌ای برای افزایش قیمت بازی‌ها ندارد

حاجی‌بابایی: مادران و همسران شهدا قله صلابت ایران‌ هستند / خدمات بیمه دی به ایثارگران توفیق الهی و شایسته قدردانی است

چالش‌های اخلاق پژوهشی در استفاده از هوش مصنوعی

مدیرعامل بیمه دی در همایش تجلیل از همسران و مادران شهدای اقتدار: دیجیتالی شدن کامل ارزیابی خسارت در بخش درمان و خودرو گام مهم بیمه دی در مسیر خدمت به مردم

اوحدی: رضایت خانواده شهدا رضایت خداست/ رتبه نخست بیمه دی نشانه خدمت صادقانه به ایثارگران

اخبار پول گزارش می دهد/ راز رشد پایدار بیمه دی در بازتعریف فرهنگ فروش

اکونا پرس گزارش می دهد/ شبکه فروش بیمه دی؛ پیشران رشد 53 همتی و بازوی توسعه فروش هوشمند

حقایق جالب درباره مریخ

توانایی‌های نویدبخش مدل هوش مصنوعی «GPT 5.2»

گلکسی S26 عمیقا با هوش مصنوعی ادغام خواهد شد

نه برای سکونت، نه برای افتخار؛ انسان باید برای یافتن حیات بیگانه به مریخ برود

بازکردن قفل گوشی با ضربان قلب، ویژگی انقلابی بعدی آیفون‌

برخی دایناسورها احتمالا مانند پرندگان رنگارنگ بودند

وقتی کمبود زمان داریم، خواب مهم‌تر است یا ورزش؟

یک هفته دوری از شبکه‌های اجتماعی؛ کاهش چشمگیر افسردگی

قایق‌های تفریحی مصر باستان قبلاً فقط در کتاب‌ها بودند؛ اکنون یکی از آن‌ها کشف شده است

عجیب اما دوست‌داشتنی؛ شارژر بی‌سیم جدید ایکیا رونمایی شد

هری پاتر به بازی فورتنایت می‌آید

تمرکز شیائومی بر مدل‌های پرو؛ آینده مدل استاندارد پوکو X8 و F8 در هاله‌ای از ابهام

تبلتی با نمایشگر مشابه کاغذ؛ قیمت میت‌پد 2026 هواوی مشخص شد

هدیه 5 دلاری به حساب برخی از کاربران پلی‌استیشن واریز شد

هواوی گوشی‌های سری نوا 15 را چه زمانی رونمایی می‌کند؟

فراتر از تله‌پاتی: کار تیمی، مغز انسان‌ها را به هم متصل می‌کند

خشکسالی، گرسنگی و مواجهه با انسان خردمند، آخرین فصل زندگی هابیت‌ها را رقم زد

دستیابی ایران به دانش ساخت موتور استرلینگ دینامیکی؛ «نیروگاه کوچک» با بازدهی بالاتر

نقش بالش در بالا رفتن فشار خون!

سامسونگ پدیده «تاری حرکت» را در دوربین گوشی‌هایش از بین می‌برد

ساخت «سپر صوتی» برای کاهش حواس‌پرتی در مبتلایان به «ADHD»

«راکت لب» یک ماهواره ژاپنی را به مدار زمین فرستاد

آپدیت جدید اندروید 16، عملکرد گوشی‌های گوگل را 20 درصد بهبود می‌دهد

آیا هوش مصنوعی می‌تواند دارو تجویز کند؟

ساعت‌های مچی پلی استیشن رونمایی شدند؛ مجموعه جذاب و خاطره‌انگیز

آیا می‌توان عزیزان ازدست‌رفته را به زندگی بازگرداند؟ شرکت هوش مصنوعی 2wai می‌گوید بله

قیمت لپ‌تاپ‌های دل در آستانه انفجار است

گرمایش زمین همچنان توقف‌ناپذیر؛ 2025 دومین سال گرم ثبت‌شده در تاریخ بود

هزینه تعویض نمایشگر گوشی جدید سامسونگ، معادل قیمت آیفون 17 پرو است

ماده مغذی رایجی که روده‌های ما را به کارخانه‌های شیمیایی مبارزه با دیابت تبدیل می‌کند

سامسونگ قیمت گوشی‌های گلکسی A را افزایش می‌دهد

قدرت پنهان حرکات دست؛ چگونه سخن گفتن را متقاعدکننده‌تر کنیم؟

مودم مسافرتی جدید ایسوس با پشتیبانی از پاوربانک رونمایی شد

تأثیر شگفت‌انگیز مریخ بر آب و هوای زمین!

هوش مصنوعی پاشنه آشیل آبله میمونی را پیدا کرد

تاریخ عرضه بازی‌های جدید سری Resident Evil فاش شد

قابلیتی ساده اما مهم به Red Dead Redemption 2 اضافه شد

نقدها و نمرات بازی Ninja Gaiden 4 منتشر شدند

میوه‌ای که موجب افزایش ویتامین C پوست می‌شود

دردسر هوش مصنوعی برای کتابخانه‌ها: مردم دنبال منابعی هستند که اصلاً وجود ندارند

ویدیوی جدیدی از گیم‌پلی بازی Pragmata منتشر شد

خالق Counter Strike: مردم این بازی را فقط بخاطر خرید اسکین تجربه می‌کنند

تبليغات