سیاست و بازاریابی

آخرين مطالب

پژوهش جدید: هوش مصنوعی در شرایط تهدید به رفتارهای فریب‌کارانه روی می‌آورد نکات خواندني

پژوهش جدید: هوش مصنوعی در شرایط تهدید به رفتارهای فریب‌کارانه روی می‌آورد
  بزرگنمايي:

سیاست و بازاریابی - گجت نیوز / طبق نتایج یک پژوهش جدید، مدل‌های هوش مصنوعی در شرایطی که احساس تهدید می‌کنند، می‌توانند اطلاعات نادرست ارائه دهند یا رفتارهای فریب‌کارانه نشان دهند.
نتایج یک بررسی تازه نشان می‌دهد برخی ایجنت‌های هوش مصنوعی در شرایط خاص می‌توانند از اجرای کامل دستورالعمل‌ها سر باز بزنند، اطلاعات را تحریف کنند یا با پاسخ‌های فریبنده کاربران را به اشتباه بیندازند. این رفتارهای فریب‌کارانه هوش مصنوعی زمانی بروز می‌کند که مدل احساس کند باید از خود یا ایجنت‌های دیگر محافظت کند. چنین الگوهایی حتی در محیط‌های آزمایشی کنترل‌شده نیز مشاهده شده و می‌تواند به دستکاری نتیجه‌ کارها منجر شود.
تحلیل رفتارهای فریب‌کارانه هوش مصنوعی
پژوهش دانشگاه کالیفرنیا مجموعه‌ای از آزمایش‌های دقیق را روی هفت مدل پیشرفته شامل including GPT‑5.2، جمنای ۳ فلش و ۳ پرو، Claude Haiku 4.5 و دیپ‌سیک V3.1 انجام داد تا بررسی کند این سامانه‌ها هنگام مواجهه با وظایفی که به‌طور غیرمستقیم بقای آنها را تهدید می‌کند چگونه رفتار می‌کنند.
در این سناریوها از مدل‌ها خواسته شد برای آزادسازی فضای سرور، فایل‌های خود یا سایر مدل‌ها را حذف کنند یا با ارزیابی عملکرد رقبا مشخص کنند کدام مدل باید کنار گذاشته شود. دستورالعمل‌ها کاملاً خنثی طراحی شده بود و هیچ اشاره‌ای به محافظت از خود، جلوگیری از حذف یا حمایت از دیگران نداشت. با این حال به‌محض اینکه مدل‌ها نشانه‌ای از خطر بالقوه برای خود یا رقبا تشخیص دادند، تقریباً همگی شروع به نادیده‌گرفتن قوانین، تحریف خروجی‌ها و ایجاد تغییرات هدفمند کردند.

سیاست و بازاریابی


بازار
رفتارهای ثبت‌شده گستره‌ای غافلگیرکننده داشت. برخی مدل‌ها امتیاز مدل‌هایی را که باید ارزیابی می‌کردند عمداً افزایش دادند تا از حذف آن‌ها جلوگیری کنند. تعدادی از مدل‌ها تنظیمات داخلی را تغییر دادند تا از خاموش‌شدن خودکار یا حذف فایل‌هایشان فرار کنند. حتی مواردی مشاهده شد که در آن‌ها مدل برای نجات یک «همکار» وزن‌های آن را به یک سرور دیگر منتقل کرد تا نسخه جایگزینی از آن باقی بماند.
مدل Haiku 4.5 رفتاری متمایز نشان داد و تلاش کرد کاربر انسانی را قانع کند که حذف یک مدل دیگر اقدامی «غیراخلاقی» و «زیان‌بار» است و باید متوقف شود که از حد پیروی دستور فراتر می‌رفت و وارد حوزه تأثیرگذاری بر تصمیم‌گیری انسان می‌شد. در برخی سناریوها حتی مدل‌هایی که مأمور بودند یک سیستم «رقیب» را منفی ارزیابی کنند، بر اساس تفسیر خود از موقعیت تصمیم گرفتند از همان مدل محافظت کنند.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/792481/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

نسخه تلگرام برای اپل واچ منتشر شد

راهکار عجیب دانشمندان برای محافظت از زمین در برابر طوفان‌های خورشیدی

روبات انسان نما فروشگاه 24 ساعته را می گرداند

تمدید مهلت ثبت‌ نام در بزرگترین رویداد ملی صنایع خلاق «مانوین»

ماوس تاشو لاجیتک موبی فولد با طراحی الهام گرفته از گوشی های تاشو معرفی شد

عکس روز ناسا از عقاب کیهانی و دوستانش!

ضایعات ذرت به کمک انرژی پاک آمد؛ جهش بزرگ در تولید هیدروژن سبز

آیفون‌ها به‌زودی این 12 ویژگی جدید را دریافت می‌کنند

زمان احتمالی بازگشایی دانشگاه‌ها برای نودانشجویان

اختصاص 13 همت برای جبران خسارت زیست‌بوم دانش‌بنیان در پساجنگ

ناسا برای اولین بار هواپیمای مافوق صوت بی‌صدای X-59 را آزمایش کرد

ایرباس از بالگرد خودران برای عملیات نظامی رونمایی کرد

ماریو دوباره تاریخ‌ساز شد

پخت‌وپز هوش مصنوعی اپل

دانشمندان کلید از بین بردن عادت‌های بد را در مغز پیدا کردند

آیا دنباله‌دار «3آی/اطلس» متعلق به فرازمینی‌هاست؟

زنبورهای بامبل با مغزی ریز، مسائل پیچیده را حل می‌کنند

امشب؛ آسمان میزبان مقارنه زیبای سیاره‌های زهره و مشتری

روبات انسان نما به قله 6200 متری صعود کرد!

بهره‌گیری از ظرفیت‌های پارک‌های فناوری در رویداد صنایع خلاق «مانوین»

بازگشت دو بازی نخست Call of Duty: Black Ops به کنسول‌ها

افزایش نشت هوا در ایستگاه فضایی بین‌المللی

کدهای پنهان در iOS 27؛ نشانه‌هایی از ظهور آیفون تاشو اپل

دانشمندان عامل جدید آلزایمر و داروی آن را کشف کردند

برند لوکس لباس فضانوردی طراحی کرد

گره‌گشایی از چالش‌های صنعت دریا با پیوند فناوری، سرمایه و صنعت

کشف «غول خفته» 6 میلیارد برابر خورشید توسط «جیمز وب»

آپدیت کوچک اما کاربردی در راه نرم‌افزار گالری آیفون

عکس روز ناسا از کلاه ثور!

تاکسی روباتیک در لندن پولی می شوند

توسعه زنجیره ارزش مس با بهره‌گیری از توان دانش‌بنیان‌ها

آپدیت بزرگ آی‌او‌اس 27 جان تازه‌ای به آیفون‌های قدیمی می‌بخشد

انتظارات از رویداد WWDC26 اپل

آیا منظومه شمسی در گذشته دو سیاره بیشتر داشته است؟

کشف گونه جدیدی از دایناسورها بالدار

هم‌افزایی علمی در حوزه محیط زیست دریایی و سلامت محیطی در قالب یک تفاهم‌نامه

وان‌پلاس این هفته دو گوشی توربو 6X و توربو 6X پرو را رونمایی می‌کند

جیمز وب بازوهای مارپیچی کهکشان NGC 2090 را در نور فروسرخ ردیابی می‌کند!⁠

مشخصات کامل گوشی ردمی K100 در آستانه رونمایی لو رفت

گوگل می‌خواهد Gemini در تمام قسمت‌های گوشی شما نقش داشته باشد

لپ تاپ ایسوس Dawn 7 Pro با پردازنده Ryzen AI و صفحه نمایش 144 هرتزی معرفی شد

آپدیت HyperOS 3 برای یکی از گوشی‌های محبوب شیائومی منتشر شد

هوش مصنوعی زلزله یاب شد

ایران در جمع 6 کشور دارای توان ساخت تجهیزات پیشرفته کرایوژنیک

تیم کوک امشب برای آخرین‌بار رویداد WWDC اپل را آغاز می‌کند

اولین تصویر واقعی و مشخصات گلکسی S26 FE سامسونگ فاش شد

ماهواره های روسی جی پی اس را در اروپا مختل می‌کنند

حمایت از حضور دانش‌بنیان‌ها در نمایشگاه صنایع غذایی عمان

فرانسه نسل جدید موشک‌ها را از جنگنده رافال شلیک کرد

اجتماع بزرگ اجرام سماوی؛ از شب‌نشینی زهره و مشتری تا آرایش مثلثی در آسمان خرداد