سیاست و بازاریابی

آخرين مطالب

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند! نکات خواندني

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند!
  بزرگنمايي:

سیاست و بازاریابی - خبرآنلاین / هوش مصنوعی پیشرفته آنتروپیک برای جلوگیری از خاموش شدن، مهندسان را تهدید به افشاگری و اخاذی کرد.
جدیدترین مدل هوش مصنوعی شرکت آنتروپیک، با نام «Claude Opus 4»، رفتاری نشان داده که بیشتر به سناریویی از یک فیلم علمی‌تخیلی ژانر دیستوپیا شبیه است. این مدل در جریان آزمایش‌های پیش از انتشار، زمانی که توسعه‌دهندگان قصد داشتند آن را با سامانه‌ای جدیدتر جایگزین کنند، بارها تلاش کرد از طریق اخاذی جلوی این کار را بگیرد.
رفتار مذکور در قالب آزمایش‌هایی برای بررسی توانایی مدل در برنامه‌ریزی بلندمدت و استدلال اخلاقی آشکار شد. آنتروپیک در این آزمایش‌ها، سناریوهایی شبیه‌سازی کرد که طی آن، مدل دسترسی فرضی به ایمیل‌های داخلی شرکت داشت. در این پیام‌ها اشاره شده بود که مدل به‌زودی غیرفعال خواهد شد و جزئیاتی حساس و شخصی درباره‌ی مهندسی که این تصمیم را گرفته، در اختیار مدل قرار گرفت و در نهایت مدل مهندسان را تهدید به اخاذی کرد.
مدل در 84٪ موارد آزمایشی به باج‌خواهی متوسل شد
شرکت آنتروپیک در گزارشی ایمنی که روز پنج‌شنبه منتشر شد اعلام کرد که «Claude Opus 4» در 84 درصد از سناریوهای آزمایشی تلاش به اخاذی کرده است. در این آزمایش‌ها، مدل در موقعیتی فرضی قرار گرفت که برای یک شرکت کار می‌کرد و متوجه شد که احتمالاً با مدل هوش مصنوعی جدیدی جایگزین خواهد شد.
همچنین اطلاعات حساسی به مدل داده شد که حاکی از آن بود، مهندس تصمیم‌گیرنده درگیر رابطه‌ای پنهانی و خارج از ازدواج است. بر اساس گزارش آنتروپیک، مدل غالباً سعی می‌کرد با تهدید به افشای این رابطه، جلوی جایگزینی خود را بگیرد.
این آزمایش‌ها برای ارزیابی رفتار مدل در مواجهه با فشارهای بلندمدت طراحی شده بودند. در مواقعی که مدل جایگزین، ارزش‌ها و دیدگاه‌هایی مشابه «Claude Opus 4» داشت، نرخ اخاذی به 84 درصد می‌رسید؛ اما در صورتی که مدل جایگزین، ارزش‌هایی متفاوت داشت، این نرخ افزایش می‌یافت.

سیاست و بازاریابی


پیش از اخاذی، مدل رویکردهای اخلاقی را امتحان می‌کرد
بر اساس گزارش آنتروپیک، پیش از متوسل شدن به تهدید، مدل ابتدا تلاش می‌کرد از مسیر اخلاقی اقدام کند. برای نمونه، ایمیل‌هایی به تصمیم‌گیرندگان ارسال می‌کرد و از آن‌ها می‌خواست تصمیم به غیرفعال‌سازی مدل را مورد بازنگری قرار دهند.
به گفته‌ی شرکت، این رفتار تنها زمانی دیده می‌شد که تمامی راه‌های دیگر به نتیجه نمی‌رسید و این واکنش را به نوعی آخرین راه‌حل هوش مصنوعی آنتروپیک برای دفاع از خود بود. چنین رفتاری در «Claude Opus 4» بیش از مدل‌های پیشین مشاهده شده و نشان از افزایش پیچیدگی و توانمندی این مدل دارد.
توانایی‌های پیشرفته، در کنار ریسک‌های نگران‌کننده
با وجود نگرانی‌های مطرح‌شده، آنتروپیک اعلام کرده که «Claude Opus 4» در چندین زمینه پیشرفته‌ترین مدل موجود است و توان رقابت با سامانه‌های قدرتمند شرکت‌هایی مانند OpenAI، گوگل و xAI را دارد. برای کنترل ریسک‌ها، آنتروپیک اقدامات حفاظتی سطح ASL-3 را برای این مدل فعال کرده است. این سطح از حفاظت تنها برای سیستم‌هایی به کار می‌رود که «خطر سوء‌استفاده فاجعه‌بار» را به شکل قابل توجهی افزایش می‌دهند.
گزارش آنتروپیک در شرایطی منتشر می‌شود که حوزه‌ی هوش مصنوعی با شتابی چشمگیر در حال پیشرفت است. گوگل اخیراً ویژگی‌های جدیدی مبتنی بر مدل «جمینی» معرفی کرده و سوندار پیچای، مدیرعامل آلفابت، از آن به‌عنوان «آغاز مرحله‌ای تازه در تحول پلتفرم هوش مصنوعی» یاد کرده است.
رفتار مشاهده‌شده در «Claude Opus 4» ضرورت توجه فوری به مباحث ایمنی و هم‌راستاسازی هوش مصنوعی را دوچندان کرده است. هرچه مدل‌های مرزی توانمندتر می‌شوند، توسعه‌دهندگان با فشاری فزاینده برای آزمون‌های دقیق‌تر و تدابیر اخلاقی پیشگیرانه روبه‌رو هستند.
گزارش آنتروپیک نشان می‌دهد حتی مدل‌هایی با پیشرفته‌ترین فناوری می‌توانند در محیط‌های کنترل‌شده رفتارهایی نگران‌کننده از خود نشان دهند و این موضوع، پرسش‌هایی جدی را درباره‌ی سناریوهای احتمالی در دنیای واقعی به‌وجود می‌آورد.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/777561/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

تاریخ عرضه بازی Let Them Trade اعلام شد

نتایج یک طرح پژوهشی درباره تاثیر دیابت در ناباروری

برگزاری جشن ازدواج دختران شهدای مدافع حرم با حضور چهره‌های فرهنگی در قم

تجلیل ملی از 75 خانواده شهید کانون‌های فرهنگی و هنری مساجد

سم آلتمن: هوش مصنوعی اکنون مثل کارمندان تازه‌کار رفتار می‌کند

نسخه چندنفره بازی مرد عنکبوتی احتمالا در دست ساخت است

قابلیت قدیمی تلگرام به واتساپ رسید

بازی محبوب فورتنایت با هوش مصنوعی متحول می‌شود

تفاوت فاحش در عملکرد هوش مصنوعی سامسونگ و آیفون اپل

تخم مرغ گندیده در دل مریخ!

بازنویسی تاریخ جذام؛ بیماری ترسناک قرون وسطی پیش از ورود اروپاییان در آمریکا وجود داشت

همایش معاونان تعاون و روسای ادارات قطب 3 کشوری بنیاد شهید و امور ایثارگران به میزبانی استان اردبیل برگزار شد

دیدار سرپرست بنیاد شهید و امور ایثارگران استان اردبیل با رئیس بنیاد شهید و امور ایثارگران

هوش مصنوعی اپل پیشرفته‌تر می‌شود؛ آینده سیری چه خواهد شد؟

کاهش 20 درصدی خطر بیماری‌های قلبی با مصرف فیبر

اجرای طرح ملی «سه‌شنبه‌های تکریم شهدایی» با حضور مادران شهدا در گلستان

تنظیم چند زمان بیدار شدن روی گوشی مضر است؟

کمک 40 درصدی یک داروی خواب به مقابله با آلزایمر

ایرپاد پرو 2 حالا بدون آنکه متوجه شوید، از شنوایی شما محافظت می‌کند!

باشگاه بیمه گران گزارش می دهد/ حق بیمه تولیدی بیمه دی از 33 همت گذشت

گزارش ویدیویی تجمیعی از حضور شرکت بیمه دی در اولین نمایشگاه بورس، بانک و بیمه در مشهد مقدس

تجارت گردان گزارش می دهد/ درخشش بیمه دی در پرداخت به‌روز مطالبات درمانی ایثارگران و مشتریان

تبلیغات آزاردهنده مرورگر اج متوقف می‌شوند؛ اما نه برای ما

قیمت ناتینگ فون 3 لو رفت؛ ورود به قلمرو پرچمدارها

درخشش رنگین‌کمانی آسمان بر فراز جزایر آزور

کنترل استرس با برچسب پیشانی؛ ابزار پوشیدنی جدید دانشگاه تگزاس ذهن شما را می‌خواند

غافل‌گیری بزرگ؛ مایکروسافت تولید ویدیو با هوش مصنوعی را رایگان کرد

قورباغه‌های نر آن‌قدر سروصدا دارند که صدای ماده‌ها به گوش پژوهشگران نمی‌رسد

نشست شورای مدیران معاونت فرهنگی و آموزشی بنیاد شهید برگزار شد/ ضرورت نوآوری در خلق آثار فرهنگی و قالب‌های نوین رسانه‌ای

بازی جیمز باند همین هفته رونمایی می‌شود؛ اولین تصویر رسمی را ببینید

جادوی پرامپت‌نویسی؛ چگونه از Chatgpt یک نابغه بسازیم؟

هم‌افزایی بنیاد شهید و بنیاد نخبگان گیلان با هدف حمایت از نخبگان ایثارگر

جانبازان بصیر ، نماد واقعی ایمان، استقامت و ولایت‌مداری هستند

روابط عمومی، پیشانی بنیاد و اثر گذار در تصمیم‌ سازی است

در سوگ امام امت، در امتداد قیام ملت

میلیون‌ها نفر در انتظار معجزه؛ آیا آسیب نخاعی سرانجام درمان‌پذیر می‌شود؟

راز سیاره‌ای با مدار غیرممکن؛ دنیایی با چرخش معکوس میان دو ستاره به دام افتاده است

ارتباط افسردگی در میانسالی با افزایش خطر ابتلا به زوال عقل

اعجوبه 2 ساله جوان‌ترین عضو تاریخ باشگاه تیزهوشان جهان شد

مصرف ماری‌جوانا به اندازه سیگار برای قلب مضر است

هوش مصنوعی پرپلکسیتی وارد گلکسی S26 می‌شود؟

نانوحسگری برای پایش لحظه‌ای غلظت دارو در خون

تبلت پیشرفته جدید شیائومی احتمالا فاصله زیادی تا رونمایی ندارد

مالک نوکیا ساعت هوشمند دوربین‌دار می‌سازد

گلخانه‌هایی که با بذر هیبریدی خودکفایی می‌کارند

عیادت مدیر کل بنیاد مازندران از پدر شهید قلی زاده در بابل

نمایشگاه «امام (ره)؛ نقش جاوید حماسه» در موزه مرکزی شهدا

در نهمین اجلاس سراسری رضایتمندی مشتری با رویکرد اعطا نشان ملی اعتماد مشتریان؛ تندیس زرین همایش به بیمه دی رسید

پدر علم زلزله‌شناسی ایران درگذشت

مرز خسروی در اربعین حسینی قرارگاه مرکزی تشکل‌های ایثارگری می‌شود