سیاست و بازاریابی

آخرين مطالب

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند! نکات خواندني

اخاذی هوش مصنوعی از مهندسی که می‌خواست خاموشش کند!
  بزرگنمايي:

سیاست و بازاریابی - خبرآنلاین / هوش مصنوعی پیشرفته آنتروپیک برای جلوگیری از خاموش شدن، مهندسان را تهدید به افشاگری و اخاذی کرد.
جدیدترین مدل هوش مصنوعی شرکت آنتروپیک، با نام «Claude Opus 4»، رفتاری نشان داده که بیشتر به سناریویی از یک فیلم علمی‌تخیلی ژانر دیستوپیا شبیه است. این مدل در جریان آزمایش‌های پیش از انتشار، زمانی که توسعه‌دهندگان قصد داشتند آن را با سامانه‌ای جدیدتر جایگزین کنند، بارها تلاش کرد از طریق اخاذی جلوی این کار را بگیرد.
رفتار مذکور در قالب آزمایش‌هایی برای بررسی توانایی مدل در برنامه‌ریزی بلندمدت و استدلال اخلاقی آشکار شد. آنتروپیک در این آزمایش‌ها، سناریوهایی شبیه‌سازی کرد که طی آن، مدل دسترسی فرضی به ایمیل‌های داخلی شرکت داشت. در این پیام‌ها اشاره شده بود که مدل به‌زودی غیرفعال خواهد شد و جزئیاتی حساس و شخصی درباره‌ی مهندسی که این تصمیم را گرفته، در اختیار مدل قرار گرفت و در نهایت مدل مهندسان را تهدید به اخاذی کرد.
مدل در 84٪ موارد آزمایشی به باج‌خواهی متوسل شد
شرکت آنتروپیک در گزارشی ایمنی که روز پنج‌شنبه منتشر شد اعلام کرد که «Claude Opus 4» در 84 درصد از سناریوهای آزمایشی تلاش به اخاذی کرده است. در این آزمایش‌ها، مدل در موقعیتی فرضی قرار گرفت که برای یک شرکت کار می‌کرد و متوجه شد که احتمالاً با مدل هوش مصنوعی جدیدی جایگزین خواهد شد.
همچنین اطلاعات حساسی به مدل داده شد که حاکی از آن بود، مهندس تصمیم‌گیرنده درگیر رابطه‌ای پنهانی و خارج از ازدواج است. بر اساس گزارش آنتروپیک، مدل غالباً سعی می‌کرد با تهدید به افشای این رابطه، جلوی جایگزینی خود را بگیرد.
این آزمایش‌ها برای ارزیابی رفتار مدل در مواجهه با فشارهای بلندمدت طراحی شده بودند. در مواقعی که مدل جایگزین، ارزش‌ها و دیدگاه‌هایی مشابه «Claude Opus 4» داشت، نرخ اخاذی به 84 درصد می‌رسید؛ اما در صورتی که مدل جایگزین، ارزش‌هایی متفاوت داشت، این نرخ افزایش می‌یافت.

سیاست و بازاریابی


پیش از اخاذی، مدل رویکردهای اخلاقی را امتحان می‌کرد
بر اساس گزارش آنتروپیک، پیش از متوسل شدن به تهدید، مدل ابتدا تلاش می‌کرد از مسیر اخلاقی اقدام کند. برای نمونه، ایمیل‌هایی به تصمیم‌گیرندگان ارسال می‌کرد و از آن‌ها می‌خواست تصمیم به غیرفعال‌سازی مدل را مورد بازنگری قرار دهند.
به گفته‌ی شرکت، این رفتار تنها زمانی دیده می‌شد که تمامی راه‌های دیگر به نتیجه نمی‌رسید و این واکنش را به نوعی آخرین راه‌حل هوش مصنوعی آنتروپیک برای دفاع از خود بود. چنین رفتاری در «Claude Opus 4» بیش از مدل‌های پیشین مشاهده شده و نشان از افزایش پیچیدگی و توانمندی این مدل دارد.
توانایی‌های پیشرفته، در کنار ریسک‌های نگران‌کننده
با وجود نگرانی‌های مطرح‌شده، آنتروپیک اعلام کرده که «Claude Opus 4» در چندین زمینه پیشرفته‌ترین مدل موجود است و توان رقابت با سامانه‌های قدرتمند شرکت‌هایی مانند OpenAI، گوگل و xAI را دارد. برای کنترل ریسک‌ها، آنتروپیک اقدامات حفاظتی سطح ASL-3 را برای این مدل فعال کرده است. این سطح از حفاظت تنها برای سیستم‌هایی به کار می‌رود که «خطر سوء‌استفاده فاجعه‌بار» را به شکل قابل توجهی افزایش می‌دهند.
گزارش آنتروپیک در شرایطی منتشر می‌شود که حوزه‌ی هوش مصنوعی با شتابی چشمگیر در حال پیشرفت است. گوگل اخیراً ویژگی‌های جدیدی مبتنی بر مدل «جمینی» معرفی کرده و سوندار پیچای، مدیرعامل آلفابت، از آن به‌عنوان «آغاز مرحله‌ای تازه در تحول پلتفرم هوش مصنوعی» یاد کرده است.
رفتار مشاهده‌شده در «Claude Opus 4» ضرورت توجه فوری به مباحث ایمنی و هم‌راستاسازی هوش مصنوعی را دوچندان کرده است. هرچه مدل‌های مرزی توانمندتر می‌شوند، توسعه‌دهندگان با فشاری فزاینده برای آزمون‌های دقیق‌تر و تدابیر اخلاقی پیشگیرانه روبه‌رو هستند.
گزارش آنتروپیک نشان می‌دهد حتی مدل‌هایی با پیشرفته‌ترین فناوری می‌توانند در محیط‌های کنترل‌شده رفتارهایی نگران‌کننده از خود نشان دهند و این موضوع، پرسش‌هایی جدی را درباره‌ی سناریوهای احتمالی در دنیای واقعی به‌وجود می‌آورد.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/777561/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

هوش مصنوعی پرپلکسیتی وارد گلکسی S26 می‌شود؟

نانوحسگری برای پایش لحظه‌ای غلظت دارو در خون

تبلت پیشرفته جدید شیائومی احتمالا فاصله زیادی تا رونمایی ندارد

مالک نوکیا ساعت هوشمند دوربین‌دار می‌سازد

گلخانه‌هایی که با بذر هیبریدی خودکفایی می‌کارند

عیادت مدیر کل بنیاد مازندران از پدر شهید قلی زاده در بابل

نمایشگاه «امام (ره)؛ نقش جاوید حماسه» در موزه مرکزی شهدا

در نهمین اجلاس سراسری رضایتمندی مشتری با رویکرد اعطا نشان ملی اعتماد مشتریان؛ تندیس زرین همایش به بیمه دی رسید

پدر علم زلزله‌شناسی ایران درگذشت

مرز خسروی در اربعین حسینی قرارگاه مرکزی تشکل‌های ایثارگری می‌شود

حل مشکل اشتغال و تبدیل وضعیت 12 هزار فرزند شهید و جانباز/ حذف ضامن از تسهیلات ایثارگری

زیرمجموعه روسی مایکروسافت در آستانه ورشکستگی است

فراخوان بنیاد ملی علم ایران برای اعطای کرسی پژوهشی

کشف شواهد جدیدی از منشاء سیاهچاله‌های متوسط

پیام تسلیت رییس بنیاد شهید و امور ایثارگران در پی درگذشت مادر شهیدان معظم «ابدام»

ایکس‌چت ایلان ماسک با رمزنگاری «به‌سبک بیت‌کوین» آپدیت می‌شود

رقیب جدی گلکسی زد فولد؛ بزرگ‌ترین باتری گوشی‌های تاشدنی وارد آنر مجیک V5 می‌شود

نمایشگاه «هنر خدمت» به مناسبت گرامیداشت سالروز شهدای خدمت برگزار می‌شود

این «پیکو-مک-نانو» است؛ بازسازی مکینتاش اپل در ابعاد بسیار کوچک!

چرا بیماری‌ها در مردان و زنان متفاوت است؟

گوشی تاشو جدید ویوو ارزان‌تر از مدل قبلی خواهد بود؟

آیا انسان‌ها تا سال 2029 در زمان به عقب بازمی‌گردند؟

جذب 100 درصدی تسهیلات مسکن جامعه ایثارگران در استان ایلام

نشست شورای مدیران معاون فرهنگی و آموزشی بنیاد شهید برگزار شد/ ضرورت نوآوری در خلق آثار فرهنگی و قالب‌های نوین رسانه‌ای

جرم فضایی مرموز هر 44 دقیقه یک‌بار به زمین سیگنال می‌فرستد

دیدار مدیرکل بنیاد گلستان به همراه نماینده مردم شرق استان با خانواده شهید عبدالله حدادی در گالیکش

دیدار مدیرکل بنیاد شهید گلستان با جانباز 70 درصد یوسف قزلسفلو در مینودشت

هوش مصنوعی، «بازرس» می‌شود!

مدیرکل بنیاد شهید استان در ادامه سفر به مینودشت با جانباز 60 درصد پاسدار الیاسی دیدار کرد

شایعه‌های جدید آیفون 17؛ از تغییرات حفره کپسولی نمایشگر تا پردازنده A18

آیا واقعا می‌توان ذهن انسان را در رایانه ریخت؟

لایواستریم عمودی به توییچ می‌آید

گوشی پرچمدار جدید هواوی چه زمانی معرفی می‌شود؟

چرا قلقلک باعث خنده ما می‌شود؟

راز تیم کوک برای تسلط بر گفت‌وگوها؛ 5 واژه طلایی

معمای نحوه نابودی جو مریخ حل شد

هیولای جدید AMD در راه است

پیروزی مهم اینتل؛ نبرد 3 میلیارد دلاری پتنت‌ها با VLSI به‌نفع آبی‌ها تمام شد

غروب خورشید پشت ناقوس کلیسا

گوشی پیکسل 10 گوگل زودتر از انتظار معرفی می‌شود؟

آسمان به افتخار این دانشمند درخشید

گوگل بی‌سروصدا اپلیکیشن جدیدی برای اجرای آفلاین مدل‌های هوش مصنوعی منتشر کرد

اپل واچ‌های جدید چه زمانی وارد بازار می‌شوند؟

درخشش ناهید در آسمان بامدادی 11 خرداد/همنشینی دیدنی «بهرام» و «ماه» در شامگاه یکشنبه

عکس «تلسکوپ فضایی هابل» از یک نبرد کهکشانی

سازنده بازی Borderlands 4 مجبور به عذرخواهی مجدد از طرفداران شد

تلویزیون مینی LED جدید TCL با پنل 144 هرتزی مخصوص گیمرها است

خورشید درحال نابود کردن ماهواره‌های استارلینک است

واتساپ فردا روی این گوشی‌های آیفون از کار می‌افتد

کشف جمجمه ای عجیب در کره؛ نشانه‌ای از تمدنی گمشده یا موجوداتی از دنیای دیگر؟