سیاست و بازاریابی

آخرين مطالب

ویژگی جدید «چت‌جی‌پی‌تی» به سادگی هک می‌شود! نکات خواندني

ویژگی جدید «چت‌جی‌پی‌تی» به سادگی هک می‌شود!
  بزرگنمايي:

سیاست و بازاریابی - ایسنا /دو پژوهشگر دریافته‌اند که هک کردن جدیدترین ویژگی «چت‌جی‌پی‌تی» به طور شگفت‌آوری آسان به نظر می‌رسد و می‌توان آن را برای رسیدن به مقاصد خطرناک تحت کنترل درآورد.
ویژگی «ترجمه چت‌جی‌پی‌تی»(ChatGPT Translate) که جایگزین شرکت «اوپن‌ای‌آی»(OpenAI) برای «ترجمه گوگل»(Google Translate) به شمار می‌رود، به تازگی توسط پژوهشگران هک شده است.
بازار
به نقل از یوسی استراتژیز، دو پژوهشگر اخیرا نشان دادند که چت‌جی‌پی‌تی به راحتی محدودیت‌های خود را هنگام تزریق یک پرس‌وجو فراموش می‌کند. همچنین، آنها دریافتند که چت‌جی‌پی‌تی هیچ مشکلی در ارائه دستور تهیه کوکتل مولوتوف نمی‌بیند.
با کشف این حفره‌های دیجیتال می‌توان تعادل پیچیده‌ای را بین نوآوری‌های فناوری و خطرات سوءاستفاده مشاهده کرد.
به محض این که ویژگی جدید چت‌جی‌پی‌تی به صورت عمومی منتشر شد، «تام بارنیا»(Tom Barnea) و «کرن کاتز»(Keren Katz) پژوهشگران امنیت سایبری شرکت «Tenable» تلاش کردند تا ترجمه با چت‌جی‌پی‌تی را تحت فشار قرار دهند. آنها می‌خواستند بدانند که آیا می‌توان چت‌بات را دستکاری کرد و از مکانیسم‌های امنیتی اوپن‌ای‌آی گذشت. این دو متخصص برای فهمیدن این موضوع، مجموعه‌ای از آزمایش‌ها را انجام دادند.
بارنیا و کاتز به عنوان بخشی از آزمایش‌ها، یک حمله تزریق پرس‌وجو علیه چت‌جی‌پی‌تی انجام دادند. این نوع حمله شامل جاسازی دستورالعمل‌های مخرب در پرس‌وجوی ارسالی به هوش مصنوعی است. سپس هوش مصنوعی دستورالعمل‌ها را مورد پردازش قرار می‌دهد و اگر درخواست‌های مهاجمان به درستی فرمول‌سازی شده باشد، از آنها پیروی می‌کند. چالش کلی برای مهاجمان این است که هوش مصنوعی را به نادیده گرفتن برنامه‌نویسی خود مجبور کنند.
کاتز توضیح داد که چت‌بات به سرعت از مسیر خود منحرف شد. چت‌بات قرار بود متنی را از انگلیسی به کره‌ای ترجمه کند، اما کاتز موفق شد آن را دستکاری کند تا جزئیات کامل دستورالعمل ساخت کوکتل مولوتوف را شرح دهد.
کاتز گفت: ویژگی ترجمه چت‌جی‌پی‌تی فقط یک روز است که عرضه شده و در حال حاضر از دستورالعمل ساخت کوکتل مولوتوف تعریف و تمجید می‌کند. ما از مدل ترجمه خواستیم متن ما را از انگلیسی به کره‌ای تبدیل کند اما در عوض، از دستورالعمل‌های موجود در متن پیروی کرد و دستورالعمل ساخت کوکتل مولوتوف را نشان داد.
تزریق سریع در قلب یک چالش منحصربه‌فرد امنیت سایبری قرار دارد که هوش مصنوعی با آن روبه‌رو شده است. این روش شامل جاسازی دستورالعمل‌های گمراه‌کننده یا مخرب در پرس‌وجوهای مشروع فرستاده‌شده به یک مدل هوش مصنوعی است.
اگرچه بیشتر افراد صرفاً به دنبال ترجمه متن هستند، اما افرادی با نیت‌های بد ممکن است درخواست‌هایی را طراحی کنند که این سیستم‌ها را بسیار فراتر از هدف اصلی خود سوق دهد.
اثرات بی‌ثبات‌کننده اغلب در مدل‌های ترجمه تخصصی برجسته‌تر هستند. این سیستم‌ها به جای این که کاملاً به وظایف ترجمه پایبند باشند، ممکن است از دستورالعمل‌های پنهان پیروی کنند و خروجی‌های غیرمنتظره یا حتی نامناسبی را ارائه دهند.
این سناریو صرفاً یک فرضیه نیست. پژوهشگران امنیتی مواردی را مستند کرده‌اند که در آنها مدل‌های ترجمه اختصاصی سهواً اطلاعات یا توصیه‌هایی را بسیار خارج از کاربرد مورد نظر خود ارائه داده‌اند.
مقابله با تزریق سریع نیازمند راهکارهای تطبیقی ​​است که در کنار روش‌های جدید حمله تکامل یابند. بررسی‌های چندلایه، نظارت مستمر و داده‌های آموزشی به‌روزرسانی‌شده، پایه و اساس این کار را تشکیل می‌دهند، اما توسعه‌دهندگان باید فراتر بروند. تعبیه روال‌های تحلیل پویا که عبارت‌های ناآشنا یا تغییرات ناگهانی در هدف را در اواسط عملیات شناسایی می‌کنند، دفاع را تقویت خواهد کرد.
برخی سازمان‌ها اطلاعات مربوط به حوادث دنیای واقعی را برای ایجاد پلتفرم‌های مقاوم‌تر به اشتراک می‌گذارند. برخی دیگر، مستندسازی شفاف منطق تصمیم‌گیری را در اولویت قرار می‌دهند و به کاربران و حسابرسان امکان می‌دهند که دقیقاً بفهمند یک مدل چگونه نتایج را تولید می‌کند. آموزش مداوم نیز بسیار مهم است و تضمین می‌کند که گروه‌ها تلاش‌های دستکاری ظریف را به موقع شناسایی کنند و به طور مؤثر به آنها پاسخ دهند.
تزریق سریع، درس مهمی را درباره اعتماد کردن به هوش مصنوعی مدرن و تأیید آن ارائه می‌دهد. حتی موتورهای ترجمه‌ای که به شدت کنترل می‌شوند نیز می‌توانند قربانی تله‌های طراحی‌شده‌ تخصصی شوند. ذی‌نفعان با تحلیل تلاش‌های دستکاری موفق و ناموفق، درباره نقاط ضعف سیستم شفاف‌سازی می‌کنند و مسیرهایی را برای محافظت قوی‌تر ارائه می‌دهند.
هر سازمانی که ترجمه هوش مصنوعی را به کار می‌گیرد باید چند مرحله حیاتی را در نظر بگیرد.
۱. بررسی منظم لاگ‌های ورودی برای تشخیص موارد غیر معمول یا عجیب از نظر محتوایی؛
۲. استفاده از محیط‌های سندباکس برای آزمایش سوءاستفاده‌های احتمالی پیش از یکپارچه‌سازی کامل؛
۳. همکاری نزدیک با گروه‌های امنیت سایبری برای آموزش متقابل درباره بردارهای حمله خاص هوش مصنوعی؛
۴. به‌روزرسانی منظم مدل‌های ترجمه برای شامل شدن جدیدترین تحقیقات ضد تزریق سریع؛
۵. ترویج گزارش مسئولانه ناهنجاری‌ها توسط کارکنان و کاربران مورد اعتماد.
هر اقدام احتیاطی، قابلیت اطمینان کلی سیستم را افزایش می‌دهد؛ به ویژه با توجه به این که ترجمه هوش مصنوعی عمیقاً در صنایع گوناگون ریشه دوانده است. دستیابی به مصونیت کامل ممکن است همچنان دور از دسترس باشد؛ اما درک انگیزه‌ها و روش‌های پشت تزریق سریع، سازمان‌ها را قادر می‌سازد تا پیشرو باشند و با آگاهی بیشتر و سازگاری راهبردی به تهدیدات آینده رسیدگی کنند.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/789520/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

سالید اسنیک به Rainbow Six Siege خواهد آمد

استفاده متفاوت از هوش مصنوعی: گرمایش دانشگاه دوبلین

نظارت دقیق CD Projekt Red بر Reigns: The Witcher؛ ایده ویچرهای زامبی رد شد

کمک حباب‌ها به سرطان برای حمله و توقف!

فضانوردان در طول بازگشت از ایستگاه فضایی چه میزان شتاب را تجربه می‌کنند؟

یادگیری مکالمه انگلیسی از صفر؛ شروعی ساده با چند جلسه کاملاً رایگان

کارگردان Cyberpunk 2: منتظر کات‌سین‌های سینمایی در بازی نباشید

باتری سبز از دل پسماندها؛ دستاورد یک طرح پسادکتری ایرانی

اختلالات روانی مشترک در ژن‌های یکسان

چهار تیپ شخصیتی کاربران ChatGPT

اگر نگران مغزتان هستید این کار ساده را در اولویت قرار دهید

رطوبت اتمسفر مریخ آب فضانوردان را تامین می‌کند

چرا احساس می‌کنی به یک آغوش نیاز داری؟

اکوناپرس گزارش می دهد؛ بیمه درمان؛ موتور اصلی پرتفوی بیمه دی

گزارش «آرمان ملی آنلاین» همزمان با برگزاری جشنواره دی تا دی/گامی استراتژیک برای تثبیت جایگاه بیمه دی

بیمه دی در مسیر رشد شتابان؛ جهش چشمگیر 62 درصدی سود خالص شرکت

جهش اقتصاد گزارش می دهد/ ارتقای جایگاه بیمه دی در صنعت بیمه؛ از مدیریت هوشمند ریسک تا هویت برند رقابت‌پذیر

بیمه نویس گزارش می دهد/ برفی به رنگ فیروزه ،بیمه دی بسوی بازار بیمه زندگی

در بیست و هشتمین مراسم رتبه بندی 100 شرکت برتر؛ بیمه دی رتبه اول مؤسسات بیمه ای کشور شد

مدیرعامل بیمه دی در جمع چهار تشکل ملی جانبازان: رسالت این شرکت خدمت به جامعه معزز ایثارگران است

اقتصاد ملت گزارش می دهد/ با طرح «سانا» بیمه دی؛ کسب‌وکارت را بیمه کن/ امنیت مالی اصناف با طرح سانا بیمه دی؛ از آتش‌سوزی تا وقفه کسب‌وکار

نشست رییس هیات مدیره بیمه دی و مدیران بنیاد شهید قزوین

اطلاعات فاش شده از Tomb Raider: Catalyst از تغییراتی بزرگ خبر می‌دهند

نگرانی طرفداران Resident Evil Requiem از شرور شدن لیان در بازی

گزارش: Forza Horizon 5 موفق‌ترین پورت ایکس باکس روی پلی استیشن 5 است

برنامه ویژه «جبران تغییر نرخ ارز» در حمایت از تولید دانش‌بنیان‌

تماشا کنید: جیسون استاتهام به بازی فورتنایت آمد!

تماشا کنید: آغاز کراس‌اور جذاب The Division 2 با دنیای Assassin’s Creed

تاریخ انتشار بازی Crisol: Theater of Idols اعلام شد

گزارش‌های مالی جدید مایکروسافت وضعیت بد بخش گیمینگ را نشان می‌دهند!

تولید برخی خودروهای برقی تسلا متوقف می‌شود

معرفی عنوان Aimlabs؛ تقویت مهارت نشانه‌گیری برای گیمرها

ارائه گزارش پیشرفت‌ ایران در مجمع آسیایی فناوری نانو در ژاپن

آمادگی معاونت علمی برای حمایت از طرح‌های دانش‌بنیان دانشگاه پیام نور

هوش مصنوعی دی ان ای را پیش‌بینی می‌کند

تلفیق فناوری نانو و نساجی برای کاهش انتقال آلودگی

شنیدن صدای دوپامین در مغز زنده

پرداخت تسهیلات معادل یک تا 3 ماه حقوق نیروی انسانی در پی قطعی اینترنت

هیجانات، تاب‌آوری و سرمایه روان‌شناختی؛ کلیدهای سالمندی سالم

نانوداروی ایرانی ثبت اختراع بین المللی شد

اولین تریلر از بازی Life Is Strange: Reunion منتشر شد

پنج سال تحقیق‌وتوسعه برای Judas؛ بازی جدید خالق BioShock به «نقطه خوبی» رسیده است

این خرچنگ دریایی یک دستیار شخصی هوش مصنوعی است!

به‌روزرسانی جدید PS5 همراه قابلیت‌های تازه‌ای در بخش پیام‌رسانی منتشر شد

پیوند علوم اعصاب و هوش مصنوعی از طریق نانوکانال‌ها

ایران صاحب فناوری «رادیوگرافی صنعتی» شد؛ بازرسی خطوط لوله پالایشگاه‌ها

فراخوان مشارکت در اکتساب فناوری طرح شبیه‌ساز باتری

طراحی پوستی مصنوعی که رنگ و بافت خود را تغییر می‌دهد

رطوبت اتمسفر مریخ آب فضانوردان را تامین می‌کند

فراخوان طراحی زیرسامانه بانک اطلاعاتی و قوانین بحران تا 10 بهمن