سیاست و بازاریابی

آخرين مطالب

هوش مصنوعی یا توهم مصنوعی؟ نتایج ناامیدکننده آزمایش ایجنت جدید ChatGPT نکات خواندني

هوش مصنوعی یا توهم مصنوعی؟ نتایج ناامیدکننده آزمایش ایجنت جدید ChatGPT
  بزرگنمايي:

سیاست و بازاریابی - گجت نیوز / آزمایش‌های گسترده ایجنت جدید ChatGPT نتایجی دور از انتظار را رقم زد. آیا این ابزار قدرتمند واقعا قابل اعتماد است یا با توهمات خود ما را به اشتباه می‌اندازد؟
بررسی‌های جامع و دقیق روی ابزار جدید OpenAI نشان می‌دهد که ایجنت جدید ChatGPT علی‌رغم توانایی‌های بالقوه، هنوز فاصله زیادی تا تبدیل شدن به یک دستیار قابل اعتماد دارد و در بسیاری از موارد، حقایق جایگزین و اطلاعات نادرست تولید می‌کند. این ابزار که قرار است ترکیبی از تحقیق عمیق و اجرای دستورات در محیط کامپیوتر باشد، در عمل با چالش‌های جدی روبرو است.
بازار
دیوید گیرویتز، نویسنده ارشد وب‌سایت ZDNET، در یک گزارش مفصل، تجربه خود از کار با این ایجنت را به اشتراک گذاشته است. او برای این آزمایش، اشتراک حرفه‌ای 200 دلاری OpenAI را تهیه کرد تا بتواند قابلیت‌های این مدل را به چالش بکشد. نتایج کلی این آزمایش‌ها نشان می‌دهد که اگرچه ChatGPT درک درستی از صورت مسئله دارد، اما در اکثر موارد خروجی‌های آن غیرقابل استفاده و مملو از خطا هستند.
عملکرد کلی ایجنت جدید ChatGPT چگونه بود؟
در نگاه اول، این ابزار بسیار قدرتمند به نظر می‌رسد. ایجنت جدید ChatGPT می‌تواند پنجره‌ها را باز کند، روی عناصر مختلف کلیک کند و وظایف مشخصی را انجام دهد. با این حال، آزمایش‌های متعدد نشان داد که این ابزار محدودیت‌های قابل توجهی دارد. برای مثال، در پروژه‌های بزرگ و تحلیل داده‌های حجیم با مشکل مواجه می‌شود و حتی نمی‌تواند صفحات وب طولانی را به درستی اسکرول کند.
یکی از مشکلات اصلی، توهم یا Hallucination هوش مصنوعی است. این مدل گاهی اطلاعاتی را با اطمینان کامل ارائه می‌دهد که هیچ پایه و اساس واقعی ندارند. این موضوع به ویژه زمانی نگران‌کننده می‌شود که کاربران بخواهند از خروجی‌های آن برای مقاصد حرفه‌ای استفاده کنند. نویسنده گزارش تاکید می‌کند که بدون بررسی و اعتبارسنجی دقیق، اعتماد به داده‌های این ایجنت می‌تواند بسیار پرخطر باشد.شکست در وظایف ساده و موفقیت در یک چالش پیچیده
گیرویتز هشت آزمون مختلف را برای ارزیابی عملکرد ایجنت طراحی کرد. در یکی از این آزمون‌ها، از ایجنت خواسته شد تا ابزارهای لازم برای ساخت کابل شبکه را از وب‌سایت آمازون پیدا کند. اگرچه مدل توانست یک کیت اقتصادی و مناسب را پیشنهاد دهد، اما لینک‌های ارائه شده برای محصولات گران‌تر همگی نامعتبر و ساختگی بودند. این نشان می‌دهد که ایجنت توانایی اعتبارسنجی منابع خود را ندارد.
در آزمون دیگری، از ایجنت خواسته شد تا یک اسلاید پاورپوینت را بر اساس داده‌های جدید ویرایش کند. مدل توانست داده جدید را به نمودار اضافه کند، اما کیفیت گرافیکی، فونت‌ها و چینش عناصر کاملا به هم ریخته بود. این نتایج نشان می‌دهد که ابزار هنوز برای تولید محتوای بصری حرفه‌ای آماده نیست.
با این حال، همه چیز ناامیدکننده نبود. در آخرین آزمون، از ایجنت خواسته شد تا قوانین ساختمانی مربوط به نصب یک حصار را در یک منطقه مشخص تحلیل کند. در کمال شگفتی، ایجنت جدید ChatGPT در عرض تنها چهار دقیقه، یک تحلیل دقیق و صحیح همراه با نمودارهای کاربردی ارائه داد. این خروجی آنقدر باکیفیت بود که می‌توانست مستقیما برای مراحل بعدی پروژه مورد استفاده قرار گیرد. این موفقیت نشان‌دهنده پتانسیل بالای این فناوری در صورت توسعه و بهبود است.آیا می‌توان به این دستیار هوشمند اعتماد کرد؟
پاسخ کوتاه، خیر است. حداقل نه در حال حاضر. عملکرد این ابزار بیشتر شبیه یک دستیار بی‌تجربه و غیرقابل پیش‌بینی است که گاهی درخشان عمل می‌کند و گاهی نتایج کاملا اشتباه تحویل می‌دهد. این فناوری بدون شک آینده هیجان‌انگیزی را نوید می‌دهد، اما در وضعیت فعلی، نمی‌تواند جایگزین یک نیروی انسانی متخصص و قابل اعتماد شود.
کاربران باید با احتیاط فراوان از این ابزار استفاده کنند و هرگز خروجی‌های آن را بدون بررسی مجدد، مبنای تصمیم‌گیری‌های مهم خود قرار ندهند. به نظر می‌رسد باید منتظر بمانیم تا ببینیم OpenAI چگونه بر این چالش‌ها غلبه خواهد کرد و آیا نسل‌های بعدی این ایجنت‌ها می‌توانند به سطح قابل قبولی از اطمینان و دقت برسند یا خیر.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/781522/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

گوشی ارزان جدید شیائومی نمایشگر غول‌پیکر و باتری بسیار بزرگ دارد

تاسیس جایزه «نوبل فضا» به نام «نیل آرمسترانگ»

آیفون‌های جدید 66 درصد سریعتر شارژ می‌شوند

توسعه یک هوش مصنوعی برای خواندن کتیبه‌های باستانی

تحولی در صنعت؛ چگونه از فناوری نانو بهره ببریم؟

سامسونگ ضعف بزرگ گلکسی S25 اج را برطرف می‌کند؟

کشف جمجمه‌ای بدون دهان و با شش حفره در بلغارستان؛ نشانه از موجودات فضایی در زمین

خطر نابودی پلتفرم‌های مستقل در صورت تصویب یک سند

افشای تاریخ عرضه بتلفیلد 6؛ قیمت بازی چقدر خواهد بود؟

فقط 1280 انسان باقی ماندند؛ زمانی که بشر در آستانه انقراض قرار گرفت

فروش 1٫6 میلیون دستگاه در یک ماه؛ کنسول بازی ژاپنی‌ها رکورد شکست

مدت زمان خواب زنان در مقابل خواب مردان؛ تفاوت‌های علمی و واقعی چقدر است؟

تصاویر رقیب گلکسی زد فولد 7 لو رفت؛ رونمایی در آینده نزدیک

این قاب عجیب برای آیفون، پورت قدیمی لایتنینگ را به USB-C تبدیل می‌کند

منظومه شمسی کی و چگونه خواهد مرد؟

تاکید بر نقش حیاتی نخبگان ایثارگری در عبور کشور از "جنگ ترکیبی"

این گوشی چینی با بدنه مقاوم، امکانات مناسبی دارد

فناوری جدید کره جنوبی برای جلوگیری از انفجار باتری لیتیومی

مادر شهیدان والامقام «بی باک» از قائم شهر مازندران آسمانی شد

اپل‌کر وان معرفی شد؛ گارانتی همزمان 3 دستگاه با اشتراک ماهانه

ورزش عصرگاهی، امیدی تازه‌ برای کاهش افسردگی در سالمندان

این گوشی ارزان با باتری پرظرفیت برای کارهای روزمره مناسب است

تلاقی اینترنت کوانتومی با فضا-زمان در یک ایده مبتکرانه

تعداد بازیکنان Rematch از 5 میلیون نفر عبور کرد

«مبارزه با آلزایمر» با داروهای تایید شده سرطان

کولر جدید ناسا برای سفر به مریخ

گزارش: سرمایه‌گذاری باورنکردنی EA روی بازی Battlefield 6

پیشگامان واقعی؛ وویجرها نخستین کاوشگران مرزهای منظومه شمسی نبودند

هواوی نه! تهدید بزرگ‌تری برای گوشی‌های تاشو سامسونگ در راه است

نسخه جدیدی از بازی پرهیجان «مترو» ساخته می‌شود؟

مدل سیم‌کارت‌خور لپ‌تاپ مایکروسافت با تراشه هوش مصنوعی معرفی شد

مدل ارزان‌تر گوشی ناتینگ احتمالا به‌زودی معرفی می‌شود

ربات محبوب اندروید برمی‌گردد!

گلکسی A17 از همان پردازنده گلکسی A16 استفاده خواهد کرد

اولین آیفون تاشو کوچک‌تر از گلکسی زد فولد 7 سامسونگ خواهد بود

کپچر معرفی شد؛ نرم‌افزار دوربین آیفون با فیلترهای جذاب

این بازی توجه 5 میلیون نفر را به خود جلب کرده است

ساعت هوشمند جدید ناتینگ، قیمت مناسب و نمایشگر بزرگ دارد

آپدیت جدید PS5 چه ویژگی‌هایی را به این کنسول اضافه می‌کند؟

نسخه نهایی One UI 8 Watch وارد ساعت‌ پرچمدار سامسونگ شد

طراحی شیشه‌ای iOS 26 آیفون باز هم تغییر کرد و شیشه‌ای‌تر شد!

رمز استقلال و انگیزه زندگی در «دوران پیری»

هابل برای اولین بار دنباله‌دار «31/اطلس» را رصد کرد

عکس روز ناسا از پرواز یک گوی آتشین بر فراز فلوریدا

بینایی فضانوردان طی ماموریت‌ها مختل می‌شود

تهدید نامرئی در اعماق آب: میلیاردها ذره نانوپلاستیک در اقیانوس اطلس شناور است

اورانوس سیاره سردی نیست

سد سه‌دره را فراموش کنید؛ چین ساخت بزرگ‌ترین سد برق آبی دنیا با ظرفیت سه‌برابر را آغاز کرد

آینده‌ای که از آن می‌ترسیدیم فرا رسید؛ ربات جدید چین بدون توقف کار می‌کند

هوش مصنوعی یا توهم مصنوعی؟ نتایج ناامیدکننده آزمایش ایجنت جدید ChatGPT