سیاست و بازاریابی

آخرين مطالب

OpenAI مدل‌های گفتاری و نوشتاری جدیدی برای ایجنت‌های هوش مصنوعی معرفی کرد نکات خواندني

OpenAI مدل‌های گفتاری و نوشتاری جدیدی برای ایجنت‌های هوش مصنوعی معرفی کرد
  بزرگنمايي:

سیاست و بازاریابی - دیجیاتو / البته OpenAI در حال حاضر قصد ندارد این مدل‌های جدید را به صورت عمومی منتشر کند.
OpenAI از ارتقاء مدل‌های هوش مصنوعی خود در زمینه تبدیل گفتار به متن و متن به گفتار خبر داد. این مدل‌های جدید که به API این شرکت اضافه شده‌اند، نسبت به نسخه‌های قبلی پیشرفت‌های قابل‌توجهی داشته‌اند و قابلیت‌های بیشتری را در اختیار توسعه‌دهندگان قرار می‌دهند.
به گفته OpenAI، این مدل‌های جدید بخشی از چشم‌انداز بزرگ‌تر این شرکت برای ساخت سیستم‌های خودکار یا «عامل‌های هوشمند» هستند که می‌توانند به‌طور مستقل وظایف مختلفی را برای کاربران انجام دهند. «اولیویه گودمن»، مدیر محصول اوپن‌ای‌آی، در این باره به TechCrunch توضیح داده که این ایجنت‌ها می‌توانند به‌عنوان چت‌بات‌هایی عمل کنند که با مشتریان یک کسب‌وکار تعامل می‌کنند. او پیش‌بینی کرد که در ماه‌های آینده شاهد ظهور تعداد بیشتری از این عامل‌ها خواهیم بود.
مدل تبدیل متن به گفتار OpenAI
مدل جدید تبدیل متن به گفتار OpenAI با نام gpt-4o-mini-tts، نه تنها گفتاری طبیعی‌تر و با جزئیات بیشتر تولید می‌کند، بلکه قابلیت تنظیم دقیق‌تری نیز دارد. توسعه‌دهندگان می‌توانند با استفاده از دستورات زبان طبیعی، نحوه بیان متن را کنترل کنند.
به‌عنوان مثال، می‌توان از این مدل خواست که مانند یک «دانشمند دیوانه» یا با صدایی آرام و شبیه به یک معلم صحبت کند. یک نمونه از صداهای تولید شده توسط این مدل را در ادامه می‌توانید بشنوید:

بازار


«جف هریس»، یکی از اعضای تیم محصول OpenAI، تأکید کرده که هدف این است که توسعه‌دهندگان بتوانند هم «تجربه صوتی» و هم «زمینه» را به دلخواه خود تنظیم کنند. او می‌گوید:
«در موقعیت‌های مختلف، شما نمی‌خواهید که صدایی یکنواخت و بدون احساس شنیده شود. مثلاً اگر در یک تجربه پشتیبانی مشتری هستید و می‌خواهید صدای ربات عذرخواهی کند، می‌توانید به مدل دستور دهید که این احساس را در صدا لحاظ کند.»
مدل‌های تبدیل گفتار به متن
OpenAI همچنین دو مدل جدید تبدیل گفتار به متن با نام‌های gpt-4o-transcribe و gpt-4o-mini-transcribe را معرفی کرده است که جایگزین مدل قدیمی Whisper می‌شوند. این مدل‌های جدید که روی مجموعه‌ داده‌های صوتی متنوع و باکیفیت آموزش دیده‌اند، می‌توانند صداهای با لهجه‌های مختلف و حتی در محیط‌های شلوغ را با دقت بیشتری تشخیص دهند.
هریس همچنین اشاره کرده که این مدل‌ها کمتر از Whisper دچار خطاهای «توهم» می‌شوند. مدل Whisper گاهی اوقات کلمات یا حتی جملات کاملی را که وجود نداشتند، به متن اضافه می‌کرد که این موضوع می‌توانست مشکلاتی را ایجاد کند. او می‌گوید:
«این مدل‌ها در مقایسه با Whisper بهبود چشمگیری داشته‌اند. دقت مدل‌ها برای ایجاد یک تجربه صوتی قابل اعتماد کاملاً ضروری است و دقت در اینجا به این معناست که مدل‌ها کلمات را به درستی تشخیص می‌دهند و جزئیاتی که نشنیده‌اند را به متن اضافه نمی‌کنند.»


بااین‌حال، دقت این مدل‌ها ممکن است بسته به زبانی که تبدیل می‌شود، متفاوت باشد.
برخلاف رویه گذشته، OpenAI قصد ندارد این مدل‌های جدید تبدیل گفتار به متن خود را به‌صورت عمومی منتشر کند. این شرکت پیش‌تر نسخه‌های جدید Whisper را تحت مجوز MIT برای استفاده تجاری منتشر می‌کرد. هریس توضیح داده که مدل‌های جدید بسیار بزرگ‌تر از Whisper هستند و بنابراین برای انتشار عمومی مناسب نیستند. او می‌گوید:
«این مدل‌ها از نوعی نیستند که بتوانید به راحتی روی لپ‌تاپ خود اجرا کنید. ما می‌خواهیم اگر چیزی را به‌صورت متن‌باز منتشر می‌کنیم، با دقت این کار را انجام دهیم و مدلی را ارائه کنیم که واقعاً برای آن نیاز خاص مناسب باشد.»

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/772337/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

فناوری نمایشگر آیفون تاشو اپل استانداردهای جدیدی را تعیین خواهد کرد

مدیر سابق اپلیکیشن فیسبوک به استخدام OpenAI درآمد

راز چشم‌های آبی فاش شد؛ همه به یک انسان اولیه اروپایی بازمی‌گردند

سامسونگ برای مقابله با تعرفه‌ها ظرفیت تولید گلکسی S25 را افزایش می‌دهد

کشف ماهواره ناسا درباره انتشار اشعه ایکس از سیاه‌چاله

به اتمام رساندن داستان Death Stranding 2 ممکن است 75 ساعت طول بکشد

سقوط کاوشگر قدیمی شوروی روی زمین،«سقوط معمولی» نخواهد بود

ضربه کاری اپل به گوگل؛ عرضه گزینه‌های جست‌وجوی هوش مصنوعی در سافاری

آپدیت One UI 7 برای Galaxy S22 Ultra سامسونگ به ایران رسید

سیستم ایمنی باعث ایجاد ترس می‌شود و روانگردان‌ها این واکنش را مسدود می‌کنند

هیولای گیمینگ با نمایشگر سه‌بعدی و بدنه فیبر کربن؛ این لپ‌تاپ جدید لنوو است

درختان صنوبر چند ساعت قبل از خورشیدگرفتگی، با یکدیگر صحبت می‌کنند!

عینک هوشمند با توانایی تشخیص چهره؛ متا پروژه بزرگی در سر دارد

اپلیکیشن هوش مصنوعی جمنای برای آیپد سرانجام منتشر شد

گوگل مپ از این‌ پس اسکرین‌شات‌های شما را اسکن می‌کند

کشف منبع جدیدی از طلا در کیهان

برگزاری نشست بررسی مطالبات خانواده‌های شهدا و ایثارگران استان مازندران با حضور رئیس بنیاد شهید

این ربات کوچک 25 گرمی می‌تواند دنیا را نجات دهد

قیمت کنسول بازی ممکن است تا 70 درصد به دلیل تعرفه‌های ترامپ افزایش یابد

مسابقه بزرگ فرهنگی «شهدای خدمت»برگزار می‌شود

آپدیت One UI 7 برای گلکسی A35 منتشر شد

دانشمندان: سفر‌های بین کهکشانی تا 100 سال آینده به واقعیت تبدیل می‌شود

آپدیت One UI 7 گلکسی S23 FE رسما به ایران رسید

خورشید در نهایت، تمام حیات روی زمین را نابود خواهد کرد

دیدار مدیرعامل صندوق اشتغال و کارآفرینی ایثارگران با مادران شهدای محله جوادیه

تریلر دوم GTA 6 باعث افزایش چشم‌گیر بازدید موسیقی آن شده است

کاهش مصرف سموم در باغ‌های سیب با اینترنت اشیاء

کتاب «اینجا بدون تو» به قلم همسر شهید مدافع حرم محمد بلباسی رونمایی شد

دیدار معاون فرهنگی و آموزشی بنیاد و مدیرکل بنیاد مازندران با جانبازان نخاعی

نسخه آزمایشی One UI 8 سامسونگ 2 هفته دیگر از راه می‌رسد؛ ادعای سم‌موبایل

راز یادگیری هوش مصنوعی فاش شد؛ فکر نمی‌کند، فقط حدس می‌زند

کشف جدید فضایی؛ زمین در محاصره تکه‌های مخفی ماه

کتاب «اینجا بدون تو» به قلم محبوبه بلباسی، همسر شهید مدافع حرم محمد بلباسی رونمایی شد

رمدی: Control 2 بودجه کمتری نسبت به Alan Wake 2 دارد

آنر 400 و 400 پرو یکم خرداد معرفی می‌شوند

تبدیل گرمای بدن به برق با مهندسی فضای خالی اتمی

برای اولین‌بار در 22 سال اخیر، جست‌و‌جوهای گوگل در مرورگر سافاری افت کرد

بازی/ Tiles Hop EDM Rush Music Game؛ با موسیقی و سرعت بالا رکورد ثبت کنید

گلکسی زد فولد 7 باریک‌ترین گوشی تاشو جهان خواهد بود

حمله هواوی به قلمرو ویندوز و مک؛ سیستم‌عامل HarmonyOS for PC معرفی شد

کشف شباهت‌های جدید بین مریخ و زمین

فروش اپل واچ در سال 2024 افت 19 درصدی تجربه کرد

بازآموزی مغز، امید تازه‌ای برای مبتلایان به درد مزمن رقم می‌زند

هواوی از نسخه دسکتاپ HarmonyOS رونمایی کرد

رکورد جهانی طولانی ترین مکالمه تلفنی تاریخ؛ دو روز بدون خواب

تریلر دوم GTA 6 به 79 میلیون بازدید و 4.8 میلیون لایک رسید

شاید سیارک «وستا» تکه‌ای از یک سیاره منظومه شمسی باشد

شاید تا 10 سال دیگر، آیفونی وجود نداشته باشد!

مشخصات موتورولا Moto G86 لو رفت

راز پنهان اسم تازه ایلان ماسک