سیاست و بازاریابی

آخرين مطالب

هوش مصنوعی EMO برای تبدیل عکس به ویدیو توسط علی‌بابا معرفی شد نکات خواندني

هوش مصنوعی EMO برای تبدیل عکس به ویدیو توسط علی‌بابا معرفی شد
  بزرگنمايي:

سیاست و بازاریابی - دیجیاتو / این مدل می‌تواند عکس‌های شما را به ویدیوهای واقعی تبدیل کند که در آن‌ها در حال صحبت‌کردن یا آوازخواندن هستید.
محققان شرکت چینی علی‌بابا (Alibaba)، سیستم هوش مصنوعی جدیدی به نام «EMO» (مخفف Emote Portrait Alive) را توسعه داده‌اند که می‌تواند یک عکس پرتره را به ویدیو تبدیل کند. به‌طور خلاصه، این مدل می‌تواند عکس‌های شما را به ویدیوهای واقعی تبدیل کند که در آن‌ها در حال صحبت‌کردن یا آوازخواندن هستید.
براساس مقاله تحقیقاتی علی‌بابا، این مدل می‌تواند حرکات اجزای صورت و حالت‌های سر کاربران را به‌صورتی ایجاد کند که دقیقا با آهنگ صوتی ارائه‌شده مطابقت داشته باشد. همچنین از این مدل به‌عنوان یک پیشرفت بزرگ در زمینه تولید ویدیو براساس صدا یاد شده است، حوزه‌ای که محققان هوش مصنوعی سال‌ها آن را به چالش کشیده‌‌اند.
«لینروی تیان»، محقق اصلی این سیستم می‌گوید:
«تکنیک‌های سنتی اغلب نمی‌توانند طیف کاملی از حالات انسانی و منحصر‌به‌فردبودن سبک‌های صورت اشخاص را به تصوی بکشند. برای حل این مشکل، ما EMO را پیشنهاد می کنیم، یک چارچوب جدید که از رویکرد مستقیم صوتی به تصویر استفاده می‌کند و به مدل‌های سه‌بعدی متوسط یا نشانه‌های چهره نیازی ندارد.»
نحوه کار مدل تبدیل عکس به ویدیو علی‌بابا

سیاست و بازاریابی

مدل تبدیل عکس به ویدیو EMO از یک تکنیک هوش مصنوعی معروف به مدل انتشار استفاده می‌کند که از نظر تولید تصاویر واقعی، پتانسیل بسیار خوبی از خود نشان داده است. محققان این مدل را با مجموعه داده‌ای متشکل از 250 ساعت ویدیو‌های مربوط به سخنرانی‌ها، فیلم‌ها، نمایش‌های تلویزیونی و اجرای آواز آموزش داده‌اند.
برخلاف مدل‌های سنتی که بر مدل‌های سه‌بعدی صورت یا ترکیب اشکال برای تقریب حرکات صورت تکیه دارند، EMO می‌تواند مستقیما شکل موج صوتی را به فریم‌های ویدیویی تبدیل کند. این امر به آن اجازه می‌دهد تا حرکات ظریف و ویژگی‌های پیچیده هویتی مرتبط با گفتار طبیعی را نمایش دهد.
طبق آزمایش‌هایی که در مقاله توضیح داده شده، EMO به طور قابل‌توجهی از روش‌های پیشرفته موجود در معیارهای اندازه‌گیری کیفیت ویدیو، حفظ هویت و بیان بهتر استفاده می‌کند. محققان همچنین یک مطالعه روی کاربران انجام دادند که نشان داد ویدیوهای تولید شده توسط EMO طبیعی‌تر و احساسی‌تر از ویدیوهای تولیدشده توسط سایر سیستم‌ها هستند.

supports HTML5 video

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/736101/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

گلکسی رینگ ظاهراً با این قاب شارژ می‌شود

هوش مصنوعی به کمک صاحبان گربه‌ها می‌آید

تریلر جدید بازی !Thank Goodness You’re Here را ببینید

فضانوردان «آرتمیس» به سیستم هشدار قوی تشعشع نیاز دارند

چین فناوری کاملا خودران تسلا را آزمایش می کند

جدیدترین گوشی موتورولا با قابلیت‌های کاربردی و قیمتی مقرون‌به‌صرفه معرفی شد

رونمایی ال جی از نسل جدید تلویزیون‌های خود برای گیمرهای پولدار!

اولین ماهواره پهن‌باند سوئد به مدار زمین‌ایستا رسید

Lords of the Fallen 2 در سال 2026 منتشر خواهد شد

رندرهای جدیدی از گلکسی واچ اولترا منتشر شد

کشف سیاره‌های فراخورشیدی قابل سکونت در پرتو ستاره‌های مجاور

قیمت گوشی جدید HMD با طراحی مشابه نوکیا لومیا 920 لو رفت

هشدار در مورد احتمال وقوع انفجار کیهانی نادر

اینترنت ماهواره‌ای استارلینک حالا در 100 کشور جهان در دسترس است

انتشار چت‌بات هوش مصنوعی متا در اروپا به‌تعویق افتاد

نانو کورکومین به درمان بیماری‌های عصبی کمک می‌کند

Starfield سالانه بسته‌الحاقی داستانی دریافت خواهد کرد

دیدگاه مایکروسافت در مورد فناوری بلاکچین چیست؟

کنسول بازی اختصاصی روسیه در دست ساخت است

بازی چندنفره‌ Battle Vision Network برای کامپیوتر و موبایل معرفی شد؛ تریلر آن را ببینید

کدام قابلیت‌های هوش مصنوعی اپل و iOS 18 احتمالاً همزمان با آیفون 16 عرضه نمی‌شوند؟

عقب‌نشینی دولت از ممنوعیت واردات آیفون رفرش

مشخصات کامل گوشی آنر X60i لو رفت

ریمستر بازی The Thing برای کنسول‌های نسل هشتم و نهم معرفی شد

اگر پوتین در فضا بمب هسته‌ای منفجر کند، چه اتفاقی خواهد افتاد؟

بلومبرگ: اپل می‌خواهد نازک‌ترین آیفون، مک‌بوک پرو و اپل واچ را بسازد

ویدیویی شگفت انگیز از بازگشت فضاپیمای استارشیپ به اتمسفر

برنامه/ تمرینات ورزشی برای عضله سازی

شرکتی حقوقی، اینتل را به دست‌بردن در گزارش مالی متهم کرد

نتایج امیدوارکننده یک ساختار نانویی برای مقابله با پارکینسون

سیاره جالب قابل سکونت

بایسون با استریت فایتر 6 از مرگ باز می‌گردد

درخواست فعالان فاوا از رئیس‌جمهور آینده؛ از رفع تعدد رگولاتورها تا کاهش محدودیت‌های اینترنت

متا آموزش هوش مصنوعی با داده‌های کاربران اروپایی را متوقف می‌کند

میز خدمت در راستای بررسی مشکلات حقوقی جامعه ایثارگر خوزستان برگزار شد

یک پرتاب قدرتمند از تاج خورشید

مشاهده اثرات زهر مار روی انسان به کمک زیست تراشه‌ برای نخستین بار

فرود super heavy booster

اپل برای سرورهای ابری Apple Intelligence یک سیستم‌عامل جدید ساخته است

200 میلیون سال طول کشید تا زمین اکسیژن‌دار شود

اطلاعیه دفتر مسکن و تسهیلات رفاهی در خصوص اجرای قانون واردات خودرو جانبازان 50% به بالا مشمول

تریلر جدید بازی Elden Ring - Shadow of the Erdtree را تماشا کنید

اپل بازی شطرنج مک را پس از 12 سال به‌روز کرد

فساد مالی در شیائومی؛ دو مدیر ارشد بازارهای بین‌المللی اخراج شدند

انسان واقعا 50 سال قبل به ماه رفته؟

اطلاعیه دفتر مسکن و تسهیلات رفاهی در خصوص اجرای قانون واردات خودرو جانبازان 50درصد به بالا مشمول

در iOS 18 می‌توانید برای سیری یک نام جدید انتخاب کنید

آسیب‌پذیری وای‌فای در ویندوز 11؛ همین حالا سیستم‌عامل را آپدیت کنید

قرارداد مشارکت شرکت بیمه دی و صدا و سیما امضا شد

مقایسه‌ی پرتاب استارشیپ بعد از چند سال