ВИДЕО | Погледнете како Google прави видео од слика: со помош на аудио снимка, аватарот ќе изгледа и ќе зборува како вас

Оваа алатка за вештачка интелигенција го „усвојува“ начинот на кој се движат усните и телото на една личност, верно пренесувајќи ги нивните изрази на лицето и гестовите на (генериран) аватар
Истражувачите на оваа голема технолошка компанија работат на алатка која ќе овозможи да се создаде видео од слика со помош на вештачка интелигенција

За верна рендерирање, ги „копира“ движењата на главата и телото, вклучително и движењето на усните

Прашањето што тајно се наметнува е – колку новата технологија е подложна на злоупотреба и колку е корисна?
Истражувачите на Google во последно време работат прекувремено за да ги реализираат своите претстојни идеи. Најновата беше – најдете начин да користите „неподвижна“ слика за аватар.Станува збор за алатка заснована на вештачка интелигенција наречена Vlogger , која моментално не е достапна за јавноста, но демото сугерира дека ќе ви овозможи да креирате аватар и да го контролирате со вашиот глас. И како што додава водичот на Том , сето тоа изгледа изненадувачки реално.Во моментов, Vlogger е само проект со неколку забавни демо видеа, но ако некогаш се претвори во производ, тоа би можело да биде нов начин за комуникација во Teams или Slack.Овој модел со вештачка интелигенција успева да го одржи фотореалистичниот изглед на личноста на фотографијата – во секој кадар од видеото. Го користи и аудиото на лицето што зборува, начинот на кој се движат неговото тело и усните, за да ги прикаже на најверен можен начин.
This is scary!Google just revealed VLOGGER, and it can create almost realistic talking + moving videos from JUST ONE PHOTO.Here’s what you need to know:(+ more examples) pic.twitter.com/V61Sb0Xr9n— Roni Rahman (@heyronir) March 19, 2024
Ова вклучува движења на главата, изрази на лицето, поглед, трепкање, како и гестикулација на рацете и горниот дел од телото.Кои се ограничувањата на Vlogger? Сè додека генерираното движење изгледа реално, тоа не мора да одговара на вистинскиот начин на движење на една личност. Поради начинот на кој е направен, склон е, велат, на непредвидливост.Тимот на Google вели дека има проблеми со особено големи движења или различни средини. Исто така, може да се справи само со релативно кратки видеа.
Image to Video Generation:Here are more examples of talking face generation using just a single input image and driving audio. pic.twitter.com/7bZUkIxhVi— Roni Rahman (@heyronir) March 19, 2024
За што се користи Vlogger?Една од примарните употреби е видео преводот. На пример, снимање постоечко видео на одреден јазик и „уредување“ на усните и лицето за да одговараат на новото, преведено аудио.Други можни случаи на употреба вклучуваат создавање аватари за виртуелни асистенти, чет-ботови или виртуелни ликови кои изгледаат и се движат реално во дадена средина.
More close example: pic.twitter.com/lE5Y0hTgcG— Roni Rahman (@heyronir) March 19, 2024
Постојат алатки кои веќе прават нешто слично, вклучувајќи го и Synthesia, каде што корисниците можат да одат во канцелариите на компанијата и да креираат виртуелен аватар за да даваат презентации, но овој нов модел многу го олеснува процесот.Една можна апликација е да обезбеди видео комуникација. Идната верзија на моделот може да овозможи видео разговори со анимирање на аватари.

Пронајдете не на следниве мрежи: