Google Whisk: Képalapú AI generátor újdonság

Google Whisk: Képalapú AI generátor újdonság

Google Whisk: Forradalmi AI képgenerátor képes promptokkal

A Google bemutatta legújabb AI eszközét, a Whisket, amely lehetővé teszi képek generálását más képek felhasználásával, hosszú szöveges promptok helyett.

Hogyan működik a Whisk?

A Whisk segítségével képeket adhatunk meg, hogy javasoljuk az AI által generálandó kép témáját, jelenetét és stílusát. Mindhárom kategóriához több képet is feltölthetünk. Ha nincsenek kéznél megfelelő képek, a kocka ikonra kattintva a Google automatikusan kitölti ezeket (bár úgy tűnik, ezek is AI által generált képek).

A folyamat végén opcionálisan szöveges promptot is megadhatunk további részletek pontosítására, de ez nem kötelező. A Whisk ezután generálja a képeket és minden képhez egy szöveges promptot is létrehoz.

Képek finomhangolása és iteráció

Ha elégedettek vagyunk az eredménnyel, kedvencnek jelölhetjük vagy letölthetjük a képet. Ha további finomításra van szükség, szöveges promptot adhatunk meg, vagy a képre kattintva szerkeszthetjük az automatikusan generált promptot.

Google Whisk: Képalapú AI generátor újdonság-1
A Whisk képernyőképe. A kockára kattintva generáltam témát, jelenetet és stílust. A jelenetet szöveges prompttal cseréltem. A Whisk létrehozta az első két képet, majd gőzt kértem a tárgy köré (mivel tűz van a vízben), így kaptam a következő két képet.

A Whisk korlátai és fejlesztési lehetőségei

A Google hangsúlyozza, hogy a Whisk a „gyors vizuális felfedezésre” szolgál, nem pedig pixelpontos szerkesztésre. Az eszköz néha „mellélőhet”, ezért lehetőséget biztosít az alapul szolgáló promptok szerkesztésére.

A képek generálása néhány másodpercet vesz igénybe, ami kissé lassíthatja a folyamatot. Bár az eredmények néha furcsák lehetnek, a velük való kísérletezés és iteráció szórakoztató élményt nyújt.

Technológiai háttér és jövőbeli tervek

A Whisk a Google Imagen 3 képgenerálási modelljének legújabb verzióját használja. A vállalat emellett bemutatta a Veo 2 videógenerálási modellt is, amely állítólag jobban érti a „cinematográfia egyedi nyelvét” és ritkábban generál hibás részleteket (pl. extra ujjakat).

A Veo 2 először a Google VideoFX-ben lesz elérhető, majd 2025-ben a YouTube Shorts és más termékek is megkapják.

A Google folyamatosan fejleszti AI képességeit, hogy versenyben maradjon olyan riválisokkal, mint az OpenAI Sora.

Összefoglalva, a Google Whisk egy izgalmas új eszköz az AI-alapú képgenerálás területén, amely egyszerűbbé és intuitívabbá teheti a kreatív folyamatot a felhasználók számára. Bár még vannak korlátai, a technológia gyors fejlődése ígéretes jövőt vetít előre a vizuális tartalmak AI-asszisztált létrehozásában.

Exit mobile version