Google Whisk: Forradalmi AI képgenerátor képes promptokkal
A Google bemutatta legújabb AI eszközét, a Whisket, amely lehetővé teszi képek generálását más képek felhasználásával, hosszú szöveges promptok helyett.
Hogyan működik a Whisk?
A Whisk segítségével képeket adhatunk meg, hogy javasoljuk az AI által generálandó kép témáját, jelenetét és stílusát. Mindhárom kategóriához több képet is feltölthetünk. Ha nincsenek kéznél megfelelő képek, a kocka ikonra kattintva a Google automatikusan kitölti ezeket (bár úgy tűnik, ezek is AI által generált képek).
A folyamat végén opcionálisan szöveges promptot is megadhatunk további részletek pontosítására, de ez nem kötelező. A Whisk ezután generálja a képeket és minden képhez egy szöveges promptot is létrehoz.
Képek finomhangolása és iteráció
Ha elégedettek vagyunk az eredménnyel, kedvencnek jelölhetjük vagy letölthetjük a képet. Ha további finomításra van szükség, szöveges promptot adhatunk meg, vagy a képre kattintva szerkeszthetjük az automatikusan generált promptot.
A Whisk korlátai és fejlesztési lehetőségei
A Google hangsúlyozza, hogy a Whisk a „gyors vizuális felfedezésre” szolgál, nem pedig pixelpontos szerkesztésre. Az eszköz néha „mellélőhet”, ezért lehetőséget biztosít az alapul szolgáló promptok szerkesztésére.
A képek generálása néhány másodpercet vesz igénybe, ami kissé lassíthatja a folyamatot. Bár az eredmények néha furcsák lehetnek, a velük való kísérletezés és iteráció szórakoztató élményt nyújt.
Technológiai háttér és jövőbeli tervek
A Whisk a Google Imagen 3 képgenerálási modelljének legújabb verzióját használja. A vállalat emellett bemutatta a Veo 2 videógenerálási modellt is, amely állítólag jobban érti a „cinematográfia egyedi nyelvét” és ritkábban generál hibás részleteket (pl. extra ujjakat).
A Veo 2 először a Google VideoFX-ben lesz elérhető, majd 2025-ben a YouTube Shorts és más termékek is megkapják.
A Google folyamatosan fejleszti AI képességeit, hogy versenyben maradjon olyan riválisokkal, mint az OpenAI Sora.
Összefoglalva, a Google Whisk egy izgalmas új eszköz az AI-alapú képgenerálás területén, amely egyszerűbbé és intuitívabbá teheti a kreatív folyamatot a felhasználók számára. Bár még vannak korlátai, a technológia gyors fejlődése ígéretes jövőt vetít előre a vizuális tartalmak AI-asszisztált létrehozásában.