Google a lansat Nano Banana 2 Lite, cel mai rapid și mai eficient model de generare de imagini din familia Gemini Image. În același timp, compania aduce acum Gemini Omni Flash la dezvoltatori, pentru generare video și editare conversațională prin Google AI Studio, Gemini API și Gemini Enterprise Agent Platform.
Nano Banana 2 Lite este gândit pentru fluxuri unde viteza și costurile contează mai mult decât controlul avansat. Gemini Omni Flash completează direcția prin video, cu suport pentru input combinat de text, imagine și video, astfel încât dezvoltatorii să poată lega generarea de imagini de animație și editare.
Nano Banana 2 Lite, modelul Google pentru imagini rapide
Nano Banana 2 Lite are numele tehnic gemini-3.1-flash-lite-image și este recomandat de Google ca înlocuitor pentru primul Nano Banana, adică gemini-2.5-flash-image. Modelul este disponibil din prima zi în Google AI Studio, Gemini API și Gemini Enterprise Agent Platform.
Google îl distribuie și în produse pentru publicul larg, inclusiv AI Mode în Search, aplicația Gemini, NotebookLM, Google Photos, Stitch, Google Flow și Google Ads. Asta demonstrează că modelul nu este doar un experiment pentru dezvoltatori, ci o componentă care deja începe să apară în mai multe servicii de la Google.
Principalul argument este viteza: Nano Banana 2 Lite livrează rezultate text-to-image în 4 secunde. Costul indicat este de 0,034 dolari pentru o imagine la rezoluție 1K, ceea ce îl face interesant pentru faza de prototip a unui proiect, draft-uri vizuale și generare în volume mari.
În benchmark-ul publicat de Google, Nano Banana 2 Lite obține un scor Elo de 1251 la generare de imagini, față de 1270 pentru Nano Banana 2 și 1151 pentru modelul Nano Banana anterior. La editare de imagini, scorul indicat este 1308 pentru Lite, 1387 pentru Nano Banana 2 și 995 pentru modelul vechi.
Gemini Omni Flash intră în API pentru video
Gemini Omni Flash ajunge acum în preview public pentru Google AI Studio și Gemini API. Modelul fusese prezentat la Google I/O și combină raționamentul multimodal Gemini cu generarea și editarea video. Prețul este de 0,10 dolari pe secundă de video generat, același nivel menționat de Google pentru Veo 3.1 Fast. Modelul poate lucra cu text, imagini și video, iar editarea se face prin comenzi în limbaj natural, nu printr-o interfață clasică de timeline.
Google spune că Gemini Omni Flash poate menține controlul asupra unei scene folosind referințe multimodale, poate sincroniza textul și elementele grafice cu acțiuni din video și poate folosi cunoștințele Gemini despre istorie, biologie sau logică narativă pentru construcția clipurilor.
Există însă limitări importante. Gemini Omni Flash generează momentan clipuri de 10 secunde, iar durate mai lungi sunt promise ulterior. În Gemini API, modelul nu suportă încă referințe audio sau extinderea scenelor. Google mai precizează că referințele video de până la 3 secunde sunt acceptate de schema API, dar nu sunt procesate corect de model în acest moment. Consistența personajelor poate avea probleme la schimbarea scenelor sau la mișcări de tip panning.
Cele două modele pot fi folosite împreună: Nano Banana 2 Lite generează rapid imaginea, iar Gemini Omni Flash o transformă într-un video. Ambele modele folosesc SynthID watermarking, iar conținutul AI poate fi verificat în aplicația Gemini, Gemini în Chrome sau Search.
