Įmonės dabar gali išnaudoti didelio kalbinio modelio, kuris yra artimas pažangiausio „Google Gemini 3 Pro“ modelio galią, tačiau už nedidelę kainą ir didesnį greitį dėl naujai išleistos „Gemini 3 Flash“.
Modelis prisijungia prie flagmanų „Gemini 3 Pro“, „Gemini 3 Deep Think“ ir „Gemini Agent“, kurie visi buvo paskelbti ir išleisti praėjusį mėnesį.
„Gemini 3 Flash“, dabar pasiekiama „Gemini Enterprise“, „Google Antigravity“, „Gemini CLI“, „AI Studio“ ir „Vertex AI“ peržiūra, apdoroja informaciją beveik realiuoju laiku ir padeda kurti greitas, reaguojančias agentų programas.
Bendrovė tinklaraščio įraše teigė, kad „Gemini 3 Flash“ „kuria modelių serija, kurią jau mėgsta kūrėjai ir įmonės, optimizuota aukšto dažnio darbo eigoms, kurioms reikalingas greitis, neprarandant kokybės.
Šis modelis taip pat yra numatytasis AI režimas „Google“ paieškoje ir programoje „Gemini“.
Tulsee Doshi, vyresnysis „Gemini“ komandos produktų valdymo direktorius, atskirame tinklaraščio įraše teigė, kad modelis „parodo, kad greitis ir mastas nebūtinai turi kainuoti intelekto kaina“.
„Gemini 3 Flash sukurta kartotiniam kūrimui, siūlanti Gemini 3 Pro-grade kodavimo našumą su mažu delsimu – ji gali greitai sugalvoti ir išspręsti užduotis aukšto dažnio darbo eigoje“, – sakė Doshi. „Jis sukuria idealią agentinio kodavimo, gamybai paruoštų sistemų ir reaguojančių interaktyvių programų pusiausvyrą.
Ankstyvas specializuotų firmų pritaikymas įrodo modelio patikimumą didelės svarbos srityse. Harvey, AI platforma, skirta advokatų kontoroms, pranešė, kad jų vidinis „BigLaw Bench“ argumentavimas padidėjo 7 proc., o „Resemble AI“ atrado, kad „Gemini 3 Flash“ gali apdoroti sudėtingus teismo ekspertizės duomenis, kad būtų galima aptikti klastotes 4 kartus greičiau nei „Gemini 2.5 Pro“. Tai ne tik greičio padidėjimas; jie įgalina „beveik realiojo laiko“ darbo eigas, kurios anksčiau buvo neįmanomos.
Efektyvesnis už mažesnę kainą
Įmonių AI kūrėjai tapo labiau informuoti apie AI modelių eksploatavimo išlaidas, ypač bandydami įtikinti suinteresuotąsias šalis skirti daugiau biudžeto agentų darbo eigoms, kurios vykdomos naudojant brangius modelius. Organizacijos kreipėsi į mažesnius arba distiliuotus modelius, daugiausia dėmesio skirdamos atviriems modeliams ar kitiems tyrimams ir ragindamos metodus, padedančius valdyti išpūstas AI išlaidas.
Įmonėms didžiausias „Gemini 3 Flash“ vertės pasiūlymas yra tas, kad jis siūlo tokio paties lygio pažangias daugiarūšio transporto galimybes, pavyzdžiui, sudėtingą vaizdo analizę ir duomenų išgavimą, kaip ir didesni „Gemini“ analogai, tačiau yra daug greitesnė ir pigesnė.
Nors „Google“ vidinėje medžiagoje pabrėžiamas 3 kartus didesnis greitis, palyginti su „2.5 Pro“ serija, nepriklausomos palyginimo įmonės „Artificial Analysis“ duomenys suteikia esminių niuansų.
Pastarosios organizacijos išankstinio leidimo testavimo metu „Gemini 3 Flash Preview“ užfiksavo neapdorotą 218 išvesties žetonų per sekundę pralaidumą. Dėl to jis 22% lėtesnis nei ankstesnis „neprotingas“ „Gemini 2.5 Flash“, tačiau jis vis tiek yra žymiai greitesnis už konkurentus, įskaitant OpenAI GPT-5.1 aukštą (125 t/s) ir DeepSeek V3.2 argumentą (30 t/s).
Visų pirma, Dirbtinė analizė apvainikavo „Gemini 3 Flash“ nauju lyderiu jų AA-Omniscience žinių etalonu, kur jis pasiekė aukščiausią žinių tikslumą iš bet kurio iki šiol išbandyto modelio. Tačiau ši informacija apima „protavimo mokestį“: modelis daugiau nei dvigubai padidina žetonų naudojimą, palyginti su 2,5 „Flash“ serija sprendžiant sudėtingus indeksus.
Šį didelį žetonų tankį kompensuoja agresyvi „Google“ kainodara: naudojant „Gemini“ API, „Gemini 3 Flash“ kainuoja 0,50 USD už 1 mln. įvesties prieigos raktų, palyginti su 1,25 USD už 1 mln. Tai leidžia „Gemini 3 Flash“ pretenduoti į ekonomiškiausio modelio titulą pagal savo intelekto lygį, nepaisant to, kad jis yra vienas iš „kalbiausių“ modelių pagal neapdorotų žetonų kiekį. Štai kaip jis atitinka konkurentų LLM pasiūlymus:
|
Modelis |
Įvestis (/1M) |
Išvestis (/1M) |
Bendra kaina |
Šaltinis |
|
Qwen 3 Turbo |
0,05 USD |
0,20 USD |
0,25 USD |
Alibaba debesis |
|
„Grok 4.1 Fast“ (samprotavimas) |
0,20 USD |
0,50 USD |
0,70 USD |
xAI |
|
„Grok 4.1 Fast“ (be motyvų) |
0,20 USD |
0,50 USD |
0,70 USD |
xAI |
|
deepseek-chat (V3.2-Exp) |
0,28 USD |
0,42 USD |
0,70 USD |
DeepSeek |
|
Deepseek-Reasoner (V3.2-Exp) |
0,28 USD |
0,42 USD |
0,70 USD |
DeepSeek |
|
Qwen 3 Plus |
0,40 USD |
1,20 USD |
1,60 USD |
Alibaba debesis |
|
ERNIE 5.0 |
0,85 USD |
3,40 USD |
4,25 USD |
Čianfanas |
|
Gemini 3 Flash peržiūra |
0,50 USD |
3,00 USD |
3,50 USD |
|
|
Claude’as Haiku 4.5 |
1,00 USD |
5,00 USD |
6,00 USD |
Antropinis |
|
Qwen-Max |
1,60 USD |
6,40 USD |
8,00 USD |
Alibaba debesis |
|
Gemini 3 Pro (≤200K) |
2,00 USD |
12,00 USD |
14,00 USD |
|
|
GPT-5.2 |
1,75 USD |
14,00 USD |
15,75 USD |
OpenAI |
|
Klodo sonetas 4.5 |
3,00 USD |
15,00 USD |
18,00 USD |
Antropinis |
|
„Gemini 3 Pro“ (>200 tūkst.) |
4,00 USD |
18,00 USD |
22,00 USD |
|
|
Uždaryti darbą 4.5 |
5,00 USD |
25,00 USD |
30,00 USD |
Antropinis |
|
GPT-5.2 Pro |
21,00 USD |
168,00 USD |
189,00 USD |
OpenAI |
Daugiau būdų sutaupyti
Tačiau įmonių kūrėjai ir naudotojai gali dar labiau sumažinti išlaidas, pašalindami dažniausiai pasitaikančius didesnių modelių atsilikimus, kurie padidina žetonų naudojimą. „Google“ teigė, kad modelis „gali moduliuoti, kiek mąsto“, todėl jis naudoja daugiau mąstymo ir todėl daugiau žetonų sudėtingesnėms užduotims atlikti nei greitiems raginimams. Bendrovė pažymėjo, kad „Gemini 3 Flash“ naudoja 30% mažiau žetonų nei „Gemini 2.5 Pro“.
Siekdama subalansuoti šią naują samprotavimo galią su griežtais įmonės delsos reikalavimais, „Google“ pristatė parametrą „Mąstymo lygis“. Kūrėjai gali perjungti „Mažas“ – kad sumažintų paprastų pokalbių užduočių išlaidas ir delsą – ir „Didelis“, kad padidintų sudėtingų duomenų gavimo argumentų gylį. Šis granuliuotas valdymas leidžia komandoms kurti „kintamo greičio“ programas, kurios naudoja brangius „mąstymo žetonus“ tik tada, kai problema iš tikrųjų reikalauja doktorantūros lygio.
Ekonominė istorija apima ne tik paprastas žetonų kainas. Standartiškai įtraukus konteksto talpyklą, įmonės, apdorojančios didžiulius, statinius duomenų rinkinius, pvz., ištisas teisines bibliotekas ar kodų bazių saugyklas, gali pastebėti 90 % mažesnės išlaidos už pasikartojančias užklausas. Kai kartu su Batch API taikoma 50 % nuolaida, bendros „Gemini“ varomo agento nuosavybės išlaidos nukrenta gerokai žemiau konkuruojančių pažangių modelių slenksčio.
„Gemini 3 Flash užtikrina išskirtinį kodavimo ir agentų užduočių našumą kartu su mažesne kaina, leidžiančiomis komandoms pritaikyti sudėtingas samprotavimo sąnaudas didelės apimties procesuose nepažeidžiant kliūčių“, – teigė „Google“.
Siūlydama modelį, užtikrinantį stiprų daugiarūšį našumą už prieinamesnę kainą, „Google“ siekia, kad įmonės, besirūpinančios valdyti savo AI išlaidas, turėtų rinktis savo modelius, ypač „Gemini 3 Flash“.
Stiprus etalonas
Tačiau kaip „Gemini 3 Flash“ skiriasi nuo kitų modelių pagal savo našumą?
Doshi teigė, kad SWE-Bench Verified etaloninio kodavimo agentų testavimo metu modelis pasiekė 78% balą, pranokdamas ir ankstesnę Gemini 2.5 šeimą, ir patį naujesnįjį Gemini 3 Pro!
Įmonėms tai reiškia, kad didelės apimties programinės įrangos priežiūros ir klaidų taisymo užduotys dabar gali būti perkeltos į modelį, kuris yra greitesnis ir pigesnis nei ankstesni pavyzdiniai modeliai, nepabloginant kodo kokybei.
Modelis taip pat puikiai pasirodė pagal kitus etalonus – MMMU Pro etalonas surinko 81,2 %, palyginus su Gemini 3 Pro.
Nors dauguma „Flash“ tipo modelių yra specialiai optimizuoti trumpoms, greitoms užduotims, pvz., kodo generavimui, „Google“ teigia, kad „Gemini 3 Flash“ našumas „protavimo, įrankių naudojimo ir daugiarūšių galimybių srityje yra idealus kūrėjams, norintiems atlikti sudėtingesnę vaizdo analizę, duomenų išgavimą ir vizualinius klausimus bei atsakymus, o tai reiškia, kad jis gali įgalinti pažangesnes programas, pvz., žaidimo asistentus ar A/B bandymų eksperimentus, kuriems reikia greitų atsakymų.
Pirmieji įspūdžiai iš pirmųjų vartotojų
Iki šiol pirmieji vartotojai buvo labai sužavėti modeliu, ypač jo etaloninėmis savybėmis.
Ką tai reiškia įmonės AI naudojimui
Kadangi „Gemini 3 Flash“ dabar yra numatytasis „Google“ paieškos ir „Gemini“ programos variklis, matome "Flash-ifikacija" pasienio žvalgybos. Profesionalų lygio samprotavimus paversdama nauju pagrindu, „Google“ nustato spąstus lėtesniems rinkos dalyviams.
Integracija į tokias platformas kaip „Google Antigravity“ rodo, kad „Google“ ne tik parduoda modelį; tai parduoda infrastruktūrą autonominei įmonei.
Kūrėjams pradėjus veikti 3 kartus didesniu greičiu ir 90 % nuolaida konteksto talpyklai, "Dvyniai-pirmiausia" strategija tampa įtikinamu finansiniu argumentu. Didelio greičio lenktynėse dėl AI dominavimo „Gemini 3 Flash“ gali būti modelis, kuris pagaliau pasisuks "Vibe kodavimas" iš eksperimentinio pomėgio į gamybai paruoštą realybę.