„Google“ išleidžia nemokamą „Gemini 2.0 Flash Thinking“ modelį, spaudžiantį „OpenAI“ aukščiausios kokybės strategiją

Prisijunkite prie mūsų kasdienių ir savaitinių naujienlaiškių, kad gautumėte naujausių naujienų ir išskirtinio turinio apie pramonėje pirmaujančią AI aprėptį. Sužinokite daugiau

„Google“ tyliai išleido pagrindinį savo populiaraus dirbtinio intelekto modelio „Gemini“ atnaujinimą, kuris dabar paaiškina savo samprotavimo procesą, nustato naujus matematinių ir mokslinių užduočių našumo rekordus ir siūlo nemokamą alternatyvą OpenAI aukščiausios kokybės paslaugoms.

Naujasis „Gemini 2.0 Flash Thinking“ modelis, antradienį išleistas „Google AI Studio“ eksperimentiniu pavadinimu „Exp-01-21“, gavo 73,3 % Amerikos kviečiamojo matematikos egzamino (AIME) balo ir 74,2 % GPQA Diamond mokslo. etalonas. Šie rezultatai rodo aiškius patobulinimus, palyginti su ankstesniais dirbtinio intelekto modeliais, ir rodo, kad „Google“ stiprėja pažangių samprotavimų srityje.

„Mes esame tokio tipo planavimo sistemų pionieriai daugiau nei dešimtmetį, pradedant tokiomis programomis kaip AlphaGo, ir įdomu matyti galingą šių idėjų derinį su geriausiais pagrindų modeliais“, – rašė Demis Hassabis, „Google DeepMind“ generalinis direktorius. , įraše X.com (anksčiau Twitter).

Mūsų naujausias „Gemini 2.0 Flash Thinking“ modelio atnaujinimas (pasiekiamas čia: https://t.co/Rr9DvqbUdO) surinko 73,3 % pagal AIME (matematika) ir 74,2 % pagal GPQA Diamond (mokslas). Dėkojame už visus jūsų atsiliepimus, tai labai greita pažanga nuo mūsų pirmojo leidimo, kuris buvo tik praeityje… pic.twitter.com/cM1gNwBoTO
– Demis Hassabis (@demishassabis) 2025 m. sausio 21 d

Turinys:

„Gemini 2.0 Flash Thinking“ muša rekordus, apdorojant milijonus žetonų

Įspūdingiausia modelio savybė yra galimybė apdoroti iki vieno milijono teksto žetonų – penkis kartus daugiau nei OpenAI o1 Pro modelyje – išlaikant greitesnį atsako laiką. Šis išplėstas konteksto langas leidžia modeliui vienu metu analizuoti kelis mokslinius darbus arba didelius duomenų rinkinius, o tai gali pakeisti tai, kaip mokslininkai ir analitikai dirba su dideliais informacijos kiekiais.

„Kaip pirmą eksperimentą, paėmiau įvairius religinius ir filosofinius tekstus ir paprašiau „Gemini 2.0 Flash Thinking“ juos sujungti, išgaunant naujas ir unikalias įžvalgas“, – X.com įraše sakė modelį išbandęs dirbtinio intelekto tyrinėtojas Danas Macas. . „Iš viso apdorojo 970 000 žetonų. Rezultatas yra neįtikėtinas.”

Išleidimas ateina kritiniu AI pramonės evoliucijos momentu. OpenAI neseniai paskelbė apie savo o3 modelį, kuris pagal GPQA Diamond etaloną surinko 87,7%. Tačiau „Google“ sprendimas pasiūlyti savo modelį nemokamai atliekant beta versijos testavimą (su naudojimo apribojimais) gali pritraukti kūrėjus ir įmones, ieškančius alternatyvų OpenAI 200 USD mėnesinei prenumeratai.

Palyginimo rezultatai rodo, kad naujausias „Google Gemini 2.0 Flash Thinking“ modelis žymiai lenkia ankstesnes versijas atliekant matematikos, gamtos mokslų ir samprotavimo užduotis. (Kreditas: Google DeepMind)

„Google“ siūlo nemokamą „Gemini 2.0 Flash Thinking“ su integruotu kodo vykdymu

Jeffas Deanas, „Google DeepMind“ vyriausiasis mokslininkas, pabrėžė modelio patikimumo patobulinimus: „Mes ir toliau kartojame, užtikriname didesnį patikimumą ir sumažiname modelio minčių ir galutinių atsakymų prieštaravimus“, – rašė jis.

Modelis taip pat apima vietinio kodo vykdymo galimybes, leidžiančias kūrėjams paleisti ir išbandyti kodą tiesiogiai sistemoje. Ši funkcija kartu su patobulintomis prieštaravimų apsaugomis leidžia „Gemini 2.0 Flash Thinking“ tapti rimtu varžovu tiek moksliniams tyrimams, tiek komercinėms programoms.

Pramonės analitikai pažymi, kad „Google“ dėmesys savo samprotavimo proceso paaiškinimui gali padėti išspręsti didėjantį susirūpinimą dėl AI skaidrumo ir patikimumo. Skirtingai nuo tradicinių „juodosios dėžės“ modelių, „Gemini 2.0 Flash Thinking“ rodo savo darbą, todėl vartotojams lengviau suprasti ir patikrinti išvadas.

Mes ir toliau kartojame, užtikrindami didesnį patikimumą ir sumažindami prieštaravimus tarp modelio minčių ir galutinių atsakymų.
Peržiūrėkite kaip gemini-2.0-flash-thinking-exp-01-21 adresu https://t.co/sw0jY6k74m
– Jeffas Deanas (@JeffDean) 2025 m. sausio 21 d

AI skaidrumas tampa nauju mūšio lauku, kai Google meta iššūkį OpenAI

Modelis jau užėmė aukščiausią vietą Chatbot Arena lyderių sąraše, kuris yra ryškus dirbtinio intelekto našumo etalonas, pirmaujantis tokiose kategorijose kaip griežti raginimai, kodavimas ir kūrybinis rašymas.

Tačiau išlieka klausimų dėl modelio veikimo realiame pasaulyje ir apribojimų. Nors etaloniniai balai suteikia vertingos metrikos, jie ne visada tiesiogiai paverčia praktiniu pritaikymu. „Google“ iššūkis bus įtikinti verslo klientus, kad jos nemokamas pasiūlymas gali atitikti arba viršyti aukščiausios kokybės alternatyvų galimybes.

Stiprėjant AI ginklavimosi varžyboms, naujausiame „Google“ leidime siūloma keisti strategiją: pažangias galimybes derinti su prieinamumu. Ar šis metodas padės sumažinti atotrūkį nuo OpenAI, dar reikia pamatyti, tačiau tai tikrai suteikia techninių sprendimų priėmėjams įtikinamą priežastį persvarstyti savo AI partnerystę.

Kol kas aišku viena: atėjo AI era, kuri gali parodyti savo darbą, ir ji prieinama visiems, turintiems „Google“ paskyrą.

Kasdien įžvalgos apie verslo naudojimo atvejus su VB Daily

Jei norite padaryti įspūdį savo viršininkui, „VB Daily“ jums padės. Suteikiame jums informaciją apie tai, ką įmonės daro su generuojamuoju AI, nuo reguliavimo pokyčių iki praktinio diegimo, kad galėtumėte pasidalinti įžvalgomis apie didžiausią IG.

Perskaitykite mūsų privatumo politiką

Ačiū, kad užsiprenumeravote. Daugiau VB naujienlaiškių rasite čia.

Įvyko klaida.