„Openai“ reaguoja į „Deepseeek“ konkurenciją su išsamiais O3-mini samprotavimo pėdsakais

Prisijunkite prie mūsų kasdienių ir savaitinių informacinių biuletenių, kad gautumėte naujausius atnaujinimus ir išskirtinį turinį apie pramonės šakos pirmaujančią AI aprėptį. Sužinokite daugiau

Dabar „Openai“ parodo daugiau informacijos apie „O3-Mini“ samprotavimo procesą, jo naujausią samprotavimo modelį. Pokytis buvo paskelbtas „Openai“ X sąskaitoje ir atsiranda, nes AI laboratorija padidina „Deepseeek-R1“-konkurentų atvirojo modelio, kuris visiškai parodo jo samprotavimo žetonus, spaudimą.

Tokie modeliai, kaip O3 ir R1, vykdo ilgą „mąstymo grandinės“ (COT) procesą, kurio metu jie sukuria papildomus žetonus, kad galėtų suskaidyti problemą, pagrįsti ir išbandyti skirtingus atsakymus bei pasiekti galutinį sprendimą. Anksčiau „Openai“ samprotavimo modeliai paslėpė savo minties grandinę ir tik pateikė aukšto lygio samprotavimo žingsnių apžvalgą. Dėl to vartotojams ir kūrėjams buvo sunku suprasti modelio samprotavimo logiką ir pakeisti jų instrukcijas bei raginimus valdyti ją teisinga linkme.

„Openai“ laikė minties grandinę konkurenciniu pranašumu ir paslėpė ją, kad konkurentai negalėtų kopijuoti, kad treniruojasi jų modeliai. Tačiau naudojant R1 ir kitus atvirus modelius, rodančius visą jų samprotavimo pėdsaką, skaidrumo trūkumas tampa „Openai“ trūkumu.

Naujojoje „O3-Mini“ versijoje pavaizduota išsamesnė COT versija. Nors mes vis dar nematome neapdorotų žetonų, tai suteikia daug daugiau aiškumo samprotavimo procese.

Turinys:

Kodėl tai svarbu programoms

Ankstesniuose O1 ir R1 eksperimentuose mes nustatėme, kad O1 šiek tiek geriau išsprendė duomenų analizę ir samprotavimo problemas. Tačiau vienas iš pagrindinių apribojimų buvo tai, kad nebuvo galimybės išsiaiškinti, kodėl modelis padarė klaidų-ir jis dažnai padarė klaidų, kai susidūrė su nepatogiais realaus pasaulio duomenimis, gautais iš interneto. Kita vertus, „R1“ minties grandinė leido mums pašalinti problemas ir pakeisti mūsų raginimus pagerinti samprotavimus.

Pavyzdžiui, viename iš mūsų eksperimentų abu modeliai nepateikė teisingo atsakymo. Tačiau dėl išsamios R1 minčių grandinės dėka mes sugebėjome sužinoti, kad problema buvo ne su pačiu modeliu, o su atėmimo etapu, kuris surinko informaciją iš interneto. Kituose eksperimentuose „R1“ minties grandinė sugebėjo pateikti mums užuominų, kai jai nepavyko išanalizuoti mūsų pateiktos informacijos, o O1 mums pateikė tik labai grubią apžvalgą, kaip ji suformulavo jos atsakymą.

Mes išbandėme naują „O3-Mini“ modelį ankstesnio eksperimento variante, kurį važiavome su O1. Mes pateikėme modelį tekstiniu failu, kuriame yra įvairių akcijų kainos nuo 2024 m. Sausio mėn. Iki 2025 m. Sausio mėn. Failas buvo triukšmingas ir nekoncentruotas, paprasto teksto ir HTML elementų mišinys. Tada mes paprašėme modelio apskaičiuoti portfelio, kuris kiekvieno mėnesio pirmąją dieną nuo 2024 m. Sausio iki 2025 m. Sausio mėn. Investavo 140 USD į nuostabias 7 akcijas, vertę, paskirstytą tolygiai visoms akcijoms (mes vartojome terminą „MAG 7“. raginimas padaryti tai šiek tiek sudėtingesnį).

„O3-Mini“ lovelė šį kartą buvo tikrai naudinga. Pirma, modelis pagrįstas tuo, kas buvo „Mag 7“, filtruoti duomenis, kad išlaikytų tik atitinkamas atsargas (kad problema būtų sudėtinga, prie duomenų pridėjome keletą ne MAG 7 atsargų), apskaičiavome mėnesinę sumą, kurią reikia investuoti į kiekvieną Atsargos ir atliko galutinius skaičiavimus, kad pateiktų teisingą atsakymą (portfelis būtų vertas apie 2200 USD, nes naujausias laikas, užregistruotas mūsų pateiktame modelyje).

Norint pamatyti naujos minties grandinės ribas, prireiks daug daugiau bandymų, nes „Openai“ vis dar slepia daugybę detalių. Tačiau mūsų vibe patikrinimuose atrodo, kad naujas formatas yra daug naudingesnis.

Ką tai reiškia „Openai“

Kai buvo išleistas „Deepseek-R1“, jis turėjo tris aiškius pranašumus, palyginti su „Openai“ samprotavimo modeliais: jis buvo atviras, pigus ir skaidrus.

Nuo to laiko „Openai“ sugebėjo sutrumpinti spragą. Nors O1 kainuoja 60 USD už milijoną išėjimo žetonų, „O3-Mini“ kainuoja tik 4,40 USD, o daugelyje samprotavimų etalonų pralenkia O1. R1 kainuoja apie 7 USD ir 8 USD už milijoną žetonų JAV teikėjams. („Deepseek“ siūlo R1 už 2,19 USD už milijoną žetonų savo serveriuose, tačiau daugelis organizacijų negalės jo naudoti, nes jis yra priglobtas Kinijoje.)

Naujai pakeitus lovelės išvestį, „Openai“ sugebėjo šiek tiek išspręsti skaidrumo problemą.

Belieka išsiaiškinti, ką „Openai“ padarys, kad būtų galima įsigyti savo modelius. Nuo išleidimo R1 jau buvo pritaikytas, šakinis ir priglobtas daugelio skirtingų laboratorijų ir įmonių, galinčių paversti tai geriausiu įmonių samprotavimo modeliu. Neseniai „Openai“ generalinis direktorius Sam Altmanas prisipažino, kad diskusijose apie atvirojo kodo istoriją yra „neteisingoje istorijos pusėje“. Turėsime pamatyti, kaip šis realizavimas pasireikš būsimuose „Openai“ leidimuose.

Dienos įžvalgos apie verslo naudojimo atvejus su „VB Daily“

Jei norite padaryti įspūdį savo viršininkui, „VB Daily“ jus apėmė. Mes pateikiame jums vidų, ką įmonės daro su generatyvine AI, pradedant nuo reguliavimo perėjimo prie praktinio diegimo, todėl galite pasidalyti įžvalgomis dėl maksimalios IG.

Perskaitykite mūsų privatumo politiką

Dėkojame už prenumeratą. Peržiūrėkite daugiau VB informacinių biuletenių čia.

Įvyko klaida.