Protinga neapdoroto skaičiavimo architektūra: „Deepseek“ sudužo „didesnis yra geresnis“ požiūris į AI plėtrą

Prisijunkite prie mūsų kasdienių ir savaitinių informacinių biuletenių, kad gautumėte naujausius atnaujinimus ir išskirtinį turinį apie pramonės šakos pirmaujančią AI aprėptį. Sužinokite daugiau

AI pasakojimas pasiekė kritinį posūkio tašką. „Deepseee“ proveržis-pasiekiantis moderniausius rezultatus, nepasikliaujant pažangiausiais lustais-įrodo, ką daugelis gruodžio mėn. Daugelis „Aurips“ jau paskelbė: AI ateitis nėra susijusi su daugiau skaičiavimo problemomis-tai yra apie tai, kaip šios sistemos perdaryti, kaip šios sistemos yra įsivaizduojamos, kaip šios sistemos yra įsivaizduojamos, kaip šios sistemos įsivaizduoti, kaip šios sistemos yra įsivaizduojamos, kaip šios sistemos įsivaizduoti Dirbkite su žmonėmis ir mūsų aplinka.

Aš, kaip „Stanford“ išsilavinęs kompiuterių mokslininkas, kuris buvo ir AI plėtros pažadų, ir pavojų, matau, kad ši akimirka yra dar labiau transformuojanti nei „ChatGpt“ debiutas. Mes įvedame tai, ką kai kurie vadina „samprotavimu Renesansu“. „Openai’s O1“, „Deepseek“ R1 ir kiti juda per žiaurią jėgą link kažko protingesnio-ir tai daro su precedento neturinčiu efektyvumu.

Šis poslinkis negalėjo būti laiku. Buvęs „Openai“ vyriausioji mokslininkė Ilja Sutskever pareiškė, kad „išankstinis pranešimas pasibaigs“, nes, kai skaičiavimo galia auga, mus suvaržė baigtiniai interneto duomenys. „Deepseek“ proveržis patvirtina šią perspektyvą – Kinijos kompanijos tyrėjai pasiekė palyginamą našumą su „Openai“ O1 kainos dalimi, o tai parodė, kad kelias į priekį yra ne tik naujovės, o ne tik neapdorota skaičiavimo galia.

Turinys:

Išplėstinė AI be masinio išankstinio mokymo

Pasaulio modeliai žingsniuoja, kad užpildytų šią spragą. Pasaulio laboratorijos neseniai „World Labs“ 230 milijonų dolerių kaupimas AI sistemoms, suprantančioms realybę, kaip žmonės, lygiagrečiai „Deepseek“ požiūriui, kur jų R1 modelis rodo „Aha!“ Akimirkos-sustojimas iš naujo įvertinti problemas, kaip tai daro žmonės. Šios sistemos, įkvėptos žmogaus pažinimo procesų, žada viską pakeisti nuo aplinkos modeliavimo iki žmogaus sąveikos.

Matome ankstyvą pergalę: neseniai „Meta“ atnaujinimas jų „Ray-Ban Smart“ akiniams suteikia nuolatinius, kontekstinius pokalbius su AI padėjėjais be „Wake Words“, kartu su realiojo laiko vertimu. Tai nėra tik funkcijų atnaujinimas-tai peržiūra, kaip AI gali sustiprinti žmogaus galimybes, nereikalaujant masinių iš anksto išmokytų modelių.

Tačiau ši evoliucija kyla iš niuansų iššūkių. Nors „Deepseek“ dramatiškai sumažino sąnaudas naudojant novatoriškus mokymo metodus, šis efektyvumo proveržis paradoksaliai galėtų padidinti bendrą išteklių vartojimą – tai reiškinys, žinomas kaip „Jevons“ paradoksas, kai dėl technologinio efektyvumo pagerėjimo dažnai padidėja, o ne sumažėja išteklių naudojimas.

AI atveju pigesni mokymai gali reikšti daugiau modelių, kuriuos moko daugiau organizacijų, o tai gali padidinti grynosios energijos suvartojimą. Tačiau „Deepseeek“ naujovė yra kitokia: parodant, kad moderniausi veiklos rezultatai yra įmanomi be pažangiausios aparatinės įrangos, jie ne tik daro AI efektyvesnę-jie iš esmės keičia, kaip mes artėjame prie modelio plėtros.

Šis perėjimas prie protingos architektūros per neapdorotą skaičiavimo galią galėtų padėti mums išvengti „Jevons“ paradokso spąstų, nes dėmesys juda nuo „Kiek galime sau leisti?“ į „Kaip protingai galime suprojektuoti savo sistemas?“ Kaip pažymi UCLA profesorius Guy Van Den Broeckas, „Bendros kalbos modelio samprotavimų išlaidos tikrai nesumažėja“. Šių sistemų poveikis aplinkai išlieka didelis, todėl pramonė skatina veiksmingesnius sprendimus – būtent tokios rūšies inovacijos reiškia „Deepseek“.

Prioritetų nustatymas efektyvioms architektūroms

Šis poslinkis reikalauja naujų požiūrių. „Deepseek“ sėkmė patvirtina faktą, kad ateitis nėra susijusi su didesnių modelių kūrimu – tai yra protingesnių, efektyvesnių, harmoningai su žmogaus intelektu ir aplinkos apribojimų, kūrimas.

„Meta“ vyriausiasis AI mokslininkas Yannas Lecunas numato būsimas sistemas, praleidžiančias dienas ar savaites mąstydamas dėl sudėtingų problemų, panašiai kaip tai daro žmonės. „Deepseek’s-R1“ modelis, turintis galimybę pristabdyti ir persvarstyti metodus, yra žingsnis link šios vizijos. Nors šis požiūris reikalauja daug išteklių, šis požiūris galėtų duoti proveržį klimato kaitos sprendimuose, sveikatos priežiūros naujovėse ir už jos ribų. Bet kadangi „Carnegie Mellon“ „Ameet Talwalkar“ protingai perspėja, turime suabejoti kiekvienu, tvirtinančiu tikrumą dėl to, kur šios technologijos mus ves.

Įmonių lyderiams šis poslinkis yra aiškus kelias į priekį. Turime pirmenybę teikti efektyviai architektūrai. Tas, kuris gali:

Diegkite specializuotų AI agentų grandines, o ne pavienius masyvius modelius.
Investuokite į sistemas, kurios optimizuoja tiek veiklos, tiek poveikį aplinkai.
Sukurkite infrastruktūrą, kuri palaiko iteracinę, žmonių kūrimą.

Štai kas mane jaudina: „Deepseek“ proveržis įrodo, kad mes pereiname prie „didesnio yra geresnio“ eros ir į ką nors įdomesnio. Išankstiniam savo riboms ir novatoriškoms įmonėms ieškant naujų būdų, kaip pasiekti daugiau, turint mažiau, yra ši neįtikėtina erdvė, atsiverianti į kūrybinius sprendimus.

Išmaniosios mažesnių, specializuotų agentų išmaniosios grandinės nėra tik efektyvesnės – jos padės mums išspręsti problemas taip, kaip niekada neįsivaizdavome. Pradedantiesiems ir įmonėms, norinčioms mąstyti kitaip, tai yra mūsų momentas vėl smagiai praleisti laiką su AI, sukurti tai, kas iš tikrųjų yra prasminga tiek žmonėms, tiek planetai.

„Kiara Nirghin“ yra apdovanojimus pelniusi „Stanford“ technologas, bestselerių autorius ir „Chimos“ įkūrėjas.

„DatadecisionMakers“

Sveiki atvykę į „VentureBeat“ bendruomenę!

„DatAdecisionMakers“ yra ta vieta, kur ekspertai, įskaitant techninius duomenis atliekančius žmones, gali pasidalyti su duomenimis susijusiomis įžvalgomis ir naujovėmis.

Jei norite perskaityti apie pažangiausias idėjas ir naujausią informaciją, geriausią praktiką ir duomenų bei duomenų technologijos ateitį, prisijunkite prie mūsų „DatadecisionMakers“.

Galite net apsvarstyti galimybę prisidėti prie savo straipsnio!

Skaitykite daugiau iš „DatAdecisionMakers“

Source link