Prisijunkite prie mūsų kasdienių ir savaitinių informacinių biuletenių, kad gautumėte naujausius atnaujinimus ir išskirtinį turinį apie pramonės šakos pirmaujančią AI aprėptį. Sužinokite daugiau
Šiandien „Alibaba Cloud“ pristatė savo „Qwen2.5-Max“ modelį, pažymėdamas antrąjį pagrindinį dirbtinio intelekto proveržį iš Kinijos mažiau nei per savaitę, kuris sukėlė JAV technologijų rinkas ir sustiprino susirūpinimą dėl Amerikos ardančios AI lyderystės.
Naujasis modelis pralenkia „Deepseek“ R1 modelį, kuris pirmadienį išsiuntė NVIDIA akcijas 17%, keliuose pagrindiniuose etalonuose, įskaitant areną, „LiveBench“ ir „LiveCodeBench“. „QWEN2.5-MAX“ taip pat demonstruoja konkurencinius rezultatus prieš pramonės lyderius, tokius kaip GPT-4O ir Claude-3.5-SONNET, atliekant pažangių samprotavimų ir žinių testus.
„Mes sukūrėme„ Qwen2.5-Max “, didelį„ Moe LLM “, iš anksto iš anksto pateiktą pagal didžiulius duomenis ir po to, kai buvo mokomi kuruojami SFT ir RLHF receptai“,-tinklaraščio įraše paskelbė „Alibaba Cloud“. Bendrovė pabrėžė savo modelio efektyvumą, o ji buvo išmokyta daugiau nei 20 trilijonų žetonų, tuo pačiu naudodama ekspertų mišinio architektūrą, kuriai reikia žymiai mažiau skaičiavimo išteklių nei tradiciniai metodai.
Šių kinų AI leidimų laikas pagilino Wall Street nerimą dėl JAV technologinės viršenybės. Abu pranešimai kilo per pirmąją prezidento Trumpo savaitę atgal į pareigas, paskatinus klausimus apie JAV lustų eksporto kontrolės veiksmingumą, skirtą sulėtinti Kinijos AI pažangą.
Kaip „Qwen2.5-MAX“ galėtų pakeisti įmonių AI strategijas
CIO ir techniniams lyderiams „Qwen2.5-Max“ architektūra yra galimas įmonių AI diegimo strategijų poslinkis. Jo ekspertų mišinio požiūris rodo, kad konkurencingą AI našumą galima pasiekti be masinių GPU grupių, o tai gali sumažinti infrastruktūros sąnaudas 40–60%, palyginti su tradiciniais didelių kalbos modelių diegimu.
Techninės specifikacijos rodo sudėtingus inžinerinius pasirinkimus, kurie yra svarbūs įmonės priėmimui. Modelis suaktyvina tik specifinius nervų tinklo komponentus kiekvienai užduotims, leisdamas organizacijoms paleisti pažangias AI galimybes kuklesnėms aparatinės įrangos konfigūracijoms.
Šis pirmojo efektyvumo požiūris galėtų pakeisti įmonių AI planus. Užuot labai investavę į duomenų centrų plėtrą ir GPU grupes, techniniai lyderiai gali prioritetą teikti architektūriniam optimizavimui ir efektyviam modelio diegimui. Stiprus modelio kodo generavimo rezultatas („LiveCodeBench: 38,7%“) ir samprotavimo užduotys (arenoje: 89,4%) rodo, kad jis galėtų tvarkyti daugelį įmonių naudojimo atvejų, tuo pačiu reikalaujant žymiai mažiau skaičiavimo pridėtinių išlaidų.
Tačiau techniniai sprendimų priėmėjai turėtų atidžiai apsvarstyti veiksnius, viršijančius neapdorotų veiklos rodiklius. Klausimai apie duomenų suverenitetą, API patikimumą ir ilgalaikę paramą greičiausiai turės įtakos priimant sprendimus, ypač atsižvelgiant į sudėtingą reguliavimo aplinką, supančią Kinijos AI technologijas.

Kinijos AI šuolis: kaip efektyvumas skatina naujoves
„Qwen2.5-Max“ architektūra atskleidžia, kaip Kinijos kompanijos prisitaiko prie JAV apribojimų. Modelyje naudojamas ekspertų mišinys, leidžiantis pasiekti aukštą našumą, turint mažiau skaičiavimo išteklių. Ši naujovė, orientuota į efektyvumą, rodo, kad Kinija galbūt rado tvarų kelią į AI tobulinimą, nepaisant ribotos galimybės naudotis pažangiausiais lustais.
Čia negalima pervertinti techninių pasiekimų. Nors JAV kompanijos daugiausia dėmesio skyrė didelei skaičiavimo jėgai, kurią parodo „Openai“ numatomas daugiau nei 32 000 aukščiausios klasės GPU panaudojimas naujausiems modeliams, Kinijos kompanijos sulaukia sėkmės per architektūrines inovacijas ir efektyvų išteklių naudojimą.
JAV eksporto kontrolė: Kinijos AI renesanso katalizatoriai?
Šie pokyčiai verčia iš esmės įvertinti, kaip technologinis pranašumas gali būti išlaikytas sujungtame pasaulyje. JAV eksporto kontrolė, skirta išsaugoti Amerikos lyderystę AI, gali netyčia paspartinti Kinijos efektyvumo ir architektūros naujoves.
„Duomenų ir modelio dydžio didinimas ne tik parodo modelio intelekto pažangą, bet ir atspindi mūsų nenutrūkstamą įsipareigojimą pradėti novatoriškus tyrimus“, – savo pranešime teigė „Alibaba Cloud“. Bendrovė pabrėžė savo dėmesį į „didelių kalbų modelių mąstymo ir samprotavimo galimybių gerinimą naudojant novatorišką mastelio stiprinimo mokymąsi“.
Ką „Qwen2.5-MAX“ reiškia įmonės AI priėmimui
Įmonių klientams šie pokyčiai galėtų pasakyti prieinamesnę AI ateitį. „Qwen2.5-MAX“ jau galima įsigyti per „Alibaba Cloud“ API paslaugas, siūlančias galimybes, panašias į pagrindinius JAV modelius, esant potencialiai mažesnėms išlaidoms. Šis prieinamumas galėtų pagreitinti AI priėmimą įvairiose pramonės šakose, ypač rinkose, kur išlaidos buvo kliūtis.
Tačiau saugumo problemos išlieka. JAV komercijos departamentas paskelbė „Deepseek“ ir „Qwen2.5-Max“ apžvalgą, kad įvertintų galimas nacionalinio saugumo padarinius. Nepaisant eksporto kontrolės, Kinijos įmonių gebėjimas ugdyti pažangias AI galimybes kelia klausimų apie dabartinių reguliavimo sistemų veiksmingumą.
AI ateitis: efektyvumas dėl valdžios?
Pasaulinė AI kraštovaizdis greitai keičiasi. Prielaida, kad pažengusiai AI plėtrai reikalingi didžiuliai skaičiavimo ištekliai ir pažangiausia aparatinė įranga, yra ginčijama. Kadangi Kinijos kompanijos parodo galimybę pasiekti panašių rezultatų efektyviai įgyvendindamos naujoves, pramonė gali būti priversta persvarstyti savo požiūrį į AI tobulėjimą.
JAV technologijų lyderiams iššūkis dabar yra dvejopas: reaguoti į neatidėliotiną spaudimą rinkoje, kartu kuriant tvarias ilgalaikės konkurencijos strategijas aplinkoje, kurioje aparatinės įrangos pranašumai nebegalės garantuoti lyderystės.
Kitus kelis mėnesius bus labai svarbu, nes pramonė prisitaikys prie šios naujos realybės. Tiek Kinijos, tiek JAV kompanijos žada tolesnę pažangą, pasaulinė AI viršenybės lenktynės patenka į naują etapą – ten, kur efektyvumas ir inovacijos gali pasirodyti svarbesnės nei neapdorota skaičiavimo galia.
Source link