JAE „Falcon 3“ meta iššūkį atvirojo kodo lyderiams, nes didėja mažų dirbtinio intelekto modelių paklausa


Prisijunkite prie mūsų kasdienių ir savaitinių naujienlaiškių, kad gautumėte naujausių naujienų ir išskirtinio turinio apie pramonėje pirmaujančią AI aprėptį. Sužinokite daugiau


JAE vyriausybės remiamas Technologijų inovacijų institutas (TII) paskelbė apie Falcon 3 – atvirojo kodo mažų kalbų modelių (SLM) šeimos, sukurtos efektyviai veikti lengvoje, vienu GPU pagrįstą infrastruktūrą, pristatymą.

„Falcon 3“ turi keturių dydžių modelius – 1B, 3B, 7B ir 10B – su baziniais ir nurodymų variantais, kurie žada demokratizuoti kūrėjų, tyrėjų ir įmonių prieigą prie pažangių AI galimybių. Remiantis „Hugging Face“ lyderių sąrašu, modeliai savo dydžio klasėje jau lenkia populiarius atvirojo kodo analogus, įskaitant „Meta’s Llama“ ir kategorijos lyderį „Qwen-2.5“.

Plėtra vyksta tuo metu, kai SLM, turinčių mažiau parametrų ir paprastesnio dizaino nei LLM, paklausa sparčiai auga dėl jų efektyvumo, įperkamumo ir galimybės diegti įrenginiuose su ribotais ištekliais. Jie tinka įvairioms pramonės šakoms, pvz., klientų aptarnavimui, sveikatos priežiūrai, programėlėms mobiliesiems ir daiktų internetui, kur tipiškos LLM gali būti per brangios, kad galėtų efektyviai veikti. Remiantis „Valuates Reports“, tikimasi, kad šių modelių rinka augs, o CAGR per ateinančius penkerius metus sieks beveik 18%.

Ką „Falcon 3“ pateikia ant stalo?

Išmokyta naudoti 14 trilijonų žetonų – daugiau nei dvigubai daugiau nei pirmtakas „Falcon 2“ – „Falcon 3“ šeima naudoja tik dekoderio architektūrą su sugrupuotu užklausų dėmesiu, kad būtų galima dalytis parametrais ir sumažinti rakto vertės (KV) talpyklos atminties naudojimą darant išvadas. Tai leidžia greičiau ir efektyviau atlikti įvairias tekstu pagrįstas užduotis.

Iš esmės modeliai palaiko keturias pagrindines kalbas – anglų, prancūzų, ispanų ir portugalų – ir turi 32K konteksto langą, leidžiantį apdoroti ilgas įvestis, pvz., sunkiai surašytus dokumentus.

„Falcon 3 yra universalus, sukurtas tiek bendroms, tiek specializuotoms užduotims, todėl vartotojams suteikiamas didžiulis lankstumas. Jo bazinis modelis puikiai tinka generacinėms programoms, o instrukcijų variantas puikiai tinka atliekant pokalbio užduotis, pvz., klientų aptarnavimą ar virtualius asistentus“, – savo svetainėje pažymi TII.

Remiantis „Hugging Face“ lyderių sąrašu, nors visi keturi „Falcon 3“ modeliai veikia gana gerai, 10B ir 7B versijos yra šou žvaigždės, pasiekiančios pažangiausių samprotavimo, kalbos supratimo, instrukcijų sekimo, kodo ir matematikos užduotys.

Tarp 13B parametrų dydžio klasės modelių Falcon 3 10B ir 7B versijos lenkia konkurentus, įskaitant Google Gemma 2-9B, Meta Llama 3.1-8B, Mistral-7B ir Yi 1.5-9B. Jie netgi lenkia Alibaba kategorijos lyderį Qwen 2.5-7B daugelyje etalonų, tokių kaip MUSR, MATH, GPQA ir IFEval, išskyrus MMLU, kuris yra testas, skirtas įvertinti, kaip kalbos modeliai supranta ir apdoroja žmogaus kalbą.

Falcon 3 etalonas

Diegimas įvairiose pramonės šakose

„Falcon 3“ modeliai dabar pasiekiami Hugging Face platformoje, todėl TII siekia aptarnauti platų vartotojų ratą, kad būtų galima ekonomiškai efektyviai diegti dirbtinį intelektą be skaičiavimo kliūčių. Dėl savo gebėjimo atlikti konkrečias, į domeną orientuotas užduotis, kurių apdorojimas yra greitas, modeliai gali aprūpinti įvairias programas per kraštus ir privatumui jautrioje aplinkoje, įskaitant klientų aptarnavimo pokalbių robotus, personalizuotas rekomendacijų sistemas, duomenų analizę, sukčiavimo aptikimą, sveikatos priežiūros diagnostiką, tiekimo grandinės optimizavimas ir švietimas.

Institutas taip pat planuoja toliau plėsti Falcon šeimą, pristatydamas modelius su multimodalinėmis galimybėmis. Šie modeliai turėtų pasirodyti 2025 m. sausio mėn.

Pažymėtina, kad visi modeliai buvo išleisti pagal TII Falcon License 2.0, leistiną Apache 2.0 licenciją su priimtina naudojimo politika, skatinančia atsakingą AI kūrimą ir diegimą. Siekdama padėti vartotojams pradėti, TII taip pat pristatė Falcon Playground – testavimo aplinką, kurioje mokslininkai ir kūrėjai gali išbandyti Falcon 3 modelius prieš integruodami juos į savo programas.



Source link

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -