„Lambda“ paleidžia išvados kaip paslaugos API | VentureBeat


Prisijunkite prie mūsų kasdienių ir savaitinių naujienlaiškių, kad gautumėte naujausių naujienų ir išskirtinio turinio apie pramonėje pirmaujančią AI aprėptį. Sužinokite daugiau


„Lambda“ yra 12 metų veikianti San Francisko įmonė, geriausiai žinoma dėl to, kad pagal poreikį siūlo grafikos apdorojimo blokus (GPU) kaip paslaugą mašininio mokymosi tyrinėtojams ir AI modelių kūrėjams bei instruktoriams.

Tačiau šiandien ji žengia dar vieną žingsnį į priekį, pristatydama Lambda Inference API (aplikacijų programavimo sąsają), kuri, jos teigimu, yra pigiausia tokio pobūdžio paslauga rinkoje. API leidžia įmonėms diegti AI modelius ir programas galutiniams vartotojams, nesijaudinant dėl ​​skaičiavimo įsigijimo ar priežiūros.

Paleidimas papildo esamą „Lambda“ dėmesį į GPU grupių teikimą mokymui ir mašininio mokymosi modelių koregavimui.

„Mūsų platforma yra visiškai vertikali, o tai reiškia, kad galime žymiai sutaupyti galutinių vartotojų, palyginti su kitais tiekėjais, tokiais kaip OpenAI“, – vaizdo skambučio interviu su VentureBeat sakė Robertas Brooksas, Lambda pajamų viceprezidentas. „Be to, nėra greičio ribų, trukdančių keisti mastelį, ir norint pradėti, nereikia kalbėtis su pardavėju.

Tiesą sakant, kaip Brooksas pasakojo „VentureBeat“, kūrėjai gali pereiti į naują „Lambda Inference API“ tinklalapį, sugeneruoti API raktą ir pradėti greičiau nei per penkias minutes.

Lambda’s Inference API palaiko pažangiausius modelius, tokius kaip Meta’s Llama 3.3 ir 3.1, Nous’s Hermes-3 ir Alibaba’s Qwen 2.5, todėl tai yra viena iš labiausiai prieinamų parinkčių mašininio mokymosi bendruomenei. Visą sąrašą rasite čia ir apima:

  • deepseek-coder-v2-lite-instruct
  • dracarys2-72b-instrukcija
  • hermes3-405b
  • hermes3-405b-fp8-128k
  • hermes3-70b
  • hermes3-8b
  • lfm-40b
  • lama3.1-405b-instruct-fp8
  • lama3.1-70b-instruct-fp8
  • lama3.1-8b-instrukcija
  • lama3.2-3b-instrukcija
  • lama3.1-nemotron-70b-instrukcija
  • lama3.3-70b

Mažesnių modelių, tokių kaip „Llama-3.2-3B-Instruct“, kaina prasideda nuo 0,02 USD už milijoną žetonų, o didesniems, moderniems modeliams, pvz., „Llama 3.1-405B-Instruct“, siekia iki 0,90 USD už milijoną žetonų.

„Lambda“ įkūrėjas ir generalinis direktorius Stephenas Balabanas neseniai pasakė „X“: „Nustokite švaistyti pinigus ir pradėkite naudoti Lambda LLM išvadai“. Balabanas paskelbė grafiką, kuriame parodyta, kiek kainuoja dirbtinio intelekto modeliai, palyginti su konkurentais šioje erdvėje.

Be to, skirtingai nuo daugelio kitų paslaugų, „Lambda“ mokamo mokesčio modelis užtikrina, kad klientai mokėtų tik už naudojamus žetonus, todėl nebereikia prenumeratos ar riboto tarifo planų.

AI kilpos uždarymas

„Lambda“ jau daugiau nei dešimtmetį palaiko AI pažangą naudodama savo GPU pagrįstą infrastruktūrą.

Nuo techninės įrangos sprendimų iki mokymo ir tobulinimo galimybių, bendrovė sukūrė patikimo partnerio įmonėms, mokslinių tyrimų institucijoms ir pradedantiesiems reputaciją.

„Supraskite, kad Lambda jau daugiau nei dešimtmetį diegė GPU mūsų vartotojų bazėje, todėl mes tiesiogine prasme sėdime ant dešimčių tūkstančių Nvidia GPU, o kai kurie iš jų gali būti iš senesnių ir naujesnių gyvavimo ciklų, todėl galime kad vis tiek iš tų AI lustų išnaudotų kuo daugiau naudos platesnei ML bendruomenei, taip pat mažesnėmis sąnaudomis“, – aiškino Brooksas. „Paleidę Lambda Inference, uždarome viso AI kūrimo gyvavimo ciklo kilpą. Naujoji API įteisina tai, ką daugelis inžinierių jau darė Lambda platformoje – naudojo ją išvadoms daryti, bet dabar su specialia paslauga, kuri supaprastina diegimą.

Brooksas pažymėjo, kad jos gilus GPU išteklių rezervuaras yra vienas iš skiriamųjų Lambda bruožų, pakartodamas, kad „Lambda per pastarąjį dešimtmetį įdiegė dešimtis tūkstančių GPU, todėl galime pasiūlyti ekonomiškus sprendimus ir maksimalų naudingumą tiek senesniems, tiek naujesniems AI lustams. .

Šis GPU pranašumas leidžia platformai palaikyti trilijonų žetonų mastelį kas mėnesį, suteikiant lankstumo tiek kūrėjams, tiek įmonėms.

Atviras ir lankstus

Lambda pozicionuoja save kaip lanksčią alternatyvą debesų milžinams, siūlydama neribotą prieigą prie didelio našumo išvadų.

„Norime mašininio mokymosi bendruomenei suteikti neribotą prieigą prie ribojamo greičio API. Galite prijungti ir žaisti, skaityti dokumentus ir greitai padidinti iki trilijonų žetonų“, – paaiškino Brooksas.

API palaiko daugybę atvirojo kodo ir patentuotų modelių, įskaitant populiarius pagal instrukcijas suderintus Llama modelius.

Bendrovė taip pat užsiminė artimiausiu metu plėstis į multimodalines programas, įskaitant vaizdo ir vaizdo generavimą.

„Iš pradžių mes orientuojamės į teksto pagrindu veikiančias LLM, bet netrukus išsiplėsime į multimodalinius ir vaizdo teksto modelius“, – sakė Brooksas.

Kūrėjų ir įmonių aptarnavimas užtikrinant privatumą ir saugumą

Lambda Inference API skirta plačiam vartotojų ratui – nuo ​​pradedančiųjų įmonių iki didelių įmonių, žiniasklaidos, pramogų ir programinės įrangos kūrimo srityse.

Šios pramonės šakos vis dažniau imasi dirbtinio intelekto, kad galėtų naudoti tokias programas kaip teksto apibendrinimas, kodų generavimas ir generatyvus turinio kūrimas.

„Mūsų platformoje nėra saugomi ir nesidalinami naudotojų duomenys. Mes veikiame kaip kanalas, skirtas teikti duomenis galutiniams vartotojams, užtikrinant privatumą“, – pabrėžė Brooksas, sustiprindamas „Lambda“ įsipareigojimą užtikrinti saugumą ir vartotojų kontrolę.

Kadangi dirbtinio intelekto naudojimas ir toliau auga, naujoji „Lambda“ paslauga yra pasirengusi pritraukti dėmesį iš įmonių, ieškančių ekonomiškai efektyvių dirbtinio intelekto modelių diegimo ir priežiūros sprendimų. Pašalinusi įprastas kliūtis, tokias kaip tarifų ribos ir didelės veiklos sąnaudos, „Lambda“ tikisi suteikti daugiau organizacijų galimybių panaudoti AI potencialą.

„Lambda Inference“ API yra prieinama dabar, su išsamia kainodara ir dokumentacija pasiekiama „Lambda“ svetainėje.



Source link

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -