„Mistral“ naujasis „Codestral“ kodo užbaigimo modelis pakyla trečiųjų šalių sąrašuose

Prisijunkite prie mūsų kasdienių ir savaitinių informacinių biuletenių, kad gautumėte naujausių naujienų ir išskirtinio turinio apie pramonėje pirmaujančią AI aprėptį. Sužinokite daugiau

„Mistral“ atnaujino savo atvirojo kodo kodavimo modelį „Codestral“, kuris yra populiarus tarp programuotojų, ir išplėtė konkurenciją dėl į kodavimą orientuotų modelių, skirtų kūrėjams.

Tinklaraščio įraše bendrovė teigė, kad atnaujino modelį su efektyvesne architektūra, kad sukurtų Codestral 25.01, žada, kad Mistral modelis bus „aiškus kodavimo lyderis savo svorio kategorijoje“ ir dvigubai greitesnis nei ankstesnė versija.

Kaip ir originalus Codestral, Codestral 25.01 yra optimizuotas mažo vėlavimo, didelio dažnio veiksmams ir palaiko kodo taisymą, testų generavimą ir užpildymo viduryje užduotis. Bendrovė teigė, kad tai gali būti naudinga įmonėms, turinčioms daugiau duomenų ir modelio gyvenamosios vietos naudojimo atvejus.

Lyginamieji testai parodė, kad Codestral 25.01 geriau pasirodė atliekant testus, koduojančius Python, ir surinko 86,6% HumanEval testo. Jis pranoko ankstesnę Codestral, Codellama 70B Instruct ir DeepSeek Coder 33B instrukcijų versiją.

Ši Codestral versija bus prieinama kūrėjams, kurie yra Mistral IDE įskiepių partneriai. Vartotojai gali įdiegti Codestral 25.01 vietoje naudodami kodo asistentą Tęsti. Jie taip pat gali pasiekti modelio API per „Mistral’s la Plateforme“ ir „Google Vertex AI“. Modelį galima peržiūrėti „Azure AI Foundry“ ir netrukus bus „Amazon Bedrock“.

Vis daugiau kodavimo modelių

Praėjusių metų gegužę „Mistral“ išleido „Codestral“ kaip pirmąjį į kodą orientuotą modelį. 22B parametrų modelis galėjo koduoti 80 skirtingų kalbų ir pranoko kitus į kodą orientuotus modelius. Nuo tada „Mistral“ išleido „Codestral-Mamba“ – kodų generavimo modelį, sukurtą ant Mamba architektūros, kuris gali generuoti ilgesnes kodo eilutes ir apdoroti daugiau įvesties.

Ir atrodo, kad Codestral 25.01 susidomėjimas jau yra didelis. Praėjus vos kelioms valandoms po „Mistral“ paskelbimo, modelis jau veržiasi į „Copilot“ arenos lyderių sąrašus.

Kodo rašymas buvo viena iš pirmųjų pagrindų modelių savybių, net ir bendresnės paskirties modeliams, tokiems kaip OpenAI o3 ir Anthropic’s Claude. Tačiau per pastaruosius metus patobulinti specifiniai kodavimo modeliai ir dažnai pranoksta didesnius modelius.

Vien per pastaruosius metus kūrėjams buvo pateikti keli specifiniai kodavimo modeliai. Lapkričio mėnesį „Alibaba“ išleido „Qwen2.5-Coder“. Kinijos DeepSeek Coder tapo pirmuoju modeliu, kuris birželį įveikė GPT-4 Turbo. „Microsoft“ taip pat pristatė GRIN-MoE – ekspertų (MOE) pagrindu sukurtą modelį, kuris gali koduoti ir išspręsti matematikos problemas.

Niekas neišsprendė amžinų diskusijų dėl bendros paskirties modelio, kuris mokosi visko, arba sutelkto modelio, kuris moka tik koduoti, pasirinkimo. Kai kurie kūrėjai teikia pirmenybę tokiam modeliui kaip Claude randamų galimybių platumas, tačiau kodavimo modelių gausa rodo konkretumo poreikį. Kadangi Codestral yra išmokytas koduoti duomenis, jis, žinoma, bus geriau kodavimo užduotis, o ne rašyti el. laiškus.

Kasdien įžvalgos apie verslo naudojimo atvejus su VB Daily

Jei norite padaryti įspūdį savo viršininkui, „VB Daily“ jums padės. Suteikiame jums informaciją apie tai, ką įmonės daro su generuojamuoju AI, nuo reguliavimo pokyčių iki praktinio diegimo, kad galėtumėte pasidalinti įžvalgomis apie didžiausią IG.

Perskaitykite mūsų privatumo politiką

Ačiū, kad užsiprenumeravote. Daugiau VB naujienlaiškių rasite čia.

Įvyko klaida.

Source link

Vis daugiau kodavimo modelių

Susiję įrašai