Black Forest Labs paleidžia atvirojo kodo Flux.2 (klein), kad sukurtų dirbtinio intelekto vaizdus greičiau nei per sekundę

Vokietijos dirbtinio intelekto startuolis Black Forest Labs (BFL), įkurtas buvusių Stabilumo dirbtinio intelekto inžinierių, toliau kuria atvirojo kodo AI vaizdų generatorių rinkinį, išleisdamas FLUX.2 (klein) – naują porą mažų modelių – vieną atvirą ir kitą nekomercinį – pabrėžiantį greitį ir mažesnius skaičiavimo reikalavimus, o modeliai generuoja vaizdus per sekundę GB20 per Nvidia.

Vakar išleistoje (klein) serijoje yra du pagrindiniai parametrų skaičiai: 4 milijardai (4B) ir 9 milijardai (9B).

Modelio svorius galima rasti Hugging Face, o kodą – Github.

Nors didesni FLUX.2 šeimos modeliai ((max) ir (pro)), išleisti 2025 m. lapkritį, persekioja fotorealizmo ribas ir "įžeminimo paieška" galimybes, (klein) sukurtas specialiai vartotojų aparatinei įrangai ir delsai svarbioms darbo eigoms.

Puikios naujienos įmonėms, 4B versija yra prieinama pagal Apache 2.0 licenciją, o tai reiškia, kad jos – arba bet kuri organizacija ar kūrėjas – gali naudoti (klein) modelius savo komerciniais tikslais nemokėdami BFL ar jokiems tarpininkams nė cento.

Tačiau daugelis dirbtinio intelekto vaizdų ir medijos kūrimo platformų, įskaitant Fal.ai, pradėjo siūlyti ją už itin mažą kainą, taip pat per savo taikomųjų programų sąsajas (API) ir kaip tiesioginį vartotojui skirtą įrankį. Jau dabar jis sulaukė didelio ankstyvųjų vartotojų pagyrimų dėl savo greičio. Tai, ko jam trūksta dėl bendros vaizdo kokybės, atrodo, kad jis kompensuoja greito generavimo galimybes, atvirą licenciją, prieinamumą ir mažą plotą – tai naudinga įmonėms, norinčioms paleisti vaizdo modelius su savo aparatine įranga arba už ypač mažą kainą.

Taigi, kaip BFL tai padarė ir kuo tai gali būti jums naudinga? Skaitykite toliau, kad sužinotumėte daugiau.

The "Pareto siena" delsos

BFL dokumentacijoje aprašoma techninė filosofija (klein). "Pareto siena" dėl kokybės ir delsos. Paprastais žodžiais tariant, jie bandė išspausti maksimalų įmanomą vaizdo tikslumą į pakankamai mažą modelį, kad galėtų veikti namų žaidimų kompiuteryje be pastebimo atsilikimo.

Bendrovės išleisti našumo rodikliai vaizduoja modelį, sukurtą interaktyvumui, o ne tik paketiniam generavimui.

Remiantis oficialiais Black Forest Labs duomenimis, (klein) modeliai gali sukurti arba redaguoti vaizdus per mažiau nei 0,5 sekundės naudojant šiuolaikinę aparatinę įrangą.

Net standartiniuose vartotojų GPU, pvz., RTX 3090 arba 4070, 4B modelis sukurtas taip, kad patogiai tilptų maždaug 13 GB VRAM.

Šis greitis pasiekiamas per "distiliavimas," procesas, kuriame naudojamas didesnis, sudėtingesnis modelis "moko" mažesnis, efektyvesnis, kad apytiksliai būtų apytiksliai pasiekiami rezultatai. Distiliuotiems (klein) variantams reikia tik keturių žingsnių, kad būtų sukurtas vaizdas. Tai efektyviai paverčia generavimo procesą iš kavos pertraukėlės užduoties į beveik akimirksnį, o tai įgalina tai, ką BFL apibūdina X (anksčiau Twitter) kaip "plėtoti idėjas nuo 0 → 1" realiu laiku.

Po gaubtu: vieninga architektūra

Istoriškai vaizdų generavimui ir vaizdų redagavimui dažnai reikėjo skirtingų vamzdynų arba sudėtingų adapterių (pvz., ControlNets). FLUX.2 (klein) bando jas suvienodinti.

Architektūra iš esmės palaiko teksto į vaizdą, vienos nuorodos redagavimą ir kelių nuorodų kompoziciją, nekeičiant modelių.

Remiantis GitHub paskelbta dokumentacija, modeliai palaiko:

  • Kelių nuorodų redagavimas: Vartotojai gali įkelti iki keturių nuorodų vaizdų (arba dešimt žaidimų aikštelėje), kad nustatytų išvesties stilių ar struktūrą.

  • Šešioliktainio kodo spalvų valdymas: Dažnas dizainerių skausmo taškas tampa "būtent tą raudoną atspalvį." Naujieji modeliai priima konkrečius šešioliktainius kodus raginimuose (pvz., #800020), kad priverstų tiksliai perteikti spalvas.

  • Struktūrinis raginimas: Modelis analizuoja į JSON panašias struktūrines įvestis griežtai apibrėžtoms kompozicijoms – funkcija aiškiai skirta programiniam generavimui ir įmonės konvejeriams.

Licencijavimo padalijimas: atvirasis svoris ir atvirasis šaltinis

Pradedantiesiems ir kūrėjams, besikuriantiems BFL technologijomis, labai svarbu suprasti šios leidimo licencijavimo aplinką. BFL priėmė padalijimo strategiją, kuri atskiria "mėgėjas/tyrėjas" naudoti nuo "komercinė infrastruktūra."

  1. FLUX.2 (klein) 4B: Išleista pagal Apache 2.0. Tai leistina nemokama programinės įrangos licencija, leidžianti naudoti komerciniais tikslais, keisti ir platinti. Jei kuriate mokamą programą, SaaS platformą ar žaidimą, kuriame integruota AI generacija, galite naudoti 4B modelį nemokamai.

  2. FLUX.2 (klein) 9B ir (dev): Išleista pagal FLUX nekomercinę licenciją. Šiuos svarelius tyrėjai ir mėgėjai gali atsisiųsti ir su jais eksperimentuoti, tačiau be atskiro susitarimo jų negalima naudoti komercinėms reikmėms.

Dėl šio skirtumo 4B modelis yra tiesioginis konkurentas kitiems atviro svorio modeliams, pvz., Stable Diffusion 3 Medium arba SDXL, tačiau turi modernesnę architektūrą ir leidžiančią licenciją, kuri pašalina teisinį neaiškumą pradedantiesiems.

Ekosistemų integravimas: ComfyUI ir ne tik

BFL aiškiai suvokia, kad modelis yra toks geras, koks yra jį valdančios priemonės. Kartu su modelio sumažėjimu komanda išleido oficialius ComfyUI darbo eigos šablonus, mazgu pagrįstą sąsają, kuri tapo standartine integruota kūrimo aplinka (IDE) AI menininkams.

Darbo eigos – konkrečiai image_flux2_klein_text_to_image.json ir redagavimo variantai – leidžia vartotojams nedelsiant nuvilkti naujas galimybes į esamus vamzdynus.

Bendruomenės reakcija socialinėje žiniasklaidoje buvo sutelkta į šią darbo eigos integraciją ir greitį. Įraše apie X oficialioje Black Forest Labs paskyroje buvo pabrėžtas modelio gebėjimas "greitai ištirti specifinę estetiką," rodomas vaizdo įrašas, kuriame vaizdo stilius akimirksniu pasikeitė, kai vartotojas nagrinėjo parinktis.

Kodėl tai svarbu įmonių AI sprendimus priimantiems asmenims

FLUX.2 (klein) išleidimas signalizuoja apie brendimą generatyviojoje dirbtinio intelekto rinkoje, pereinant nuo pradinio naujumo etapo į laikotarpį, kurį apibrėžia naudingumas, integracija ir greitis.

Vadovaujantiems dirbtinio intelekto inžinieriams, kurie nuolat žongliruoja poreikį suderinti greitį su kokybe, šis pokytis yra labai svarbus. Šie profesionalai, valdantys visą modelių gyvavimo ciklą nuo duomenų paruošimo iki diegimo, dažnai susiduria su kasdieniu iššūkiu integruoti sparčiai tobulėjančius įrankius į esamas darbo eigas.

Distiliuoto 4B modelio prieinamumas pagal „Apache 2.0“ licenciją yra praktiškas sprendimas tiems, kurie orientuojasi į greitą diegimą ir tikslinimą, kad pasiektų konkrečius verslo tikslus, leidžiančius apeiti delsos trukdžius, kurie paprastai kenkia kuriant aukštos kokybės vaizdus.

Vyresniesiems dirbtinio intelekto inžinieriams, orientuotiems į orkestravimą ir automatizavimą, pasekmės yra vienodos. Šie ekspertai yra atsakingi už keičiamo DI vamzdynų kūrimą ir modelio vientisumo palaikymą įvairiose aplinkose, dažnai dirbdami pagal griežtus biudžeto apribojimus.

Lengvas (klein) šeimos pobūdis tiesiogiai sprendžia efektyvių sistemų su ribotais ištekliais diegimo iššūkį. Naudodami modelį, kuris telpa į vartotojui skirtą VRAM, orkestravimo specialistai gali sukurti ekonomiškai efektyvius vietinius išvadų vamzdynus, kurie padės išvengti didelių eksploatacinių išlaidų, susijusių su didžiuliais patentuotais modeliais.

Net IT saugos direktoriui perėjimas prie galingų, vietoje paleidžiamų atviro svorio modelių suteikia aiškų pranašumą. Užduotis apsaugoti organizaciją nuo kibernetinių grėsmių ir valdyti saugos operacijas naudojant ribotus išteklius, pasitikėjimas išorinėmis API jautrioms kūrybinėms darbo eigoms gali būti pažeidžiamumas.

Aukštos kokybės modelis, veikiantis vietoje, leidžia saugos lyderiams taikyti sankcijas AI įrankiams, kurie saugo nuosavybės teise priklausančius duomenis įmonės užkardoje, subalansuodami verslo veiklos poreikius su tvirtomis saugos priemonėmis, kurių jie privalo laikytis.

Nuoroda į informacijos šaltinį

Draugai: - Marketingo paslaugos - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Karščiausios naujienos - Ultragarsinis tyrimas - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai -  Padelio treniruotės - Pranešimai spaudai -