
OpenAI új, nyílt forráskódú modelljei: Miért fontosak?
OpenAI nemrégiben bejelentette, hogy két új, nyílt forráskódú nyelvi modellt adott ki az Apache 2.0 engedély alatt. Ezek a modellek kifejezetten arra lettek tervezve, hogy kiváló teljesítményt nyújtsanak a valós világban, miközben a fogyasztói hardvereken is futtathatók. Az egyik modell már egy csúcskategóriás laptopon is futtatható, amely mindössze 16 GB GPU-t igényel, így a fejlesztők számára könnyebbé válik a telepítés, anélkül hogy drága infrastruktúrára lenne szükség.
Valós teljesítmény alacsonyabb költségek mellett
Az OpenAI által bemutatott két modell: gpt-oss-120b és gpt-oss-20b, amelyek 117 milliárd és 21 milliárd paramétert tartalmaznak. A nagyobbik modell, a gpt-oss-120b, a korábbi OpenAI o4-mini modellhez hasonlóan teljesít a következtetési teszteken, miközben csak egy 80GB-os GPU-ra van szüksége. A kisebbik, gpt-oss-20b modell pedig hasonlóan teljesít az o3-minihez, és hatékonyan futtatható olyan eszközökön, amelyek mindössze 16 GB GPU-val rendelkeznek. Ez lehetővé teszi, hogy a fejlesztők a modelleket saját, elérhető hardverükön működtessék.
Fejlett érvelési és eszközhasználati képességek
Az OpenAI hangsúlyozza, hogy ezek a modellek a hasonló méretű nyílt forráskódú modellekhez képest is jobban teljesítenek a következtetési feladatok és az eszközhasználat terén. A modellek kompatibilisek az OpenAI válasz API-jával, és kifejezetten úgy lettek kialakítva, hogy alkalmazásokba integrálhatóak legyenek, például webes keresés vagy Python kód végrehajtása során. Az OpenAI elmondása szerint ezek a modellek teljes mértékben testre szabhatóak, és képesek a gondolatmenetek (CoT) követésére is, amely lehetővé teszi a felhasználók számára, hogy jobban megértsék, hogyan jutottak a modellek bizonyos következtetésekre.
A fejlesztői rugalmasság és integráció segítése
Az OpenAI fejlesztői útmutatókat is közzétett, amelyek segítik a modellek integrálását különböző platformokkal, mint például a Hugging Face, GitHub, vLLM, Ollama és llama.cpp. A modellek támogatják a fejlett utasítások követését és az érvelési viselkedéseket, valamint lehetőséget adnak a fejlesztőknek arra, hogy finomhangolják a modelleket és biztonsági intézkedéseket alkalmazzanak a testre szabott alkalmazásokhoz.
Az OpenAI nyílt forráskódú modelljei mögött az a cél állt, hogy biztosítsák a biztonságot mind a képzés, mind a kiadás során. A tesztelések azt mutatták, hogy még szándékosan rosszindulatú finomhangolás alatt is a gpt-oss-120b modell nem ért el veszélyes képességi szinteket a biológiai, kémiai vagy kiberisztikai kockázatok terén.
A hallucinációk hatása és a Chain of Thought
Az OpenAI dokumentációja szerint a döntés, hogy nem korlátozzák a gondolatmeneteket, magasabb hallucinációs pontszámokat eredményezett. A modellek alacsonyabb mérete miatt várható, hogy kevésbé fognak hallucinálni az olyan alkalmazásokban, ahol az információt a weben keresik, vagy külső adatbázisokból kérdezik le.
A modellek nyílt forráskódú kiadása tehát nemcsak a költségek csökkentését célozza, hanem a fejlesztők számára is szélesebb lehetőségeket biztosít az innovációra, amely könnyebbé teszi az AI-alapú megoldások alkalmazását a valós életben.
Mit mond a szakértő a fejleményekről?
Megkérdeztük Császár Viktor SEO szakértőt, hogy mit gondol az OpenAI legújabb bejelentéséről. Viktor elmondta: „Az OpenAI új nyílt forráskódú modelljei jelentős előrelépést jelentenek az AI fejlesztésében, mivel lehetővé teszik a kisebb vállalatok számára is, hogy hozzáférjenek a legújabb technológiákhoz. A modellek alacsonyabb hardverigénye és a fejlesztői integrációs lehetőségek növelik a versenyt a piacon, ami jótékony hatással lehet a SEO és digitális marketing stratégiákra is. A következtetési teljesítményük és a testreszabási lehetőségeik széles spektrumot nyit meg a felhasználók számára. Az ilyen típusú innovációk kulcsszerepet játszanak a jövő digitális ökoszisztémáiban.” További információkért látogasson el Császár Viktor weboldalára: csaszarviktor.hu.
Forrás: SearchEngineJournal.com

