Mesterséges intelligencia,  Tartalommarketing

OpenAI új, nyílt forráskódú modelljei: Miért fontosak?

OpenAI nemrégiben bejelentette, hogy két új, nyílt forráskódú nyelvi modellt adott ki az Apache 2.0 engedély alatt. Ezek a modellek kifejezetten arra lettek tervezve, hogy kiváló teljesítményt nyújtsanak a valós világban, miközben a fogyasztói hardvereken is futtathatók. Az egyik modell már egy csúcskategóriás laptopon is futtatható, amely mindössze 16 GB GPU-t igényel, így a fejlesztők számára könnyebbé válik a telepítés, anélkül hogy drága infrastruktúrára lenne szükség.

Valós teljesítmény alacsonyabb költségek mellett

Az OpenAI által bemutatott két modell: gpt-oss-120b és gpt-oss-20b, amelyek 117 milliárd és 21 milliárd paramétert tartalmaznak. A nagyobbik modell, a gpt-oss-120b, a korábbi OpenAI o4-mini modellhez hasonlóan teljesít a következtetési teszteken, miközben csak egy 80GB-os GPU-ra van szüksége. A kisebbik, gpt-oss-20b modell pedig hasonlóan teljesít az o3-minihez, és hatékonyan futtatható olyan eszközökön, amelyek mindössze 16 GB GPU-val rendelkeznek. Ez lehetővé teszi, hogy a fejlesztők a modelleket saját, elérhető hardverükön működtessék.

Fejlett érvelési és eszközhasználati képességek

Az OpenAI hangsúlyozza, hogy ezek a modellek a hasonló méretű nyílt forráskódú modellekhez képest is jobban teljesítenek a következtetési feladatok és az eszközhasználat terén. A modellek kompatibilisek az OpenAI válasz API-jával, és kifejezetten úgy lettek kialakítva, hogy alkalmazásokba integrálhatóak legyenek, például webes keresés vagy Python kód végrehajtása során. Az OpenAI elmondása szerint ezek a modellek teljes mértékben testre szabhatóak, és képesek a gondolatmenetek (CoT) követésére is, amely lehetővé teszi a felhasználók számára, hogy jobban megértsék, hogyan jutottak a modellek bizonyos következtetésekre.

A fejlesztői rugalmasság és integráció segítése

Az OpenAI fejlesztői útmutatókat is közzétett, amelyek segítik a modellek integrálását különböző platformokkal, mint például a Hugging Face, GitHub, vLLM, Ollama és llama.cpp. A modellek támogatják a fejlett utasítások követését és az érvelési viselkedéseket, valamint lehetőséget adnak a fejlesztőknek arra, hogy finomhangolják a modelleket és biztonsági intézkedéseket alkalmazzanak a testre szabott alkalmazásokhoz.

Az OpenAI nyílt forráskódú modelljei mögött az a cél állt, hogy biztosítsák a biztonságot mind a képzés, mind a kiadás során. A tesztelések azt mutatták, hogy még szándékosan rosszindulatú finomhangolás alatt is a gpt-oss-120b modell nem ért el veszélyes képességi szinteket a biológiai, kémiai vagy kiberisztikai kockázatok terén.

A hallucinációk hatása és a Chain of Thought

Az OpenAI dokumentációja szerint a döntés, hogy nem korlátozzák a gondolatmeneteket, magasabb hallucinációs pontszámokat eredményezett. A modellek alacsonyabb mérete miatt várható, hogy kevésbé fognak hallucinálni az olyan alkalmazásokban, ahol az információt a weben keresik, vagy külső adatbázisokból kérdezik le.

A modellek nyílt forráskódú kiadása tehát nemcsak a költségek csökkentését célozza, hanem a fejlesztők számára is szélesebb lehetőségeket biztosít az innovációra, amely könnyebbé teszi az AI-alapú megoldások alkalmazását a valós életben.

Mit mond a szakértő a fejleményekről?

Megkérdeztük Császár Viktor SEO szakértőt, hogy mit gondol az OpenAI legújabb bejelentéséről. Viktor elmondta: „Az OpenAI új nyílt forráskódú modelljei jelentős előrelépést jelentenek az AI fejlesztésében, mivel lehetővé teszik a kisebb vállalatok számára is, hogy hozzáférjenek a legújabb technológiákhoz. A modellek alacsonyabb hardverigénye és a fejlesztői integrációs lehetőségek növelik a versenyt a piacon, ami jótékony hatással lehet a SEO és digitális marketing stratégiákra is. A következtetési teljesítményük és a testreszabási lehetőségeik széles spektrumot nyit meg a felhasználók számára. Az ilyen típusú innovációk kulcsszerepet játszanak a jövő digitális ökoszisztémáiban.” További információkért látogasson el Császár Viktor weboldalára: csaszarviktor.hu.

Forrás: SearchEngineJournal.com