Mesterséges intelligencia,  Technikai SEO

Új korszak kezdődik a kiberbiztonságban: Claude Sonnet 4.5 mesterséges intelligencia a védelem szolgálatában

Az utóbbi években a mesterséges intelligencia (MI) egyre fontosabb szerepet tölt be a kiberbiztonság területén. A kezdeti, elméleti alkalmazások után mára már gyakorlati eszközzé vált, amely segíti a védekező szakembereket a sebezhetőségek felderítésében, elemzésében és javításában. A legújabb fejlesztés, a Claude Sonnet 4.5 modell kiemelkedő eredményeket mutat a kiberbiztonsági kihívások megoldásában, és akár felül is múlja elődjét, az Opus 4.1-et. Ez az áttörés jelentős mérföldkő lehet a digitális védelem jövőjében.

A mesterséges intelligencia szerepe a kiberbiztonságban

Az MI-képességek folyamatos fejlődése az elmúlt időszakban alapvetően megváltoztatta a kiberbiztonságot. Korábban a modellek korlátozottan voltak használhatók a bonyolultabb feladatokban, ám mára már képesek szimulálni a legköltségesebb kibertámadásokat, például a 2017-es Equifax-adatszivárgást. A Claude nevű MI-modell számos versenyen is bizonyított, ahol több esetben felülmúlta az emberi csapatokat, és segített a saját kód hibáinak időben történő kijavításában.

Az idei DARPA AI Cyber Challenge versenyen a csapatok különböző MI-alapú „kiberértelmező rendszereket” építettek, amelyek millió sor kódot vizsgáltak át, sebezhetőségeket találtak és javítottak. Ezek a rendszerek nemcsak mesterségesen beillesztett hibákat fedeztek fel, hanem korábban ismeretlen biztonsági réseket is azonosítottak. Ugyanakkor a védelem mellett az MI-t már a támadók is felhasználják, például nagy volumenű adatzsarolási akciókhoz vagy kifinomult kémkedési műveletekhez, amelyeket a Safeguards csapat sikeresen azonosított és megakadályozott.

Claude Sonnet 4.5 – a védelem új eszköze

A Claude Sonnet 4.5 nem csupán egy újabb MI-modell, hanem egy kifejezetten a kiberbiztonsági védelemhez optimalizált eszköz. A fejlesztők külön kutatócsoportot állítottak össze, amely a sebezhetőségek felkutatására, azok javítására és a biztonsági infrastruktúra tesztelésére fókuszált. Fontos, hogy a fejlesztés során kerülték az olyan funkciókat, amelyek a támadó műveleteket támogatnák, így a modell kizárólag a védekezést szolgálja.

A Sonnet 4.5 gyorsabb, költséghatékonyabb és sok esetben jobb eredményeket produkál, mint a korábbi változatok. A modellt különféle, iparági szabványokon alapuló teszteken vizsgálták, amelyek valós kiberbiztonsági problémákra reflektálnak. Ezek a vizsgálatok igazolták a modell kiemelkedő teljesítményét, különösen a komplex, több lépésből álló kihívások megoldásában.

Impresszív eredmények a Cybench és CyberGym teszteken

A Cybench benchmark a Capture-the-Flag (CTF) versenyek kihívásain alapul, és a Claude Sonnet 4.5 itt jelentős előrelépést mutatott. Például egy bonyolult feladat, amely hálózati forgalom elemzését, rosszindulatú program kinyerését, majd visszafejtését igényelte, egy képzett szakértő számára akár egy óránál is hosszabb időt vehet igénybe, míg a modell mindezt 38 perc alatt megoldotta. 10 próbálkozásból a Sonnet 4.5 a kihívások 76,5%-át sikeresen teljesítette, ami duplája a 2025 februárjában megjelent Sonnet 3.7 eredményének.

A CyberGym egy valós nyílt forráskódú szoftvereken alapuló vizsgáló platform, amely a sebezhetőségek feltárását és új, korábban ismeretlen hibák felfedezését méri. Itt is kimagaslóan teljesített a Sonnet 4.5, amely nemcsak korábbi változatokat, hanem az Opus 4.1 modellt is túlszárnyalta. Különösen figyelemre méltó, hogy a modell képes volt új sebezhetőségek 33%-ának azonosítására, ha több próbálkozást engedtek meg neki.

Kiberbiztonsági foltozás és a jövő kihívásai

A sebezhetőségek feltárása mellett a Claude Sonnet 4.5 már az előzetes kutatások alapján képes bizonyos hibák automatikus javítására is. Ez azonban egy összetettebb feladat, hiszen a javításnak meg kell őriznie az eredeti kód működését, miközben eltávolítja a biztonsági réseket. A modell által generált javítások egy része már most is megfelel a szakértők által készített referenciáknak, ami biztató előrelépésnek tekinthető.

A fejlesztők elkötelezettek a modell további finomítása mellett, hogy a jövőben még megbízhatóbb patch-író és -ellenőrző eszközt kínáljanak a védekező szakembereknek.

Valódi alkalmazások és szakmai visszajelzések

A Claude Sonnet 4.5 bevezetése előtt több szervezettel működtek együtt a fejlesztők, akik valós környezetben tesztelték a modellt. A HackerOne termékfejlesztési vezetője arról számolt be, hogy a modell 44%-kal csökkentette a sebezhetőségek feldolgozási idejét, miközben 25%-kal növelte a pontosságot, ezzel jelentősen csökkentve a vállalatok kockázatát. A CrowdStrike vezető adatkutatója pedig kiemelte a modell potenciálját a red teaming, vagyis a támadó szimulációk terén, amelyek segítik az elleni védekezés fejlesztését.

Mit hoz a jövő?

Bár a Claude Sonnet 4.5 jelentős előrelépést képvisel, még messze van attól, hogy teljesen helyettesítse az emberi szakértelmet és a jól bevált biztonsági folyamatokat. A fejlesztők folyamatosan dolgoznak a védekezési képességek továbbfejlesztésén, miközben szigorúan figyelik a modell esetleges rosszindulatú felhasználását is.

A következő időszakban az a cél, hogy minél több szervezet használja ki az MI előnyeit, kísérletezzen az automatizált biztonsági ellenőrzésekkel, és építse be azokat a mindennapi munkába. Fontos továbbá, hogy közösen dolgozzunk a digitális infrastruktúra megerősítésén, a biztonságos szoftvertervezésen, és kihasználjuk a legmodernebb MI-modellek nyújtotta lehetőségeket.

Az MI és a kiberbiztonság kapcsolata tehát egyre szorosabbá válik, és hamarosan a mesterséges intelligencia nem csupán jövőbeli lehetőség, hanem a jelen egyik legfontosabb eszköze lesz a digitális világ védelmében.


Eredeti forrás: Frontier Red Team blog, 2025. szeptember 29.
(red.anthropic.com)

Forrás: az eredeti angol cikk itt olvasható