-
DeepSeek bemutatja a Math-V2 modellt: nagy pontosságú matematikai érvelés mesterséges intelligencia
A mesterséges intelligencia gyors fejlődése újabb mérföldkőhöz érkezett a DeepSeek kínai vállalat révén, amely nemrégiben mutatta be legújabb nyílt forráskódú AI modelljét, a Math-V2-t. Ez a fejlesztés kifejezetten a matematikai érvelés és formális bizonyítások terén kíván úttörő szerepet betölteni, egyedülálló módon egyesítve a bizonyíték-generálást és azok automatikus ellenőrzését. A Math-V2 modellt úgy alakították ki, hogy ne csupán a végeredmény pontosságára összpontosítson, hanem lépésről lépésre, részletesen vezesse le a matematikai bizonyításokat, így jelentősen túlszárnyalja a hagyományos, megerősítéses tanuláson alapuló modellek korlátait. A modell képes önellenőrzésre, ami lehetővé teszi számára, hogy folyamatosan felülvizsgálja és javítsa saját lépéseit, ezáltal biztosítva a helyes és precíz végeredményt. A Math-V2 működése és főbb jellemzői A DeepSeek…
-
AI Pontosság: Működik a Fenyegetés, vagy Csak Mítosz?
A mesterséges intelligencia (AI) világában folyamatosan új módszereket keresnek a teljesítmény javítására. Nemrégiben a kutatók arra voltak kíváncsiak, hogy Sergey Brin, a Google egyik alapítója által javasolt szokatlan módszer, a gépek megfenyegetése, valóban növelheti-e az AI rendszerek pontosságát. A kutatás során kiderült, hogy bizonyos esetekben a fenyegetés valóban javíthatja a válaszok minőségét, de a kutatók figyelmeztettek, hogy az ilyen megközelítések kiszámíthatatlan eredményekhez vezethetnek. Kutatás és módszertan A kutatást a Pennsylvaniai Egyetem Wharton Üzleti Iskolájának kutatói végezték. A kutatás során különböző AI modellek válaszait tesztelték, köztük a Gemini és a GPT-4o modelleket, több mint 100 kérdésre adott válaszokat elemezve. A kutatók két fő benchmarkot használtak, amelyek a PhD szintű biológiai, fizikai…