OpenAI új o3 és o3-mini modellek: Áttörés a mesterséges intelligencia érvelésében
Az OpenAI bemutatta legújabb „érvelő” modelljeit, az o3-at és o3-minit, amelyek jelentős előrelépést jelentenek a mesterséges intelligencia teljesítményében.
Az OpenAI az utolsó napon mutatta be új, határterületi „érvelő” modelljeit, az o3-at és o3-minit. A vállalat jelenleg nem teszi elérhetővé ezeket a modelleket, és elismeri, hogy a végső eredmények még változhatnak további képzés után. Az OpenAI azonban már most várja a kutatói közösség jelentkezését a rendszerek tesztelésére a nyilvános megjelenés előtt (amelynek időpontját még nem tűzték ki).
Az o3 modell kiemelkedő teljesítménye
Az OpenAI szerint az o3 minden területen felülmúlja a korábbi teljesítményrekordokat:
- 22,8%-kal jobb eredményt ért el a kódolási teszteken (SWE-Bench Verified), mint elődje
- Túlszárnyalta az OpenAI vezető tudósát versenyszerű programozásban
- Majdnem tökéletes eredményt ért el az egyik legnehezebb matematikai versenyen (AIME 2024), mindössze egy kérdést hibázva
- 87,7%-os eredményt ért el egy szakértői szintű tudományos problémákat tartalmazó tesztben (GPQA Diamond)
- A legnehezebb matematikai és érvelési kihívásokban, amelyek általában megoldhatatlanok az AI számára, az o3 a problémák 25,2%-át oldotta meg (míg más modellek nem haladják meg a 2%-ot)
Új megközelítés a biztonságos AI fejlesztésben
A vállalat bejelentette az új kutatását a deliberative alignment területén is. Ez a megközelítés arra kényszeríti az AI modellt, hogy lépésről lépésre dolgozza fel a biztonsági döntéseket. Ahelyett, hogy egyszerű igen/nem szabályokat adnának az AI modellnek, ez a paradigma megköveteli, hogy aktívan mérlegelje, vajon a felhasználó kérése megfelel-e az OpenAI biztonsági irányelveinek.
Az OpenAI állítása szerint, amikor ezt a módszert tesztelték az o1 modellen, az sokkal jobban követte a biztonsági irányelveket, mint a korábbi modellek, beleértve a GPT-4-et is.
Az új o3 és o3-mini modellek bemutatása jelentős lépés az AI technológia fejlődésében, különösen az érvelés és problémamegoldás területén. Az OpenAI továbbra is vezető szerepet tölt be az innovatív és biztonságos AI rendszerek fejlesztésében.