benchmark testlerinde neden o3- r1 gibi modeller ile karşılaştırılmadığını bunun yerine 4-o, v3 gibi görece eski modeller ile karşılaştırıldığını merak ettiğim hede. bilenler yeşillendirirse burayı editleriz.
editto: sunumda birden fazla model tanıtmışlar, her modeli kendi rakipleri ile değerlendirmişler. sunumun ilerleyen vakitlerinde o3mini (high) ve r1 ile kıyaslamalar da varmış. çok afedersiniz de yarak gibi bir sunum olunca insan konsantre olup izleyemiyor tamamını.