Dev veri setleriyle eğitilen bu modellerin, karmaşık paternleri çözme yeteneği büyük bir hayranlık uyandırıyor. Ancak konu basit bir kelimedeki harfleri saymaya geldiğinde, tablo beklenmedik şekilde değişebiliyor.
Aralık 2025’te yayınlanan OpenAI’ın en güncel modeli GPT-5.2, “strawberry” kelimesinde kaç tane “r” harfi olduğu sorusuna yanlış yanıt vermesiyle gündeme geldi. Kelimede biri başta, ikisi sonda olmak üzere toplam üç adet “r” bulunmasına rağmen model ısrarla “iki” cevabını veriyor. Bu durum, yapay zekanın metinleri nasıl algıladığına dair önemli bir tartışmayı beraberinde getirdi.
Sorunun Kaynağı: Harfler Değil Token’lar
Uzmanlara göre bu hatanın temelinde tokenizasyon sistemi yer alıyor. ChatGPT ve benzeri büyük dil modelleri, kelimeleri harf harf değil “token” adı verilen parça bloklar halinde işliyor. OpenAI’ın araçlarıyla yapılan incelemede “strawberry” kelimesinin “st”, “raw” ve “berry” olmak üzere üç bloğa ayrıldığı görülüyor.
Bu bloklardan “st” parçasında hiç “r” bulunmazken, “raw” parçasında bir adet “r” yer alıyor. “Berry” parçasında ise iki adet “r” olmasına rağmen sistem bu bölümü tek bir birim olarak kodluyor. Model, harfleri tek tek saymak yerine bu bloklar üzerinden tahmin yürüttüğü için sonuç hatalı çıkıyor.
Benzer Hatalar ve Kısmi İlerlemeler
Aynı mantık hatası “raspberry” kelimesinde de ortaya çıkıyor. Öte yandan yapay zekanın bazı eski problemleri çözdüğü de belirtiliyor. GPT-5.2 artık “Mississippi” kelimesini doğru heceliyor ve “lollipop” kelimesini hatasız şekilde tersten yazabiliyor. Ancak hassas harf sayımı gibi görevler halen sorunlu alanlar arasında yer alıyor.




