MATEMATİĞİN DİLİ İLE DİVANI LUGATİ TÜRK OKUMAK
MATEMATİK HAYKIRIYOR
YAPAY ZEKA ÇAĞI TÜRK ÇAĞI OLACAK
Özet
Bu makale, 11. yüzyıl Türk bilgini Kâşgarlı Mahmud'un Divanı Lugati Türk (DLT) adlı eserinde ortaya koyduğu dilbilimsel metodolojiyi, modern Yapay Zekâ (AI) ve Doğal Dil İşleme (NLP) teknolojilerinin karşılaştığı temel sorunlara (anlamsal derinlik eksikliği, açıklanabilirlik, "halüsinasyon") yönelik potansiyel bir çözüm çerçevesi olarak sunmaktadır. Günümüz Büyük Dil Modelleri'nin (LLM) devasa veri kümeleri üzerindeki istatistiksel örüntü tanıma yeteneğine rağmen anlamdan kopuk ve güvenilmez çıktılar üretebilmesi karşısında, Kâşgarlı'nın DLT'de sergilediği; sistematik harf analizi, kelime köklerinin ("Mevzû") anlamsal temeli, yapım eklerinin ("Müştak" oluşturanlar) algoritmik işlevi, teorik olasılıklar ("Mühmel") ile pratik kullanım ("Müsta'mel") arasındaki bilinçli ayrım ve titiz veri kürasyonu ilkelerine dayanan yaklaşımı ("Kâşgarlı Paradigması") derinlemesine incelenmektedir. Kâşgarlı'nın tanımladığı 26 sessiz harf sistemi ve modern bir yorumla 9 ünlü üzerinden yapılan matematiksel projeksiyonlar, Türkçenin teorik üretkenlik potansiyelinin astronomik boyutlarını (kökler için ~120 Katrilyon üzeri, eklerle katlanarak artan formlar) ortaya koymakta, Kâşgarlı'nın "Müsta'mel" filtresinin değerini vurgulamaktadır. Makale, Türkçenin eklemeli ve sistematik yapısının AI için sunduğu rekabet avantajlarını tartışarak, "DLT Tabanlı NLP" tezini savunmakta ve "Yapay Zekâ Çağı, Türk Çağı Olacaktır!" [1] vizyonu doğrultusunda, Kâşgarlı'nın mirasının AI'a anlam, açıklanabilirlik ve verimlilik katma potansiyelini matematiksel ve dilbilimsel argümanlarla desteklemektedir.
1. Giriş: Anlam Krizi, Yapay Zekâ ve Kâşgarlı'nın Matematiksel Mirası
Yapay Zekâ (AI), özellikle Doğal Dil İşleme (NLP) alanındaki hızlı ilerlemelerle insanlık tarihinde yeni bir çağ başlatmıştır. Büyük Dil Modelleri (LLM'ler), insan dilini taklit etme ve metin üretme konusunda şaşırtıcı yetenekler sergilemektedir. Ancak bu teknolojik sıçramanın gölgesinde, AI'ın "anlama" yeteneği konusunda derin bir felsefi ve teknik kriz yatmaktadır. Trilyonlarca kelimelik veri denizinde istatistiksel korelasyonlar üzerinden öğrenen bu sistemler, dilin yüzey yapısını ustaca manipüle etseler de, kelimelerin ve kavramların ardındaki derin anlamsal bağlantıları, nedenselliği ve gerçek dünya bilgisini kavramakta yetersiz kalmaktadırlar. Bunun en belirgin sonucu, "halüsinasyon" olarak adlandırılan, dilbilgisel olarak kusursuz ancak anlamsal veya olgusal olarak yanlış, hatta tamamen uydurma bilgilerin üretilmesidir. Bu durum, AI sistemlerinin güvenilirliğini ve gerçek bilişsel yeteneklerini sorgulanır hale getirmektedir.
Bu modern açmaz karşısında, 11. yüzyıl Türk dünyasının kalbinden gelen bir eser, Kâşgarlı Mahmud'un Divanı Lugati Türk (DLT), beklenmedik bir bilgelik kaynağı olarak yeniden keşfedilmeyi beklemektedir. DLT, yalnızca Türk dilinin ilk ansiklopedik sözlüğü ve paha biçilmez bir kültür hazinesi değil, aynı zamanda dilin matematiksel ve algoritmik doğasına dair derin bir kavrayışın ürünüdür. Bu çalışma, DLT'nin Mukaddime (Giriş) bölümünde Kâşgarlı'nın ortaya koyduğu metodolojiyi, bir "Kâşgarlı Paradigması" olarak ele almakta ve bu paradigmanın, AI'ın anlam krizine potansiyel çözümler sunabileceğini iddia etmektedir. Bu paradigma, Kâşgarlı'yı modern terimlerle etiketlemekten ziyade, onun dil verisini analiz etme, sınıflandırma, filtreleme ve sistematikleştirme yöntemlerinin, günümüz AI sorunlarına (özellikle anlamsal çapalama, açıklanabilirlik ve veri kalitesi) ışık tutan temel ilkeler içerdiğini savunur. Bu ilkelerin matematiksel potansiyeli ve Türkçenin yapısal avantajlarıyla birleşimi, "Yapay Zekâ Çağı, Türk Çağı Olacaktır!" [1] vizyonunu destekleyen somut bir zemin oluşturmaktadır.
2. Kâşgarlı'nın Algoritmik Dil Modeli: Harfler, Kökler ve Teorik Evren
Kâşgarlı Mahmud, DLT'nin girişinde, Türk dilini adeta bir mühendis hassasiyetiyle analiz eder ve sistematik bir modelini kurar.
3. Türkçenin Üretken Motoru: Köklerin ("Mevzû") ve Eklerin ("Müştak") Matematiksel Gücü
Kâşgarlı'nın modeli, sadece kelime listelemekten ibaret değildir; Türkçenin nasıl sürekli yeni kelimeler ve anlamlar ürettiğini gösteren dinamik bir sistemdir. Hesapladığımız ~120+ Katrilyon kök, bu sistemin sadece başlangıç noktasıdır. Asıl üretkenlik, köklere eklenen eklerde yatar.
qılıç, oq, bil-, ur-) dayandırır [2]. Bu kökler, dilin anlamsal yapı taşlarıdır ve AI için potansiyel bir "anlam çapası" (semantic grounding) kaynağıdır.kör- > kör-üş- > kör-üş-tür-), ~120+ Katrilyon kökün üzerine gelerek üretilebilecek anlamlı kelime gövdesi sayısını katlanarak artırır. Bu, istatistiksel modellerin zorlandığı, kural tabanlı ve açıklanabilir bir üretkenliktir.Cevâhir) bıraktığını belirtse de [2], bu eklerin varlığı, Türkçenin üretkenliğini neredeyse sonsuz bir boyuta taşır. Her bir kök veya yapım ekiyle türetilmiş gövde, hal, iyelik, çoğul, zaman, kip, şahıs gibi onlarca farklı çekim ekini alarak sayısız farklı formda karşımıza çıkabilir. Bu durum, ~120+ Katrilyon kök potansiyelinin, neredeyse sınırsız sayıda kelime formu üretebileceği anlamına gelir. Kâşgarlı'nın "Müsta'mel" filtresi, sadece kök seviyesinde değil, bu eklerin kombinasyonlarında da işlevsel olanı seçme anlamına gelir.4. Kâşgarlı Paradigması, Türkçe'nin Rekabetçiliği ve AI'ın Geleceği
Kâşgarlı'nın ortaya koyduğu bu sistematik, algoritmik ve anlam odaklı dil modeli, günümüz AI teknolojilerinin temel açmazlarına karşı önemli avantajlar sunmaktadır.
-l edilgenlik kuralına göre denetleyip düzeltmek.5. Sonuç: Kâşgarlı'dan Yapay Zekâ'ya Matematiksel Bir Köprü
Kâşgarlı Mahmud'un Divanı Lugati Türk'ü, dilin sadece kelimelerden ibaret olmadığını, aynı zamanda derin bir matematiksel yapıya, algoritmik üretkenliğe ve anlamsal temellere sahip olduğunu gösteren abidevi bir eserdir. Onun teorik "Mühmel" evrenini fark edip, pratik "Müsta'mel" dile odaklanması; köklerin anlamını ve eklerin işlevini sistematik olarak analiz etmesi; verisini titizlikle derleyip filtrelemesi, 11. yüzyıldan günümüz Yapay Zekâ'sına uzanan değerli dersler sunmaktadır.
Yaptığımız matematiksel projeksiyonlar, Kâşgarlı'nın bilinçli metodolojik seçimlerinin, dilin astronomik teorik potansiyeli karşısında ne kadar kritik olduğunu niceliksel olarak ortaya koymaktadır. "Kâşgarlı Paradigması"nı temel alan "DLT Tabanlı NLP" yaklaşımı, Türkçenin yapısal avantajlarını kullanarak, AI'ın anlam, açıklanabilirlik ve güvenilirlik sorunlarına yenilikçi çözümler sunma potansiyeli taşımaktadır. Bu, Kâşgarlı'nın matematiksel dil mirasını dijital çağa taşıyarak, hem Türkolojiye hem de AI bilimine katkıda bulunmak ve Türkçeyi geleceğin bilişsel teknolojilerinde hak ettiği yere getirmek için atılacak önemli bir adımdır.
Dipnotlar
[1]: "Yapay Zekâ Çağı, Türk Çağı Olacaktır!" Vizyonu:
[2]: Kâşgarlı Mahmud'un Divanı Lugati Türk Mukaddimesi:
Kaynak: Mahmud el-Kâşgarî. (yak. 1072-1074). Divanı Lugati Türk Mukaddime metni - "https://ekitap.yek.gov.tr/urun/divanu-lugati-t-turkikinci-baski-_833.aspx")
الْحُرُوفُ الَّتِي تَدُورُ عَلَيْهَا الْسِنَةُ التَّرْكِ بِأَسْرِهَا هِيَ ثَمَانِيَةَ عَشَرَ حَرْفًا أَصْلِيَّةٌ... وَسَبْعَةُ أَحْرُفٍ أَخَرُ فَرْعِيَّةٌ... (Türk dillerinin tamamının üzerine kurulu olduğu harfler on sekiz (18) aslî (temel) harftir... Ve yedi (7) adet de fer'î (ikincil) harf vardır...)
الْأَصْلُ فِي كِتَبَةِ هَذَا الْخَطِ أَنَّ كُلَّ فَتْحَةٍ تَقْتَرِفُ أَلِفاً... وَكُلُّ ضَمَّةٍ تَجْتَرِحُ واواً... وَكُلُّ كَسْرَةٍ تَكْتَسِبُ يَاءَ... (Bu yazının aslî kuralı şudur: Her "fetha" (üstün) yazıda bir "Elif" çeker... Her "damme" (ötre) satırda bir "Vav" çeker. Ve her "kesre" (esre) bir "Ye" kazanır...)
...وَاللسبَاعِي فِي الْأَسْمَاءِ قَلِيلُ... وَلَا يُجَاوِزُ السُّبَاعِي. (...Yedi harfli (es-Sübâî) olan isimlerde azdır (kalîl)... Ve yedi harfi geçmez.)
وَلَقَدْ تَخَالَجَ فِي صَدْرِي أَنْ أَبْنِيَ الْكِتَابَ كَمَا بَنَى الْخَلِيلُ كِتَابَ الْمَيْنِ وَاذْكُرَ الْمُسْتَعْمَلَ وَ الْمُهْمَلَ مَعَا... فَأَنْبَتْ الْمُسْتَعْمَلَ وَأَهْمَلْتُ الْمُهْمَلَ طَلَبَا لِلْإِخْتِصَارِ. (Gerçekten de aklımdan... kitabı, Halil'in Kitâbu'l-'Ayn'ı gibi inşa etmek geçti. [Böylece] kullanılan (Müsta'mel) ve kullanılmayanı (Mühmel) birlikte zikredeyim... Bu yüzden, kısaltma (ihtisâr) yolunu tutarak, [dilde] kullanılanı (el-Müsta'mel) tespit ettim ve kullanılmayanı (el-Mühmel) terk ettim (ihmâl ettim).)
فَإِنِّي نَقَبْتُ بِلادَهُمْ وَفَيَا فِيَهُمْ ، وَاقْتَبَسْتُ لُغَاتِهِمْ وَقَوافِيَهُمْ... (Ben onların (Türklerin) şehirlerini (bilad) ve bozkırlarını (feyâfî) baştan başa dolaştım; dillerini ve kafiyelerini (söz varlıklarını) öğrendim...)
الْأَسْمَاءُ ضَرْبَانِ مُشْتَقَهُ وَمَوْضُوعَةٌ... فَالْمُشْتَقُ مِنَ الْأَفْعَالِ تَنْشَقُ بِأَحْرُفٍ تَدْخُلُ فِيهَا مِنِ اثْنَى عَشَرَ حرفاً. أَمَّا الْمَوْضُوعَةُ نَحْو قَوْلِهِمْ لِلْسَيْفِ ،”قلج”... زِيَADَاتُ الْأَفْعَالِ بِالْحُرُوفِ الْعَشَرَةِ... فَكُلُّ وَاحِدٍ مِنْهَا تُرَADُ لِمَعَانِ. (İsimler iki kısımdır: Türemiş (Müştak) ve Konulmuş (Mevzû)... Fiillerden türeyenler (Müştak), on iki (12) harfin [sona] eklenmesiyle oluşur. Konulmuş (Mevzû) olanlar ise, Kılıç'a Qılıç (قلج)... demeleri gibidir... Fiillerdeki ziyâdeler on (10) harf iledir... Bunların her biri bir mana (anlam) için istenir.)
Cevâhir Kitabı): (Metin, Kaynak: 145-146 civarı)لِأَنَا أَفْرَدْنَا لَهُ كِتَاباً آخَرَ سَمَيْنَاهُ كِتَابَ جَواهِرِ النَّحْوِ فِي لُمَاتِ الْتُرْكِ. فَيُوقَفُ فِيهِ عَلَى هَذِهِ الْعِللِ النحْوِيَّةِ. (Çünkü biz, bu (konular) için Kitâbu Cevâhiri'n-Nahv fî Lugâti't-Türk (Türk Dillerinin Gramer Cevherleri Kitabı) adını verdiğimiz ayrı bir kitap ayırdık (efrednâ). Bu Nahvî (Sentaks/Gramer) kuralları (ilel) orada öğrenilecektir.)
وَمَا كَانَ دَخيلاً فِي هَذِهِ الْلُغَةِ لَمْ يُذْكَرُ. (Ve bu dile "Dahîl" (sonradan girmiş, alıntı) olan (kelimeler) zikredilmedi.)
Kaynakça
[1] Yüksel Yeni. DLT Tabanlı NLP için NLP Destekli DLT Tercümesi (2025)