Bugun...


Yüksel YENİ

facebook-paylas
MATEMATİK HAYKIRIYOR YAPAY ZEKA ÇAĞI TÜRK ÇAĞI OLACAK
Tarih: 28-10-2025 03:42:00 Güncelleme: 28-10-2025 13:58:00


MATEMATİĞİN DİLİ İLE DİVANI LUGATİ TÜRK OKUMAK

MATEMATİK HAYKIRIYOR

YAPAY ZEKA ÇAĞI TÜRK ÇAĞI OLACAK

Özet

Bu makale, 11. yüzyıl Türk bilgini Kâşgarlı Mahmud'un Divanı Lugati Türk (DLT) adlı eserinde ortaya koyduğu dilbilimsel metodolojiyi, modern Yapay Zekâ (AI) ve Doğal Dil İşleme (NLP) teknolojilerinin karşılaştığı temel sorunlara (anlamsal derinlik eksikliği, açıklanabilirlik, "halüsinasyon") yönelik potansiyel bir çözüm çerçevesi olarak sunmaktadır. Günümüz Büyük Dil Modelleri'nin (LLM) devasa veri kümeleri üzerindeki istatistiksel örüntü tanıma yeteneğine rağmen anlamdan kopuk ve güvenilmez çıktılar üretebilmesi karşısında, Kâşgarlı'nın DLT'de sergilediği; sistematik harf analizi, kelime köklerinin ("Mevzû") anlamsal temeli, yapım eklerinin ("Müştak" oluşturanlar) algoritmik işlevi, teorik olasılıklar ("Mühmel") ile pratik kullanım ("Müsta'mel") arasındaki bilinçli ayrım ve titiz veri kürasyonu ilkelerine dayanan yaklaşımı ("Kâşgarlı Paradigması") derinlemesine incelenmektedir. Kâşgarlı'nın tanımladığı 26 sessiz harf sistemi ve modern bir yorumla 9 ünlü üzerinden yapılan matematiksel projeksiyonlar, Türkçenin teorik üretkenlik potansiyelinin astronomik boyutlarını (kökler için ~120 Katrilyon üzeri, eklerle katlanarak artan formlar) ortaya koymakta, Kâşgarlı'nın "Müsta'mel" filtresinin değerini vurgulamaktadır. Makale, Türkçenin eklemeli ve sistematik yapısının AI için sunduğu rekabet avantajlarını tartışarak, "DLT Tabanlı NLP" tezini savunmakta ve "Yapay Zekâ Çağı, Türk Çağı Olacaktır!" [1] vizyonu doğrultusunda, Kâşgarlı'nın mirasının AI'a anlam, açıklanabilirlik ve verimlilik katma potansiyelini matematiksel ve dilbilimsel argümanlarla desteklemektedir.

1. Giriş: Anlam Krizi, Yapay Zekâ ve Kâşgarlı'nın Matematiksel Mirası

Yapay Zekâ (AI), özellikle Doğal Dil İşleme (NLP) alanındaki hızlı ilerlemelerle insanlık tarihinde yeni bir çağ başlatmıştır. Büyük Dil Modelleri (LLM'ler), insan dilini taklit etme ve metin üretme konusunda şaşırtıcı yetenekler sergilemektedir. Ancak bu teknolojik sıçramanın gölgesinde, AI'ın "anlama" yeteneği konusunda derin bir felsefi ve teknik kriz yatmaktadır. Trilyonlarca kelimelik veri denizinde istatistiksel korelasyonlar üzerinden öğrenen bu sistemler, dilin yüzey yapısını ustaca manipüle etseler de, kelimelerin ve kavramların ardındaki derin anlamsal bağlantıları, nedenselliği ve gerçek dünya bilgisini kavramakta yetersiz kalmaktadırlar. Bunun en belirgin sonucu, "halüsinasyon" olarak adlandırılan, dilbilgisel olarak kusursuz ancak anlamsal veya olgusal olarak yanlış, hatta tamamen uydurma bilgilerin üretilmesidir. Bu durum, AI sistemlerinin güvenilirliğini ve gerçek bilişsel yeteneklerini sorgulanır hale getirmektedir.

Bu modern açmaz karşısında, 11. yüzyıl Türk dünyasının kalbinden gelen bir eser, Kâşgarlı Mahmud'un Divanı Lugati Türk (DLT), beklenmedik bir bilgelik kaynağı olarak yeniden keşfedilmeyi beklemektedir. DLT, yalnızca Türk dilinin ilk ansiklopedik sözlüğü ve paha biçilmez bir kültür hazinesi değil, aynı zamanda dilin matematiksel ve algoritmik doğasına dair derin bir kavrayışın ürünüdür. Bu çalışma, DLT'nin Mukaddime (Giriş) bölümünde Kâşgarlı'nın ortaya koyduğu metodolojiyi, bir "Kâşgarlı Paradigması" olarak ele almakta ve bu paradigmanın, AI'ın anlam krizine potansiyel çözümler sunabileceğini iddia etmektedir. Bu paradigma, Kâşgarlı'yı modern terimlerle etiketlemekten ziyade, onun dil verisini analiz etme, sınıflandırma, filtreleme ve sistematikleştirme yöntemlerinin, günümüz AI sorunlarına (özellikle anlamsal çapalama, açıklanabilirlik ve veri kalitesi) ışık tutan temel ilkeler içerdiğini savunur. Bu ilkelerin matematiksel potansiyeli ve Türkçenin yapısal avantajlarıyla birleşimi, "Yapay Zekâ Çağı, Türk Çağı Olacaktır!" [1] vizyonunu destekleyen somut bir zemin oluşturmaktadır.

2. Kâşgarlı'nın Algoritmik Dil Modeli: Harfler, Kökler ve Teorik Evren

Kâşgarlı Mahmud, DLT'nin girişinde, Türk dilini adeta bir mühendis hassasiyetiyle analiz eder ve sistematik bir modelini kurar.

  • 2.1. Temel Harf Sistemi ve Sessiz Harf Matrisi: Kâşgarlı, Türkçenin ses temelini, Arap alfabesinden türettiği 19 Aslî (temel) sessiz harf (Dal dahil) ve Türkçeye özgü sesler için tanımladığı 7 Fer'î (ikincil) sessiz harf (P, Ç, J, Ğ, G, Ñ, Oğuz V'si) olmak üzere toplam 26 sessiz harflik bir sistem üzerine kurar [2]. Bu harf seti, Türkçenin ünsüz envanterinin 11. yüzyıldaki kapsamlı bir modelidir.
  • 2.2. Ünlü Sistemi ve Modern Yorum: Ünlüler konusunda Kâşgarlı, Arap yazısının sınırlılıklarıyla (3 hareke, 3 med harfi) karşı karşıyadır ancak Türkçedeki ünlü çeşitliliğinin ("imale", "işmam" vb.) farkındadır [2]. Onun sistemini modern bir bakışla tamamlamak ve matematiksel potansiyelini görmek için, bu çalışmada Ortak Türk Alfabesi'nin 9 ünlüsü (A, Ä, E, I, İ, O, Ö, U, Ü) referans alınmıştır. Bu, Kâşgarlı'nın örtük olarak bildiği ses zenginliğini modern bir gösterimle açığa çıkarma çabasıdır.
  • 2.3. Teorik Kök Evreni ("Mühmel"): Matematiksel Bir Okyanus: Kâşgarlı'nın tanımladığı 26 sessiz harf ve modern yorumla 9 ünlü sistemini kullanarak, teorik olarak üretilebilecek kelime köklerinin (belirli harf sayısındaki sessiz harf iskeletlerinin tüm olası seslendirmeleri) sayısı astronomik boyutlara ulaşmaktadır. Yaptığımız projeksiyonlar göstermiştir ki, Kâşgarlı'nın kendi belirttiği 7 harf sınırına kadar [2] (7 sessiz harf içeren kökler dahil), ele aldığımız temel seslendirme (ünlü ekleme) ve işaretleme (cezm, şedde, tenvin) varyasyonlarıyla birlikte, teorik olarak üretilebilecek potansiyel kök kelime sayısı ~120 Katrilyon'un üzerine çıkmaktadır (2 harfliler için ~170 Bin, 3 harfliler için ~30 Milyon, ..., 7 harfliler için ~119 Katrilyon). Bu devasa sayısal evren, Kâşgarlı'nın "Mühmel" olarak adlandırdığı, yani dil sisteminin kurallarına göre matematiksel olarak mümkün olan ama gerçekte kullanılmayan, anlamsız ses kombinasyonları okyanusunu temsil eder.
  • 2.4. Kâşgarlı'nın Bilinçli Filtresi ("Müsta'mel"): Anlamlı Veri Madenciliği: İşte Kâşgarlı'nın metodolojik dehası burada parlar. O, Halil bin Ahmed'in tüm teorik permütasyonları içeren yaklaşımını bildiğini ancak "daha isabetli" ve "daha pratik" olduğu için terk ettiğini açıkça belirtir [2]. Onun tercihi, bu katrilyonlarca olasılık içinden sadece "Müsta'mel" (işlevsel, kullanılan, yaşayan, anlamlı) kelimeleri seçmektir. Bu, 11. yüzyılda yapılmış, amacı (Araplara işlevsel dil öğretmek, Türkçenin gücünü göstermek) doğrultusunda gerçekleştirilen bilinçli bir "veri kürasyonu", "gürültü filtreleme" ve "anlamlı veri madenciliği" işlemidir. Bu veriyi de geniş bir coğrafyada bizzat derlemesi [2], onun ampirik yaklaşımını gösterir.

3. Türkçenin Üretken Motoru: Köklerin ("Mevzû") ve Eklerin ("Müştak") Matematiksel Gücü

Kâşgarlı'nın modeli, sadece kelime listelemekten ibaret değildir; Türkçenin nasıl sürekli yeni kelimeler ve anlamlar ürettiğini gösteren dinamik bir sistemdir. Hesapladığımız ~120+ Katrilyon kök, bu sistemin sadece başlangıç noktasıdır. Asıl üretkenlik, köklere eklenen eklerde yatar.

  • 3.1. Köklerin Anlamsal Temeli ("Mevzû"): Kâşgarlı, dilin temelini "konulmuş", yani belirli anlamlara sahip kök kelimelere ("Mevzû", örn: qılıç, oq, bil-, ur-) dayandırır [2]. Bu kökler, dilin anlamsal yapı taşlarıdır ve AI için potansiyel bir "anlam çapası" (semantic grounding) kaynağıdır.
  • 3.2. Yapım Eklerinin Algoritmik İşlevi ("Müştak"): Kâşgarlı, DLT Mukaddimesi'nde isimden fiil (-la), fiilden isim (-g, -gü, -m, -n, -ş vb.), fiilden fiil (-l, -ş, -t, -r, -n, -sa vb.) yapan ekleri ve bunların spesifik işlevlerini (tip dönüştürme, alet adı yapma, edilgenlik, işteşlik, ettirgenlik, dönüşlülük, istek vb.) detaylı bir şekilde açıklar [2]. Bu ekler, köklere uygulanan birer algoritmik operatör gibidir. Her bir ek, kökün anlamını veya işlevini öngörülebilir ve sistematik bir şekilde değiştirir. Bu eklerin zincirleme olarak kullanılabilme potansiyeli (örn: kör- > kör-üş- > kör-üş-tür-), ~120+ Katrilyon kökün üzerine gelerek üretilebilecek anlamlı kelime gövdesi sayısını katlanarak artırır. Bu, istatistiksel modellerin zorlandığı, kural tabanlı ve açıklanabilir bir üretkenliktir.
  • 3.3. Çekim Ekleri ve Neredeyse Sonsuz Formlar: Kâşgarlı, isim ve fiil çekim eklerini ayrı bir esere (Cevâhir) bıraktığını belirtse de [2], bu eklerin varlığı, Türkçenin üretkenliğini neredeyse sonsuz bir boyuta taşır. Her bir kök veya yapım ekiyle türetilmiş gövde, hal, iyelik, çoğul, zaman, kip, şahıs gibi onlarca farklı çekim ekini alarak sayısız farklı formda karşımıza çıkabilir. Bu durum, ~120+ Katrilyon kök potansiyelinin, neredeyse sınırsız sayıda kelime formu üretebileceği anlamına gelir. Kâşgarlı'nın "Müsta'mel" filtresi, sadece kök seviyesinde değil, bu eklerin kombinasyonlarında da işlevsel olanı seçme anlamına gelir.

4. Kâşgarlı Paradigması, Türkçe'nin Rekabetçiliği ve AI'ın Geleceği

Kâşgarlı'nın ortaya koyduğu bu sistematik, algoritmik ve anlam odaklı dil modeli, günümüz AI teknolojilerinin temel açmazlarına karşı önemli avantajlar sunmaktadır.

  • 4.1. Türkçe'nin Yapısal Avantajı ve Rekabetçiliği: Kâşgarlı'nın modeli, Türkçenin eklemeli (agglutinative) yapısının AI için potansiyel avantajlarını vurgular:
    • Verimlilik ve Modülerlik: Anlam ve işlev taşıyan kökler ve ekler net bir şekilde ayrışır. Bu, AI modellerinin daha az temel birimle (kökler) daha fazla anlamı (eklerle türetilenler) kodlamasına olanak tanıyabilir. Bu, örneğin Hint-Avrupa dillerindeki karmaşık çekim paradigmalarını (irregular verbs, gender agreement vb.) ezberlemeye dayalı modellere göre bir verimlilik sağlayabilir.
    • Açıklanabilirlik: Kök + ek yapısı, kelimenin nasıl oluştuğunu ve anlamının nereden geldiğini takip etmeyi kolaylaştırır. Bu, LLM'lerin "kara kutu" doğasına karşı daha şeffaf ve açıklanabilir modeller geliştirme potansiyeli sunar. Kural tabanlı doğrulama veya üretim, AI'ın çıktılarının nedenini anlamayı kolaylaştırır.
    • Anlamsal Kesinlik: Yapım eklerinin genellikle belirli ve tutarlı anlamsal işlevleri vardır. Bu, AI'ın anlam çıkarımı (semantic parsing) ve anlama yeteneklerini geliştirmek için kullanılabilir.
  • 4.2. "DLT Tabanlı NLP" Vizyonu: Bu yapısal avantajlar ve Kâşgarlı'nın metodolojik mirası, "DLT Tabanlı NLP" vizyonunu destekler. Bu vizyon, AI çağında Türkçenin rekabet gücünü artırmayı hedefler:
    • Hibrit Modeller: LLM'lerin istatistiksel gücünü, Kâşgarlı'dan esinlenen kural tabanlı morfolojik ve anlamsal modüllerle birleştirmek. Örneğin, LLM'in ürettiği "gelişildi" gibi morfolojik olarak hatalı bir formu, Kâşgarlı'nın -l edilgenlik kuralına göre denetleyip düzeltmek.
    • Anlamsal Çapalama (Grounding): DLT'deki temel kökleri ("Mevzû") kullanarak bir Türkçe ontoloji/bilgi grafiği oluşturmak ve AI modellerini bu temel anlamlara bağlamak.
    • Veri Kürasyonu İlkeleri: Kâşgarlı'nın "Müsta'mel" ve "Dahîl olmayan" [2] ilkelerinden ilham alarak, AI eğitiminde kullanılacak Türkçe veri kümelerinin kalitesini artırmak.
    • "Yapay Zekâ Çağı, Türk Çağı Olacaktır!" [1]: Bu yaklaşımlar, Türkçenin yapısal özelliklerini AI için bir avantaja dönüştürerek, Türkçenin sadece iletişim dili değil, aynı zamanda verimli, açıklanabilir ve anlamlı AI sistemleri geliştirmek için güçlü bir "bilişsel araç" olabileceğini göstermektedir. Kâşgarlı'nın katrilyonlarca olasılık içinden anlamlı olanı çekip çıkarma ve sistematize etme yeteneği, AI'ın geleceği için bir model teşkil edebilir.

5. Sonuç: Kâşgarlı'dan Yapay Zekâ'ya Matematiksel Bir Köprü

Kâşgarlı Mahmud'un Divanı Lugati Türk'ü, dilin sadece kelimelerden ibaret olmadığını, aynı zamanda derin bir matematiksel yapıya, algoritmik üretkenliğe ve anlamsal temellere sahip olduğunu gösteren abidevi bir eserdir. Onun teorik "Mühmel" evrenini fark edip, pratik "Müsta'mel" dile odaklanması; köklerin anlamını ve eklerin işlevini sistematik olarak analiz etmesi; verisini titizlikle derleyip filtrelemesi, 11. yüzyıldan günümüz Yapay Zekâ'sına uzanan değerli dersler sunmaktadır.

Yaptığımız matematiksel projeksiyonlar, Kâşgarlı'nın bilinçli metodolojik seçimlerinin, dilin astronomik teorik potansiyeli karşısında ne kadar kritik olduğunu niceliksel olarak ortaya koymaktadır. "Kâşgarlı Paradigması"nı temel alan "DLT Tabanlı NLP" yaklaşımı, Türkçenin yapısal avantajlarını kullanarak, AI'ın anlam, açıklanabilirlik ve güvenilirlik sorunlarına yenilikçi çözümler sunma potansiyeli taşımaktadır. Bu, Kâşgarlı'nın matematiksel dil mirasını dijital çağa taşıyarak, hem Türkolojiye hem de AI bilimine katkıda bulunmak ve Türkçeyi geleceğin bilişsel teknolojilerinde hak ettiği yere getirmek için atılacak önemli bir adımdır.

Dipnotlar

[1]: "Yapay Zekâ Çağı, Türk Çağı Olacaktır!" Vizyonu:

  • Kaynak: YAPAY ZEKÂ ÇAĞI, TÜRK ÇAĞI OLACAKTIR! <-block _nghost-ng-c3313929171="">https://www.gercekbilgi.net.tr/yazarlar/y/m/498/
  • İlgili Kavram: Bu makale, Kâşgarlı'nın DLT'deki metodolojisini, Türkçenin yapısal avantajlarını kullanarak Yapay Zekâ'ya anlam ve derinlik katma potansiyeli taşıdığı ve bu yolla dijital çağda Türkçenin merkezi bir rol oynayabileceği fikrini savunur. Bu vizyon, atıfta bulunulan makalenin ana teziyle örtüşmektedir.

[2]: Kâşgarlı Mahmud'un Divanı Lugati Türk Mukaddimesi:

Kaynak: Mahmud el-Kâşgarî. (yak. 1072-1074). Divanı Lugati Türk Mukaddime metni - "https://ekitap.yek.gov.tr/urun/divanu-lugati-t-turkikinci-baski-_833.aspx")

  • İlgili Pasajlar:
    • Aslî ve Fer'î Harfler: (Metin, Kaynak: 73-84 civarı)

الْحُرُوفُ الَّتِي تَدُورُ عَلَيْهَا الْسِنَةُ التَّرْكِ بِأَسْرِهَا هِيَ ثَمَانِيَةَ عَشَرَ حَرْفًا أَصْلِيَّةٌ... وَسَبْعَةُ أَحْرُفٍ أَخَرُ فَرْعِيَّةٌ... (Türk dillerinin tamamının üzerine kurulu olduğu harfler on sekiz (18) aslî (temel) harftir... Ve yedi (7) adet de fer'î (ikincil) harf vardır...)

  • Ünlüler ve Yazı Sistemi: (Metin, Kaynak: 97-98 civarı)

الْأَصْلُ فِي كِتَبَةِ هَذَا الْخَطِ أَنَّ كُلَّ فَتْحَةٍ تَقْتَرِفُ أَلِفاً... وَكُلُّ ضَمَّةٍ تَجْتَرِحُ واواً... وَكُلُّ كَسْرَةٍ تَكْتَسِبُ يَاءَ... (Bu yazının aslî kuralı şudur: Her "fetha" (üstün) yazıda bir "Elif" çeker... Her "damme" (ötre) satırda bir "Vav" çeker. Ve her "kesre" (esre) bir "Ye" kazanır...)

  • 7 Harf Sınırı: (Metin, Kaynak: 167 civarı)

...وَاللسبَاعِي فِي الْأَسْمَاءِ قَلِيلُ... وَلَا يُجَاوِزُ السُّبَاعِي. (...Yedi harfli (es-Sübâî) olan isimlerde azdır (kalîl)... Ve yedi harfi geçmez.)

  • "Mühmel" ve "Müsta'mel" Ayrımı: (Metin, Kaynak: 48-49 civarı)

وَلَقَدْ تَخَالَجَ فِي صَدْرِي أَنْ أَبْنِيَ الْكِتَابَ كَمَا بَنَى الْخَلِيلُ كِتَابَ الْمَيْنِ وَاذْكُرَ الْمُسْتَعْمَلَ وَ الْمُهْمَلَ مَعَا... فَأَنْبَتْ الْمُسْتَعْمَلَ وَأَهْمَلْتُ الْمُهْمَلَ طَلَبَا لِلْإِخْتِصَارِ. (Gerçekten de aklımdan... kitabı, Halil'in Kitâbu'l-'Ayn'ı gibi inşa etmek geçti. [Böylece] kullanılan (Müsta'mel) ve kullanılmayanı (Mühmel) birlikte zikredeyim... Bu yüzden, kısaltma (ihtisâr) yolunu tutarak, [dilde] kullanılanı (el-Müsta'mel) tespit ettim ve kullanılmayanı (el-Mühmel) terk ettim (ihmâl ettim).)

  • Saha Araştırması: (Metin, Kaynak: 26 civarı)

فَإِنِّي نَقَبْتُ بِلادَهُمْ وَفَيَا فِيَهُمْ ، وَاقْتَبَسْتُ لُغَاتِهِمْ وَقَوافِيَهُمْ... (Ben onların (Türklerin) şehirlerini (bilad) ve bozkırlarını (feyâfî) baştan başa dolaştım; dillerini ve kafiyelerini (söz varlıklarını) öğrendim...)

  • Kökler ("Mevzû") ve Ekler ("Müştak"): (Metin, Kaynak: 104-109, 181-183 civarı)

الْأَسْمَاءُ ضَرْبَانِ مُشْتَقَهُ وَمَوْضُوعَةٌ... فَالْمُشْتَقُ مِنَ الْأَفْعَالِ تَنْشَقُ بِأَحْرُفٍ تَدْخُلُ فِيهَا مِنِ اثْنَى عَشَرَ حرفاً. أَمَّا الْمَوْضُوعَةُ نَحْو قَوْلِهِمْ لِلْسَيْفِ ،”قلج”... زِيَADَاتُ الْأَفْعَالِ بِالْحُرُوفِ الْعَشَرَةِ... فَكُلُّ وَاحِدٍ مِنْهَا تُرَADُ لِمَعَانِ. (İsimler iki kısımdır: Türemiş (Müştak) ve Konulmuş (Mevzû)... Fiillerden türeyenler (Müştak), on iki (12) harfin [sona] eklenmesiyle oluşur. Konulmuş (Mevzû) olanlar ise, Kılıç'a Qılıç (قلج)... demeleri gibidir... Fiillerdeki ziyâdeler on (10) harf iledir... Bunların her biri bir mana (anlam) için istenir.)

  • Çekim Ekleri (Cevâhir Kitabı): (Metin, Kaynak: 145-146 civarı)

لِأَنَا أَفْرَدْنَا لَهُ كِتَاباً آخَرَ سَمَيْنَاهُ كِتَابَ جَواهِرِ النَّحْوِ فِي لُمَاتِ الْتُرْكِ. فَيُوقَفُ فِيهِ عَلَى هَذِهِ الْعِللِ النحْوِيَّةِ. (Çünkü biz, bu (konular) için Kitâbu Cevâhiri'n-Nahv fî Lugâti't-Türk (Türk Dillerinin Gramer Cevherleri Kitabı) adını verdiğimiz ayrı bir kitap ayırdık (efrednâ). Bu Nahvî (Sentaks/Gramer) kuralları (ilel) orada öğrenilecektir.)

  • "Dahîl" Kelimelerin Ayıklanması: (Metin, Kaynak: 160 civarı)

وَمَا كَانَ دَخيلاً فِي هَذِهِ الْلُغَةِ لَمْ يُذْكَرُ. (Ve bu dile "Dahîl" (sonradan girmiş, alıntı) olan (kelimeler) zikredilmedi.)

Kaynakça

[1] Yüksel Yeni.  DLT Tabanlı NLP için NLP Destekli DLT Tercümesi (2025)

 



Bu yazı 489 defa okunmuştur.

FACEBOOK YORUM
Yorum

YAZARIN DİĞER YAZILARI

Bizi Takip Edin :
Facebook Twitter Google Youtube RSS
YAZARLAR
nöbetçi eczaneler
ÇOK OKUNAN HABERLER
  • BUGÜN
  • BU HAFTA
  • BU AY
SON YORUMLANANLAR
  • HABERLER
  • VİDEOLAR
HABER ARŞİVİ

Web sitemize nasıl ulaştınız?


HABER ARA
YUKARI