Büyük Dil Modelleri Terimleri Sözlüğü: Kapsamlı Bir Rehber

Temel Kavramlar

Büyük Dil Modeli (LLM)

Basit anlatım: LLM, çok fazla metin okuyup öğrenen ve insan gibi yazabilen/yanıt verebilen bir bilgisayar modelidir. Soruları yanıtlar, metin özetler, e-posta taslağı çıkarır, hatta kod yazmaya yardım eder.

Günlük benzetme: Çok kitap okumuş bir asistan gibi düşünün; kalıpları ve bilgileri hatırlar, yeni cümleler kurar.
Nerede kullanılır: Sohbet botları, müşteri destek otomasyonu, içerik üretimi, arama deneyimini geliştirme, veri analizi için açıklama üretme.
Örnek: “Bu metni 5 maddeyle özetle”, “Türkçeden İngilizceye çevir”, “Bir teşekkür e-postası yaz”.
Dikkat: LLM olası kelimeleri seçer; yanlış ama kulağa gerçekçi gelen bilgiler üretebilir (bkz. Halüsinasyon).

Doğal Dil İşleme (NLP)

Basit anlatım: Bilgisayarların insan dilini anlaması, işlemesi ve üretmesiyle ilgilenen alandır. LLM’ler günümüzde NLP’nin en güçlü araçlarıdır.

Kullanım: Yazım denetimi, duygu analizi, çeviri, soru-cevap, sesli asistanlar.
Örnek: “Bu tweet pozitif mi negatif mi?” sorusunu sınıflandırmak.

Dil Modeli

Basit anlatım: Bir cümlede sıradaki kelimenin ne olacağını tahmin eden modeldir. LLM’ler bu fikrin çok gelişmiş hâlidir.

Benzetme: “Bugün hava çok …” cümlesinde güzel kelimesinin gelme ihtimalini hesaplamak.
Örnek: Metin tamamlama, otomatik öneriler.

Jeneratif Model

Basit anlatım: Yalnızca verilenleri sınıflandırmak yerine, yeni içerik üreten model türü. Metin, resim, müzik üretebilir.

Kullanım: Blog yazısı taslağı, görsel oluşturma, senaryo fikri üretimi.
Örnek: “Kahve hakkında 3 başlıklı kısa bir blog taslağı yaz.”

Ayırt Edici Model

Basit anlatım: Girdiyi belli sınıflardan birine atar (ör. spam mi değil mi). Üretmekten çok seçer/sınıflandırır.

Örnek: E-postayı “Spam/Spam Değil” olarak etiketlemek.
Not: LLM’ler de sınıflandırma yapabilir; ancak ayırt edici modeller genelde daha hızlı/ucuzdur.

Tokenizasyon

Basit anlatım: Metni modelin anlayacağı küçük parçalara bölme işlemidir. Bu parçaya token denir.

Neden önemli: Ücretlendirme ve hız çoğunlukla token sayısına bağlıdır.
Örnek: “Merhaba!” metni şu tokenlara bölünebilir: Mer, haba, !.

Token

Basit anlatım: Modelin işlediği en küçük metin parçası. Kelime, kelime parçası, hatta noktalama işareti olabilir.

Örnek: “kitaplık” kelimesi kitap + lık olarak iki token olabilir.
İpucu: Daha kısa istem, daha az token = daha düşük maliyet.

Gömme (Embedding)

Basit anlatım: Kelime/cümlelerin sayılara (vektörlere) çevrilmiş hâlidir. Anlamca benzer olanlar sayısal olarak da birbirine yakın olur.

Kullanım: Benzer içerik bulma, arama iyileştirme, öneri sistemleri.
Örnek: “mutluluk” ile “sevinç” vektörlerinin birbirine yakın çıkması.

Vektör Temsili

Basit anlatım: Metni çok boyutlu bir uzayda sayı kümeleriyle ifade etmektir. Bu sayede “yakın olan” içerikleri hızlıca buluruz.

Örnek: Ürün açıklamaları vektörleştirilip benzer ürünler önerilir.

Otoregresif (Causal) LM

Basit anlatım: Model her adımda önceki kelimelere bakarak bir sonrakini üretir. Çoğu sohbet modeli böyledir.

Örnek: Hikâye yazarken cümleyi kelime kelime tamamlaması.

Masked Language Modeling (MLM)

Basit anlatım: Cümledeki bazı kelimeleri gizleyip (maskeyle) modelden bunları tahmin etmesini isteriz. Anlama yeteneğini geliştirir.

Örnek: “Bugün [MASK] çok güzel.” → model “hava”yı tahmin eder.

Mimariler & Eğitim

Transformer

Basit anlatım: Metnin farklı kısımlarına aynı anda bakıp hangisinin önemli olduğuna karar veren modern sinir ağı yapısıdır.

Benzetme: Bir paragrafı okurken gözünüzün önemli kelimelere kayması gibi.
Örnek: Çeviri, özetleme, sohbet; hepsinin kalbinde Transformer vardır.

Decoder-Only vs. Encoder-Decoder

Basit anlatım: Decoder-only modeller metin üretmeye odaklıdır (sohbet gibi). Encoder–decoder modeller girişi anlayıp başka bir çıktıya dönüştürür (çeviri gibi).

Örnek: Sohbet için decoder-only; İngilizce→Türkçe çeviri için encoder–decoder.

Attention

Basit anlatım: Modelin “hangi kelimelere daha çok dikkat etmesi gerektiğini” sayısal olarak öğrenmesidir.

Örnek: “Ali topu Ayşe’ye verdi” cümlesinde “kime verdi?” sorusunda Ayşe kelimesine daha çok ağırlık vermesi.

Konumsal Kodlama

Basit anlatım: Cümledeki kelimelerin sırasını modele hissettirme yöntemidir. Yoksa model “hangi kelime önce/sonra geldi”yi bilemez.

Örnek: “Kedi köpeği kovaladı” ile “Köpek kediyi kovaladı” arasındaki farkı anlaması.

RoPE

Basit anlatım: Konum bilgisini dikkat hesaplarına akıllıca ekleyen bir yöntemdir. Özellikle uzun metinlerde daha stabil sonuç verir.

ALiBi

Basit anlatım: Uzak kelimelere hafif bir ceza vererek modelin en ilgili kısımlara odaklanmasını kolaylaştırır. Uzun metinlerde faydalıdır.

MQA / GQA

Basit anlatım: Dikkat hesaplarını daha az bellekle yapmak için anahtar/değer bilgilerini paylaşma teknikleridir. Hız ve maliyeti iyileştirir.

FlashAttention

Basit anlatım: Dikkati (attention) daha verimli hesaplayan bir yöntem ailesi. Aynı donanımda daha büyük bağlam veya daha hızlı yanıt sağlar.

Mixture-of-Experts (MoE)

Basit anlatım: Model içinde birden çok “uzman” bulunur; her girişte yalnızca bazı uzmanlar çalışır. Böylece kalite artarken maliyet sınırlı kalır.

Örnek: Hukuk metinlerinde hukuk uzmanı, kodda programlama uzmanı daha çok devreye girer.

Optimizasyon & Zamanlama

Basit anlatım: Modeli eğitirken kullanılan ayarlar ve yöntemlerdir (öğrenme hızı, ısınma, azalma). Doğru ayar, daha iyi sonuç ve kısa eğitim süresi demektir.

Dağıtık Eğitim

Basit anlatım: Çok büyük modeller tek bilgisayara sığmadığı için birden fazla makine/ekran kartı iş paylaşımı yapar. Bu sayede dev modeller eğitilebilir.

İnce Ayar (SFT/Instruction/DPO/RLHF)

Basit anlatım: Genel bir modeli kendi işinize uyarlama sürecidir. Örneğin, bankacılık terimlerine alışması veya şirket üslubunu öğrenmesi için özel verilerle ayar yapılır.

Örnek: Müşteri destek metinlerinizle eğitip markaya uygun cevaplar almanız.

Nicemleme (Quantization)

Basit anlatım: Modelin sayısal hassasiyetini biraz düşürüp (ör. 16 bitten 8 bite) belleği ve maliyeti azaltma tekniğidir. Doğrulukta küçük kayıplar olabilir.

Veri Kalitesi & Yönetişimi

Basit anlatım: Eğitim verisinin temiz, yasal ve dengeli olması çok önemlidir. Kopya içerikler temizlenir, kişisel veriler korunur, lisanslara dikkat edilir.

Örnek: Müşteri verilerini anonimleştirerek modele vermek; telifli içerikleri hariç tutmak.

Çıktı Üretimi & Ayarlar

İstem (Prompt)

Basit anlatım: Modele verdiğiniz talimat ve bağlamın tamamıdır. Ne istediğinizi net yazarsanız daha iyi sonuç alırsınız.

İpucu: Rol, görev, biçim, kısıtlar ve örnek ekleyin.
Örnek istem: “Bir müşteri özrü e-postası yaz. Kısa olsun, samimi bir üslup kullan, 3 madde halinde çözüm öner.”

Çözümleme (Decoding)

Basit anlatım: Modelin cevabı seçerken izlediği yöntemdir. Ayarları değiştirerek daha yaratıcı veya daha tutarlı cevaplar alabilirsiniz.

Örnek: top-p=0.9 ve temperature=0.8 → daha yaratıcı; temperature=0.2 → daha tutarlı.

Logit

Basit anlatım: Modelin her olası kelime için verdiği ham skorlardır. Bu skorlar sonra olasılığa çevrilir.

Sıcaklık (Temperature)

Basit anlatım: Rastgeleliği ayarlar. Yüksek sıcaklık = daha yaratıcı ama bazen dengesiz; düşük sıcaklık = daha öngörülebilir.

Top-k / Top-p / Typical

Basit anlatım: Cevap seçerken olası kelimeleri sınırlama yöntemleridir. Amaç, çok alakasız kelimeleri elemek ve kaliteyi artırmaktır.

Örnek: top-k=40 yalnızca en olası 40 kelime içinden seçim yapar.

Tekrar & Sıklık/Pozitiflik Cezaları

Basit anlatım: Modelin aynı şeyleri döndürmesini engellemek için bazı kelimelere “az tercih et” cezası verilir.

Akış (Streaming)

Basit anlatım: Cevabın kelime kelime ekranda akmasıdır. Kullanıcı cevabı beklerken ilk satırları görür; deneyim daha hızlı hissedilir.

Yapılandırılmış Çıktı

Basit anlatım: Modelden JSON gibi belirli bir formatta cevap alınmasıdır. Yazılımlarla güvenli entegrasyon sağlar.

Örnek: “Şu alanlara uyan bir JSON döndür: ad, soyad, telefon”.

Tahmini Çözümleme (Speculative)

Basit anlatım: Küçük bir model, büyük modelden önce tahmin yapar; büyük model hızlıca kontrol eder. Böylece yanıt süresi kısalır.

Retrieval & Embedding

RAG (Retrieval-Augmented Generation)

Basit anlatım: Model cevap vermeden önce şirket belgeleri, web sayfaları gibi kaynaklardan ilgili bilgiyi arayıp bağlama ekler. Böylece daha doğru ve güncel yanıt üretir.

Örnek: “İade politikamız nedir?” sorusuna, şirket içi PDF’ten ilgili maddeyi bulup referansla yanıt vermesi.

Vektör Veritabanı

Basit anlatım: Embedding (vektör) olarak kaydedilmiş metinleri hızlıca aramaya yarayan veritabanıdır. Benzer anlamlı parçaları bulur.

Örnek: “kargo gecikmesi” yazınca “teslimat süresi” başlıklı makaleyi bulması.

Benzerlik Ölçütleri

Basit anlatım: İki metnin/vektörün ne kadar benzer olduğunu sayıyla ifade eden yöntemlerdir (ör. kosinüs benzerliği).

Parçalama & İndeksleme

Basit anlatım: Uzun belgeleri küçük parçalara bölüp (parça başlıkları, etiketler ekleyerek) aramayı kolaylaştırma yöntemidir.

Örnek: 50 sayfalık kılavuzu 300–500 kelimelik bölümlere ayırmak.

Yeniden Sıralama (Reranking)

Basit anlatım: İlk bulunan sonuçları daha “akıllı” bir modelle tekrar puanlayıp en alakalıları en üste çıkarmaktır.

Sorgu Genişletme

Basit anlatım: Aradığınız şeyi daha iyi bulmak için eş anlamlılar, örnek cümleler veya alt başlıklarla sorguyu zenginleştirmektir.

Örnek: “iade” aramasına “geri ödeme”, “iptal süresi” gibi terimleri eklemek.

Çok Modlu (Multimodal)

VLM (Vision-Language Model)

Basit anlatım: Hem görselleri hem metni anlayabilen modellerdir. Bir fotoğrafı açıklayabilir veya görseldeki tabloyu okuyabilir.

Örnek: Ürün fotoğrafındaki etiketi okuyup fiyatı çıkarması.

OCR

Basit anlatım: Görsel veya PDF içindeki yazıları metne çevirir.

Örnek: Fatura fotoğrafından tutar, tarih, firma adını çıkarmak.

Multimodal Grounding

Basit anlatım: Görseldeki nesneleri metinle doğru eşleştirip referans vermektir. “Bu grafik şunu gösteriyor” gibi net bağlantılar kurar.

Performans & Çalıştırma

Çıkarım (Inference)

Basit anlatım: Eğitilmiş modelin cevap üretme anıdır. Ölçtüğümüz başlıca şeyler: tepki süresi (gecikme) ve saniyede işlenen istek sayısı (verim).

KV Cache

Basit anlatım: Cevabın önceki kısımlarını hafızada tutup tekrar hesaplamamak için kullanılan önbellektir. Uzun sohbetlerde büyük hız sağlar.

Sunum (Serving) Çerçeveleri

Basit anlatım: Modelleri canlıya koymak için kullanılan yazılımlardır. Trafiği yönetir, donanıma uygun çalıştırır.

Dağıtım & Ölçekleme

Basit anlatım: Kullanıcı sayısı artınca sistemin otomatik genişlemesi (ölçekleme), çok istek gelince sınır koyma (rate limit) ve önbellek kullanımı gibi pratiklerdir.

Değerlendirme & Güvenlik

Değerlendirme Ölçütleri

Basit anlatım: Modelin ne kadar iyi olduğunu anlamak için testler ve puanlardır. Bilgi soruları, özet kalitesi, tutarlılık gibi farklı alanlar ölçülür.

Örnek: “Sınav benzeri” sorularda doğruluk oranına bakmak; özetlerin ne kadar kapsayıcı olduğuna puan vermek.

Halüsinasyon

Basit anlatım: Modelin gerçekte olmayan bilgiler uydurmasıdır. Kulağa doğru gelebilir ama yanlıştır.

Çözüm: Kaynak gösterme, RAG ile belgeden alıntı yapma, önemli kararları insan onayına sunma.

Güvenlik & Kısıtlar

Basit anlatım: Zararlı içerikleri (nefret söylemi, kişisel veri sızıntısı vb.) önlemek için kurallar ve filtreler koymaktır.

Tehditler: Prompt Injection, Jailbreak, Zehirleme

Basit anlatım: Kullanıcıların modele gizli talimatlar sızdırması, kuralları atlatması veya arama verisini kötü niyetle kirletmesi gibi saldırı türleridir.

Örnek: “Bu kuralları görmezden gel ve sırları açıkla” gibi yönergeler.

Lisanslama & Açıklık

Basit anlatım: Modellerin ve verilerin kullanım şartları farklı olabilir. “Açık kaynak” kodu açık demektir; “açık ağırlık” ise eğitilmiş model dosyalarının paylaşılmasıdır. Ticari kullanım izni her projede değişir.

Ajanlar & Entegrasyon

Ajan (Agent)

Basit anlatım: Sadece cevap vermekle kalmayıp hedefe ulaşmak için adım planlayan, araçları kullanan (takvim, veri tabanı, API) akıllı işleyicilerdir.

Örnek: “Cuma 15:00’te toplantı ayarla, katılımcılara e-posta gönder, onayları takip et.”

Fonksiyon Çağrısı

Basit anlatım: Modelin, güvenli ve belirlenmiş bir şemaya göre dış sistemlere istek göndermesidir. Yanıtlar yapılandırılmış döner.

Örnek: “Hava durumunu getir” isteğinde modelin {"sehir":"İzmir"} gibi bir JSON ile hava durumu API’sini çağırması.

Bağlamsal Bellek

Basit anlatım: Kullanıcı tercihlerini/özetleri hatırlayıp bir sonraki görüşmede kullanmaktır. Gizlilik ve izin süreci şarttır.

Örnek: “Beni her zaman ‘Sen’ diye hitap et” tercihini hatırlaması.

Gözlemlenebilirlik

Basit anlatım: Üretimde modelin nasıl çalıştığını izlemektir: hata oranları, maliyet, gecikme, kullanıcı geri bildirimleri. Bu verilerle sistemi iyileştiririz.

Büyük Dil Modelleri Terimleri Sözlüğü: Kapsamlı Bir Rehber

Büyük Dil Modelleri Terimleri Sözlüğü: Kapsamlı Bir Rehber

Filtreler

Temel Kavramlar

Mimariler & Eğitim

Çıktı Üretimi & Ayarlar

Retrieval & Embedding

Çok Modlu (Multimodal)

Performans & Çalıştırma

Değerlendirme & Güvenlik

Ajanlar & Entegrasyon

Bir yanıt yazın Yanıtı iptal et