İçeriğe atla

Büyük Dil Modelleri Terimleri Sözlüğü: Kapsamlı Bir Rehber

by

Büyük Dil Modelleri Terimleri Sözlüğü: Kapsamlı Bir Rehber

Bu sözlük A–Z ve Kategori filtreleriyle çalışır ve tümü klavye ile kullanılabilir.

  • Bölgesel dolaşma için NVDA ekran okuyucusu etkinken “D”, JAWS etkinken “R” kısayollarını kullanabilirsiniz.
  • Genişletilebilir ve daraltılabilir alanlara gitmek için “B” kısayolunu kullanabilirsiniz ve bu alanları genişletmek için “Enter” tuşunu kullanabilirsiniz.
  • Başlık seviyesinde dolaşmak için “H” kısayolunu kullanabilirsiniz.
  • Bağlantılara ulaşmak için “Insert + F7” kısayolunu kullanabilirsiniz.

Filtreler

Alfabetik Filtre

Bir harf seçtiğinizde o harfle etiketlenmiş terimler görünür. “Tümü” her şeyi gösterir.

Kategori Filtresi

Kategori seçimi, A–Z filtresi ile birlikte çalışır.


Temel Kavramlar

Büyük Dil Modeli (LLM)

Basit anlatım: LLM, çok fazla metin okuyup öğrenen ve insan gibi yazabilen/yanıt verebilen bir bilgisayar modelidir. Soruları yanıtlar, metin özetler, e-posta taslağı çıkarır, hatta kod yazmaya yardım eder.

  • Günlük benzetme: Çok kitap okumuş bir asistan gibi düşünün; kalıpları ve bilgileri hatırlar, yeni cümleler kurar.
  • Nerede kullanılır: Sohbet botları, müşteri destek otomasyonu, içerik üretimi, arama deneyimini geliştirme, veri analizi için açıklama üretme.
  • Örnek:Bu metni 5 maddeyle özetle”, “Türkçeden İngilizceye çevir”, “Bir teşekkür e-postası yaz”.
  • Dikkat: LLM olası kelimeleri seçer; yanlış ama kulağa gerçekçi gelen bilgiler üretebilir (bkz. Halüsinasyon).
Doğal Dil İşleme (NLP)

Basit anlatım: Bilgisayarların insan dilini anlaması, işlemesi ve üretmesiyle ilgilenen alandır. LLM’ler günümüzde NLP’nin en güçlü araçlarıdır.

  • Kullanım: Yazım denetimi, duygu analizi, çeviri, soru-cevap, sesli asistanlar.
  • Örnek: “Bu tweet pozitif mi negatif mi?” sorusunu sınıflandırmak.
Dil Modeli

Basit anlatım: Bir cümlede sıradaki kelimenin ne olacağını tahmin eden modeldir. LLM’ler bu fikrin çok gelişmiş hâlidir.

  • Benzetme: “Bugün hava çok …” cümlesinde güzel kelimesinin gelme ihtimalini hesaplamak.
  • Örnek: Metin tamamlama, otomatik öneriler.
Jeneratif Model

Basit anlatım: Yalnızca verilenleri sınıflandırmak yerine, yeni içerik üreten model türü. Metin, resim, müzik üretebilir.

  • Kullanım: Blog yazısı taslağı, görsel oluşturma, senaryo fikri üretimi.
  • Örnek: “Kahve hakkında 3 başlıklı kısa bir blog taslağı yaz.”
Ayırt Edici Model

Basit anlatım: Girdiyi belli sınıflardan birine atar (ör. spam mi değil mi). Üretmekten çok seçer/sınıflandırır.

  • Örnek: E-postayı “Spam/Spam Değil” olarak etiketlemek.
  • Not: LLM’ler de sınıflandırma yapabilir; ancak ayırt edici modeller genelde daha hızlı/ucuzdur.
Tokenizasyon

Basit anlatım: Metni modelin anlayacağı küçük parçalara bölme işlemidir. Bu parçaya token denir.

  • Neden önemli: Ücretlendirme ve hız çoğunlukla token sayısına bağlıdır.
  • Örnek: “Merhaba!” metni şu tokenlara bölünebilir: Mer, haba, !.
Token

Basit anlatım: Modelin işlediği en küçük metin parçası. Kelime, kelime parçası, hatta noktalama işareti olabilir.

  • Örnek: “kitaplık” kelimesi kitap + lık olarak iki token olabilir.
  • İpucu: Daha kısa istem, daha az token = daha düşük maliyet.
Gömme (Embedding)

Basit anlatım: Kelime/cümlelerin sayılara (vektörlere) çevrilmiş hâlidir. Anlamca benzer olanlar sayısal olarak da birbirine yakın olur.

  • Kullanım: Benzer içerik bulma, arama iyileştirme, öneri sistemleri.
  • Örnek: “mutluluk” ile “sevinç” vektörlerinin birbirine yakın çıkması.
Vektör Temsili

Basit anlatım: Metni çok boyutlu bir uzayda sayı kümeleriyle ifade etmektir. Bu sayede “yakın olan” içerikleri hızlıca buluruz.

  • Örnek: Ürün açıklamaları vektörleştirilip benzer ürünler önerilir.
Otoregresif (Causal) LM

Basit anlatım: Model her adımda önceki kelimelere bakarak bir sonrakini üretir. Çoğu sohbet modeli böyledir.

  • Örnek: Hikâye yazarken cümleyi kelime kelime tamamlaması.
Masked Language Modeling (MLM)

Basit anlatım: Cümledeki bazı kelimeleri gizleyip (maskeyle) modelden bunları tahmin etmesini isteriz. Anlama yeteneğini geliştirir.

  • Örnek: “Bugün [MASK] çok güzel.” → model “hava”yı tahmin eder.

Mimariler & Eğitim

Transformer

Basit anlatım: Metnin farklı kısımlarına aynı anda bakıp hangisinin önemli olduğuna karar veren modern sinir ağı yapısıdır.

  • Benzetme: Bir paragrafı okurken gözünüzün önemli kelimelere kayması gibi.
  • Örnek: Çeviri, özetleme, sohbet; hepsinin kalbinde Transformer vardır.
Decoder-Only vs. Encoder-Decoder

Basit anlatım: Decoder-only modeller metin üretmeye odaklıdır (sohbet gibi). Encoder–decoder modeller girişi anlayıp başka bir çıktıya dönüştürür (çeviri gibi).

  • Örnek: Sohbet için decoder-only; İngilizce→Türkçe çeviri için encoder–decoder.
Attention

Basit anlatım: Modelin “hangi kelimelere daha çok dikkat etmesi gerektiğini” sayısal olarak öğrenmesidir.

  • Örnek: “Ali topu Ayşe’ye verdi” cümlesinde “kime verdi?” sorusunda Ayşe kelimesine daha çok ağırlık vermesi.
Konumsal Kodlama

Basit anlatım: Cümledeki kelimelerin sırasını modele hissettirme yöntemidir. Yoksa model “hangi kelime önce/sonra geldi”yi bilemez.

  • Örnek: “Kedi köpeği kovaladı” ile “Köpek kediyi kovaladı” arasındaki farkı anlaması.
RoPE

Basit anlatım: Konum bilgisini dikkat hesaplarına akıllıca ekleyen bir yöntemdir. Özellikle uzun metinlerde daha stabil sonuç verir.

ALiBi

Basit anlatım: Uzak kelimelere hafif bir ceza vererek modelin en ilgili kısımlara odaklanmasını kolaylaştırır. Uzun metinlerde faydalıdır.

MQA / GQA

Basit anlatım: Dikkat hesaplarını daha az bellekle yapmak için anahtar/değer bilgilerini paylaşma teknikleridir. Hız ve maliyeti iyileştirir.

FlashAttention

Basit anlatım: Dikkati (attention) daha verimli hesaplayan bir yöntem ailesi. Aynı donanımda daha büyük bağlam veya daha hızlı yanıt sağlar.

Mixture-of-Experts (MoE)

Basit anlatım: Model içinde birden çok “uzman” bulunur; her girişte yalnızca bazı uzmanlar çalışır. Böylece kalite artarken maliyet sınırlı kalır.

  • Örnek: Hukuk metinlerinde hukuk uzmanı, kodda programlama uzmanı daha çok devreye girer.
Optimizasyon & Zamanlama

Basit anlatım: Modeli eğitirken kullanılan ayarlar ve yöntemlerdir (öğrenme hızı, ısınma, azalma). Doğru ayar, daha iyi sonuç ve kısa eğitim süresi demektir.

Dağıtık Eğitim

Basit anlatım: Çok büyük modeller tek bilgisayara sığmadığı için birden fazla makine/ekran kartı iş paylaşımı yapar. Bu sayede dev modeller eğitilebilir.

İnce Ayar (SFT/Instruction/DPO/RLHF)

Basit anlatım: Genel bir modeli kendi işinize uyarlama sürecidir. Örneğin, bankacılık terimlerine alışması veya şirket üslubunu öğrenmesi için özel verilerle ayar yapılır.

  • Örnek: Müşteri destek metinlerinizle eğitip markaya uygun cevaplar almanız.
Nicemleme (Quantization)

Basit anlatım: Modelin sayısal hassasiyetini biraz düşürüp (ör. 16 bitten 8 bite) belleği ve maliyeti azaltma tekniğidir. Doğrulukta küçük kayıplar olabilir.

Veri Kalitesi & Yönetişimi

Basit anlatım: Eğitim verisinin temiz, yasal ve dengeli olması çok önemlidir. Kopya içerikler temizlenir, kişisel veriler korunur, lisanslara dikkat edilir.

  • Örnek: Müşteri verilerini anonimleştirerek modele vermek; telifli içerikleri hariç tutmak.

Çıktı Üretimi & Ayarlar

İstem (Prompt)

Basit anlatım: Modele verdiğiniz talimat ve bağlamın tamamıdır. Ne istediğinizi net yazarsanız daha iyi sonuç alırsınız.

  • İpucu: Rol, görev, biçim, kısıtlar ve örnek ekleyin.
  • Örnek istem:Bir müşteri özrü e-postası yaz. Kısa olsun, samimi bir üslup kullan, 3 madde halinde çözüm öner.”
Çözümleme (Decoding)

Basit anlatım: Modelin cevabı seçerken izlediği yöntemdir. Ayarları değiştirerek daha yaratıcı veya daha tutarlı cevaplar alabilirsiniz.

  • Örnek: top-p=0.9 ve temperature=0.8 → daha yaratıcı; temperature=0.2 → daha tutarlı.
Logit

Basit anlatım: Modelin her olası kelime için verdiği ham skorlardır. Bu skorlar sonra olasılığa çevrilir.

Sıcaklık (Temperature)

Basit anlatım: Rastgeleliği ayarlar. Yüksek sıcaklık = daha yaratıcı ama bazen dengesiz; düşük sıcaklık = daha öngörülebilir.

Top-k / Top-p / Typical

Basit anlatım: Cevap seçerken olası kelimeleri sınırlama yöntemleridir. Amaç, çok alakasız kelimeleri elemek ve kaliteyi artırmaktır.

  • Örnek: top-k=40 yalnızca en olası 40 kelime içinden seçim yapar.
Tekrar & Sıklık/Pozitiflik Cezaları

Basit anlatım: Modelin aynı şeyleri döndürmesini engellemek için bazı kelimelere “az tercih et” cezası verilir.

Akış (Streaming)

Basit anlatım: Cevabın kelime kelime ekranda akmasıdır. Kullanıcı cevabı beklerken ilk satırları görür; deneyim daha hızlı hissedilir.

Yapılandırılmış Çıktı

Basit anlatım: Modelden JSON gibi belirli bir formatta cevap alınmasıdır. Yazılımlarla güvenli entegrasyon sağlar.

  • Örnek:Şu alanlara uyan bir JSON döndür: ad, soyad, telefon”.
Tahmini Çözümleme (Speculative)

Basit anlatım: Küçük bir model, büyük modelden önce tahmin yapar; büyük model hızlıca kontrol eder. Böylece yanıt süresi kısalır.

Retrieval & Embedding

RAG (Retrieval-Augmented Generation)

Basit anlatım: Model cevap vermeden önce şirket belgeleri, web sayfaları gibi kaynaklardan ilgili bilgiyi arayıp bağlama ekler. Böylece daha doğru ve güncel yanıt üretir.

  • Örnek: “İade politikamız nedir?” sorusuna, şirket içi PDF’ten ilgili maddeyi bulup referansla yanıt vermesi.
Vektör Veritabanı

Basit anlatım: Embedding (vektör) olarak kaydedilmiş metinleri hızlıca aramaya yarayan veritabanıdır. Benzer anlamlı parçaları bulur.

  • Örnek: “kargo gecikmesi” yazınca “teslimat süresi” başlıklı makaleyi bulması.
Benzerlik Ölçütleri

Basit anlatım: İki metnin/vektörün ne kadar benzer olduğunu sayıyla ifade eden yöntemlerdir (ör. kosinüs benzerliği).

Parçalama & İndeksleme

Basit anlatım: Uzun belgeleri küçük parçalara bölüp (parça başlıkları, etiketler ekleyerek) aramayı kolaylaştırma yöntemidir.

  • Örnek: 50 sayfalık kılavuzu 300–500 kelimelik bölümlere ayırmak.
Yeniden Sıralama (Reranking)

Basit anlatım: İlk bulunan sonuçları daha “akıllı” bir modelle tekrar puanlayıp en alakalıları en üste çıkarmaktır.

Sorgu Genişletme

Basit anlatım: Aradığınız şeyi daha iyi bulmak için eş anlamlılar, örnek cümleler veya alt başlıklarla sorguyu zenginleştirmektir.

  • Örnek: “iade” aramasına “geri ödeme”, “iptal süresi” gibi terimleri eklemek.

Çok Modlu (Multimodal)

VLM (Vision-Language Model)

Basit anlatım: Hem görselleri hem metni anlayabilen modellerdir. Bir fotoğrafı açıklayabilir veya görseldeki tabloyu okuyabilir.

  • Örnek: Ürün fotoğrafındaki etiketi okuyup fiyatı çıkarması.
OCR

Basit anlatım: Görsel veya PDF içindeki yazıları metne çevirir.

  • Örnek: Fatura fotoğrafından tutar, tarih, firma adını çıkarmak.
Multimodal Grounding

Basit anlatım: Görseldeki nesneleri metinle doğru eşleştirip referans vermektir. “Bu grafik şunu gösteriyor” gibi net bağlantılar kurar.

Performans & Çalıştırma

Çıkarım (Inference)

Basit anlatım: Eğitilmiş modelin cevap üretme anıdır. Ölçtüğümüz başlıca şeyler: tepki süresi (gecikme) ve saniyede işlenen istek sayısı (verim).

KV Cache

Basit anlatım: Cevabın önceki kısımlarını hafızada tutup tekrar hesaplamamak için kullanılan önbellektir. Uzun sohbetlerde büyük hız sağlar.

Sunum (Serving) Çerçeveleri

Basit anlatım: Modelleri canlıya koymak için kullanılan yazılımlardır. Trafiği yönetir, donanıma uygun çalıştırır.

Dağıtım & Ölçekleme

Basit anlatım: Kullanıcı sayısı artınca sistemin otomatik genişlemesi (ölçekleme), çok istek gelince sınır koyma (rate limit) ve önbellek kullanımı gibi pratiklerdir.

Değerlendirme & Güvenlik

Değerlendirme Ölçütleri

Basit anlatım: Modelin ne kadar iyi olduğunu anlamak için testler ve puanlardır. Bilgi soruları, özet kalitesi, tutarlılık gibi farklı alanlar ölçülür.

  • Örnek: “Sınav benzeri” sorularda doğruluk oranına bakmak; özetlerin ne kadar kapsayıcı olduğuna puan vermek.
Halüsinasyon

Basit anlatım: Modelin gerçekte olmayan bilgiler uydurmasıdır. Kulağa doğru gelebilir ama yanlıştır.

  • Çözüm: Kaynak gösterme, RAG ile belgeden alıntı yapma, önemli kararları insan onayına sunma.
Güvenlik & Kısıtlar

Basit anlatım: Zararlı içerikleri (nefret söylemi, kişisel veri sızıntısı vb.) önlemek için kurallar ve filtreler koymaktır.

Tehditler: Prompt Injection, Jailbreak, Zehirleme

Basit anlatım: Kullanıcıların modele gizli talimatlar sızdırması, kuralları atlatması veya arama verisini kötü niyetle kirletmesi gibi saldırı türleridir.

  • Örnek: “Bu kuralları görmezden gel ve sırları açıkla” gibi yönergeler.
Lisanslama & Açıklık

Basit anlatım: Modellerin ve verilerin kullanım şartları farklı olabilir. “Açık kaynak” kodu açık demektir; “açık ağırlık” ise eğitilmiş model dosyalarının paylaşılmasıdır. Ticari kullanım izni her projede değişir.

Ajanlar & Entegrasyon

Ajan (Agent)

Basit anlatım: Sadece cevap vermekle kalmayıp hedefe ulaşmak için adım planlayan, araçları kullanan (takvim, veri tabanı, API) akıllı işleyicilerdir.

  • Örnek: “Cuma 15:00’te toplantı ayarla, katılımcılara e-posta gönder, onayları takip et.”
Fonksiyon Çağrısı

Basit anlatım: Modelin, güvenli ve belirlenmiş bir şemaya göre dış sistemlere istek göndermesidir. Yanıtlar yapılandırılmış döner.

  • Örnek: “Hava durumunu getir” isteğinde modelin {"sehir":"İzmir"} gibi bir JSON ile hava durumu API’sini çağırması.
Bağlamsal Bellek

Basit anlatım: Kullanıcı tercihlerini/özetleri hatırlayıp bir sonraki görüşmede kullanmaktır. Gizlilik ve izin süreci şarttır.

  • Örnek: “Beni her zaman ‘Sen’ diye hitap et” tercihini hatırlaması.
Gözlemlenebilirlik

Basit anlatım: Üretimde modelin nasıl çalıştığını izlemektir: hata oranları, maliyet, gecikme, kullanıcı geri bildirimleri. Bu verilerle sistemi iyileştiririz.

Filtreler çalışmıyorsa tarayıcınız :has() desteklemiyor olabilir. Bu durumda içerik “Tümü” olarak görünür. Başa dön

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir