
Bir dil modeline hiç var olmayan bir kitabın yazarını sorduğunuzda, modelin tereddütsüz, akıcı ve son derece ikna edici bir isim üretmesine şahit olmuşsunuzdur. Sorun cevabın yanlış olması değil yalnızca; modelin yanlış olduğunu bilmiyormuş gibi davranmasıdır. Yapay zeka literatüründe bu olguya halüsinasyon (hallucination) deniyor: modelin, sağlanan kaynağa veya gerçek dünya bilgisine sadık olmayan, ama dilsel olarak kusursuz görünen içerik üretmesi. Bu yazıda halüsinasyonun neden ortaya çıktığını, hangi türlere ayrıldığını ve hem geliştirici hem de son kullanıcı tarafında nasıl azaltılabileceğini, akademik literatür ve büyük sağlayıcıların resmi belgeleri ışığında ele alıyoruz.
Halüsinasyon tam olarak nedir?
Büyük dil modelleri üzerine yapılan kapsamlı bir akademik derleme, halüsinasyonu "anlamsız ya da sağlanan kaynağa sadık olmayan içerik" olarak tanımlar. Bu derlemede olgu iki ana eksende sınıflandırılır. Birincisi sadakat (faithfulness) ekseni: modelin çıktısının kullanıcının verdiği girdiyle ya da kendi içsel tutarlılığıyla çelişmesi. İkincisi olgusallık (factuality) ekseni: çıktının doğrulanabilir gerçek dünya bilgisiyle çelişmesi.
Önemli bir nüans şudur: halüsinasyon her zaman "yalan" anlamına gelmez. Bir model, size verdiğiniz belgede yazmayan ama dünyada doğru olan bir bilgi ekleyebilir; bu da bir sadakat ihlalidir. Yani model gerçeği söylese bile, eğer kaynağınızdan sapıyorsa bu da bir halüsinasyon biçimidir. Bu ayrım, özellikle hukuki, tıbbi veya kurumsal belgelerle çalışırken kritik önem taşır.

Neden ortaya çıkar? Mesele bir hata değil, bir teşvik sorunu
Uzun süre halüsinasyon, modelin gizemli bir kusuru olarak görüldü. Ancak 2025'te yayımlanan ve OpenAI araştırmacıları Adam Tauman Kalai, Ofir Nachum, Santosh Vempala ve Edwin Zhang tarafından kaleme alınan "Why Language Models Hallucinate" başlıklı çalışma, bu olguya çok daha sade bir açıklama getiriyor: halüsinasyon, gizemli bir anomali değil, eğitim ve değerlendirme sürecinin doğal bir istatistiksel sonucudur.
Çalışmanın temel iddiası iki katmanlıdır. İlk olarak, ön eğitim (pretraining) aşamasında modeller, doğru ve yanlış ifadeleri birbirinden ayırt etmenin istatistiksel olarak güç olduğu durumlarda hata yapmaya doğal bir baskıyla itilir. Yazarlar bunu, gözetimli öğrenmedeki ikili sınıflandırma hatasına benzetir: geçerli ile geçersiz çıktıyı ayırt etmek zorlaştıkça, üretimde hata kaçınılmaz hale gelir.
İkinci ve belki de daha çarpıcı katman, değerlendirme (benchmark) sistemiyle ilgilidir. Çalışmaya göre, modellerin performansını ölçen test düzenekleri çoğunlukla "bilmiyorum" demeyi cezalandırır ve emin olunmayan durumda bir tahmin yürütmeyi ödüllendirir. Bir sınavda boş bırakmak yerine rastgele şıkkı işaretlemenin beklenen puanı artırması gibi, modeller de belirsizliği kabul etmek yerine kendinden emin bir tahmin üretmeye optimize edilir. Yazarların önerisi bu nedenle yeni bir halüsinasyon testi eklemek değil, mevcut başat ölçütlerin puanlama mantığını değiştirerek belirsizliği itiraf etmeyi ödüllendirmektir.
Bu çerçeve önemli bir sonuç doğurur: halüsinasyon, modeli ne kadar büyütürseniz büyütün tek başına kaybolmaz, çünkü kök neden mimaride değil, teşvik yapısındadır.

Halüsinasyonun başlıca türleri
Pratikte bir çıktıyı incelerken hangi tür halüsinasyonla karşı karşıya olduğunuzu ayırt etmek, doğru çözümü seçmenize yardımcı olur. Akademik derlemenin sınıflandırmasını sadeleştirerek özetleyelim:
- İçsel (intrinsic) halüsinasyon: Üretilen çıktı, doğrudan sağlanan kaynak içerikle çelişir. Örneğin verdiğiniz raporda "gelir yüzde 10 düştü" yazarken modelin "gelir arttı" demesi.
- Dışsal (extrinsic) halüsinasyon: Üretilen çıktı, kaynak içerikten doğrulanamaz; ne onaylanabilir ne de çürütülebilir, çünkü kaynakta o bilgiye dair hiçbir dayanak yoktur. Model boşluğu kendi parametrik belleğinden "doldurur".
- Olgusal tutarsızlık: Gerçek dünyada doğrulanabilir bir bilginin yanlış aktarılması; var olan bir gerçeğin çarpıtılması.
- Olgusal uydurma (fabrication): Doğrulanabilir hiçbir kaynağı olmayan, tümüyle uydurulmuş içerik; sahte alıntılar, var olmayan referanslar, hayali istatistikler bu kategoriye girer.
Bu türleri tanımak neden önemli? Çünkü içsel halüsinasyonu kaynağa daha sıkı bağlanma çözer; dışsal ve uydurma türündeki halüsinasyonları ise daha çok modelin dış bilgiye erişimini ve doğrulama disiplinini güçlendirerek bastırabilirsiniz.
Nasıl azaltılır? Geliştirici tarafındaki araçlar
Halüsinasyonu tamamen sıfırlamak bugün mümkün değil, ancak ölçülebilir biçimde azaltmak mümkün. Bunun en güçlü yöntemlerinden biri RAG (Retrieval-Augmented Generation) ve buna dayanan grounding (gerçeğe bağlama) yaklaşımıdır.
Google Cloud'un Vertex AI belgelerinde anlatıldığı üzere RAG iki adımlı çalışır: önce soruyla ilgili gerçekler güvenilir bir kaynaktan getirilir (retrieval), ardından model cevabını yalnızca bu getirilen gerçeklere dayanarak üretir (generation). Modelin cevabını kaynak metne bağlama işlemi grounding olarak adlandırılır. Vertex AI'nin yüksek-sadakat (high-fidelity) modu, modeli yalnızca müşterinin sağladığı bağlamla sınırlandırarak daha yüksek olgusallık ve daha az halüsinasyon hedefler; üstelik her cümleye kaynak iliştirir ve bir güven skoru sunar. Buradaki kilit fikir şudur: bilgiyi modelin belleğinden değil, denetlenebilir bir "kurumsal gerçek" havuzundan çekmek.
Sıcaklık (temperature) ayarı
Modelin çıktı üretirken ne kadar "yaratıcı" davranacağını belirleyen sıcaklık parametresi de bir kaldıraçtır. Sıcaklık 0'a yaklaştıkça model en olası, en tutarlı çıktıya yönelir; 1'e yaklaştıkça daha öngörülemez ve çeşitli üretim yapar. Anthropic'in resmi belgelerinde de vurgulandığı gibi, olgusal doğruluğun kritik olduğu görevlerde sıcaklığı düşürmek tutarlılığı artırır. Ancak sıcaklığı sıfırlamak tek başına halüsinasyonu çözmez; yalnızca modelin tahminlerindeki rastgeleliği azaltır, kök nedeni ortadan kaldırmaz.
Prompt düzeyinde korunma teknikleri
Modeli değiştiremeseniz bile, ona verdiğiniz talimatı değiştirerek halüsinasyonu ciddi biçimde bastırabilirsiniz. Anthropic'in halüsinasyon azaltma rehberi pratikte uygulanabilir birkaç tekniği şöyle sıralar:
- Modele "bilmiyorum" deme izni verin: Belirsizliği itiraf etmesine açıkça izin vermek, yanlış bilgiyi çarpıcı biçimde azaltır. "Yeterli bilgin yoksa, emin değilim de" gibi bir talimat bunu sağlar.
- Doğrudan alıntıyla bağlama: Uzun belgelerle çalışırken modelden önce ilgili pasajları kelimesi kelimesine alıntılamasını, sonra yalnızca bu alıntılara dayanarak analiz yapmasını isteyin. Bu, cevabı metnin kendisine demirler.
- Alıntıyla doğrulama: Her iddianın ardından destekleyici bir alıntı göstermesini isteyin. Model bir iddiayı destekleyecek alıntı bulamıyorsa, o iddiayı geri çekmelidir.
- Adım adım muhakeme: Nihai cevaptan önce modelden gerekçesini adım adım açıklamasını istemek, hatalı mantığı ve dayanaksız varsayımları görünür kılar.
- Dış bilgiyi kısıtlama: Modele yalnızca sağlanan belgeleri kullanmasını, genel bilgisine başvurmamasını açıkça söyleyin.
- Çoklu üretim karşılaştırması: Aynı istemi birkaç kez çalıştırıp çıktıları karşılaştırın; tutarsızlıklar muhtemel bir halüsinasyon sinyalidir.
Son kullanıcı nasıl korunur?
Teknik araçlara erişimi olmayan bir kullanıcı için de pratik bir savunma hattı vardır. En sağlam ilke şudur: yapay zekayı bir bilgi kaynağı değil, bir taslak üreticisi olarak görün. Spesifik isimler, tarihler, yasa maddeleri, istatistikler, akademik referanslar ve tıbbi/hukuki tavsiyeler söz konusu olduğunda çıktıyı her zaman bağımsız bir birincil kaynaktan doğrulayın. Modelin kaynak gösterdiği durumlarda bile o kaynağın gerçekten var olup olmadığını kontrol edin, çünkü uydurma referanslar halüsinasyonun en yaygın türlerinden biridir.
Sorularınızı, modeli belirli bir metne bağlayacak şekilde kurmak da işe yarar: "Şunu biliyor musun" yerine, ilgili belgeyi yapıştırıp "Bu metne göre" diye sormak, modelin bilgi uydurma alanını daraltır. Ve en basit kural her zaman geçerlidir: bir cevap ne kadar kendinden emin ve akıcı görünürse görünsün, bu onun doğru olduğunu garanti etmez.
Sonuç
Halüsinasyon, dil modellerinin geçici bir kusuru değil, onların çalışma biçiminin yapısal bir özelliğidir; eğitim ve değerlendirme teşvikleri belirsizliği itiraf etmek yerine tahmin yürütmeyi ödüllendirdikçe varlığını sürdürür. İyi haber şu ki, bu olgu artık iyi anlaşılmış durumda ve azaltılabilir: kaynağa bağlama (RAG ve grounding), düşük sıcaklık, alıntıyla doğrulama ve modele "bilmiyorum" deme izni vermek, hata oranını ölçülebilir biçimde düşürür. Yapay zekayı güvenle kullanmanın yolu, ondan asla hata yapmamasını beklemekten değil, onun nerede ve neden yanılabileceğini bilerek bir doğrulama disiplini kurmaktan geçiyor.
Kaynaklar ve İleri Okuma
Bu yazıdaki bilgiler aşağıdaki birincil ve kurumsal kaynaklara dayanmaktadır: