Acik kaynak ve kapali yapay zeka modelleri

Yapay zeka dünyasında en sık karıştırılan ayrımlardan biri, bir modelin "açık" mı yoksa "kapalı" mı olduğudur. Üstelik bu ikili göründüğü kadar basit değil: "açık" denilen modellerin çoğu, yazılım dünyasının klasik anlamıyla aslında açık kaynak bile değil. ChatGPT'nin arkasındaki GPT, Anthropic'in Claude'u ve Google'ın Gemini'si yalnızca bir API arkasından erişilen kapalı kutulardır. Buna karşılık Meta'nın Llama'sı, Mistral'in modelleri ve Alibaba'nın Qwen'i indirilip kendi makinenizde çalıştırabileceğiniz modellerdir. Ama bu modellere "açık kaynak" demek çoğu zaman teknik olarak yanlıştır. Bu yazıda farkları, lisansların gerçekte ne söylediğini ve maliyet, gizlilik ile kontrol açısından ne anlama geldiğini gerçek örneklerle inceliyoruz.

"Açık ağırlık" ile "açık kaynak" aynı şey değil

İşin püf noktası burada gizli. Bir dil modeli üç temel bileşenden oluşur: eğitim verisi, eğitim kodu ve eğitilmiş ağırlıklar (yani modelin öğrendiği milyarlarca parametre). Geleneksel yazılımda "açık kaynak" demek, kaynağı görüp yeniden derleyebilmek demektir. Yapay zekada ise işler farklı işliyor.

Açık ağırlıklı (open-weight) bir model, yalnızca eğitilmiş parametreleri kamuya açar. Bunları indirir, kendi sunucunuzda çalıştırır, ince ayar yapar ve üzerine uygulama kurabilirsiniz. Ancak modelin hangi veriyle, nasıl eğitildiğini gösteren eğitim verisi ve sürecin tamamı çoğu zaman paylaşılmaz. Yani kapıyı açmışlar ama mutfağı göstermemişlerdir.

Açık kaynak yapay zeka ise daha katı bir standarttır. Open Source Initiative (OSI), 2024'te yayımladığı Açık Kaynak Yapay Zeka Tanımı ile çıtayı net biçimde koydu: Bir modelin gerçekten açık kaynak sayılabilmesi için, yetkin birinin "büyük ölçüde eşdeğer" bir sistemi yeniden kurabilmesine yetecek kadar eğitim verisi bilgisinin de paylaşılması gerekir. Bu tam şeffaflık; bağımsız denetimi, önyargı analizini ve gerçek yeniden üretilebilirliği mümkün kılar.

Bu ayrım kozmetik değil. OSI açıkça belirtiyor ki Meta'nın Llama lisansı bu tanımı karşılamıyor; çünkü belirli kişi ve kullanım gruplarına kısıt getiriyor. Dolayısıyla Llama "kaynağı mevcut" (source-available) veya "açık ağırlıklı" bir modeldir, OSI anlamında açık kaynak değildir.

Model lisansi ve agirliklar

Gerçek açık (ağırlık) modeller: Llama, Mistral, Qwen

Piyasada gerçekten indirilip çalıştırılabilen üç büyük model ailesine bakalım.

Meta Llama

Llama, açık ağırlıklı modellerin en bilinen yüzü. İlk sürüm Llama 1 (Şubat 2023) yalnızca araştırmacılara, ticari olmayan bir lisansla açılmıştı. Llama 2 (Temmuz 2023) ticari kullanıma izin verdi. Llama 3 (Nisan 2024) 8B ve 70B parametreli sürümlerle geldi; Llama 3.1 ise dev 405B sürümünü ekledi. En güncel kuşak Llama 4 (Nisan 2025), çok modlu "mixture-of-experts" mimarisiyle Scout ve Maverick varyantlarını sundu.

Ancak Llama'nın lisansı klasik açık kaynaktan farklı. En çok dikkat çeken madde, aylık aktif kullanıcısı 700 milyonu aşan şirketlerin modeli serbestçe kullanamayıp Meta'dan ayrı lisans istemek zorunda olması. Bu madde, pratikte yalnızca dev teknoloji şirketlerini hedef alır. Hem OSI hem de Free Software Foundation, bu tür kısıtlar nedeniyle Llama lisansını "özgür değil" (nonfree) olarak sınıflandırıyor.

Mistral AI

Fransız Mistral AI, açık modellerinin büyük kısmını gerçekten permisif olan Apache 2.0 lisansıyla yayımlıyor. Bu lisans, modeli herhangi bir amaçla kullanmaya, değiştirmeye, yeniden dağıtmaya ve ticari ürünlerde kullanmaya hiçbir telif ücreti olmadan izin verir. Mistral'in yardım belgelerine göre bazı modeller ise değiştirilmiş bir MIT lisansı altında sunuluyor; bu lisans Apache 2.0 ile aynı izinleri veriyor ancak aylık geliri 20 milyon doları aşan kuruluşların ticari lisans alması ya da Mistral'in platformu üzerinden erişmesi şartını koşuyor.

Alibaba Qwen

Çin merkezli Alibaba'nın Qwen (Tongyi Qianwen) ailesi, açık ekosistemin bir diğer ağır topu. Qwen'in birçok modeli Apache 2.0 ile dağıtılırken bazıları kaynağı-mevcut Qwen lisansı veya ticari olmayan Qwen Research lisansı altında sunuluyor. Yani "Qwen açık mı?" sorusunun cevabı, tek tek hangi modelden bahsettiğinize bağlı. Hugging Face üzerinde Qwen tabanlı on binlerce türev model bulunması, açık ağırlıklı yaklaşımın topluluk açısından ne kadar verimli olduğunu gösteriyor.

AI ekosistemi ve kontrol

Kapalı modeller: GPT, Claude, Gemini

Diğer tarafta tamamen kapalı (proprietary) modeller var. OpenAI'nin GPT'si, Anthropic'in Claude'u ve Google'ın Gemini'si ağırlıklarını yayımlamaz. Bu modellere yalnızca bir API üzerinden ya da sağlayıcının kendi arayüzünden erişirsiniz. Modelin nasıl çalıştığı, hangi veriyle eğitildiği ve içeride ne döndüğü sizin için bir kara kutudur. Buna karşılık genellikle en üst düzey yetenekleri, bakımsız altyapıyı ve hazır ölçeklenebilirliği sunarlar.

Dört eksende kıyas: kontrol, gizlilik, maliyet, yetenek

Hangisinin sizin için doğru olduğu, neye öncelik verdiğinize bağlı.

  • Kontrol ve bağımsızlık: Açık ağırlıklı modeller burada açık ara önde. Modeli kendi sunucunuza kurar, sürüme kilitlenir, sağlayıcının fiyat değiştirmesinden veya modeli emekliye ayırmasından etkilenmezsiniz. Kapalı modellerde ise tedarikçiye tam bağımlısınız; API yarın değişebilir, fiyatlanabilir veya kapanabilir.
  • Gizlilik ve veri egemenliği: Hassas veri işleyen sağlık, hukuk ve kamu kurumları için açık modeller doğal bir avantaj sunar. Modeli kendi altyapınızda çalıştırdığınızda veri makineden hiç çıkmaz. Kapalı API'lerde ise istem ve verileriniz üçüncü taraf sunuculara gider; bu, sözleşme ve mevzuat açısından her zaman istenmez.
  • Maliyet: Açık modellerde lisans ücreti yoktur ama bedava değildir; GPU, barındırma ve mühendislik maliyeti size aittir. Düşük hacimde kapalı API'ler genelde daha ucuza gelir; yüksek ve sürekli hacimde ise kendi modelinizi çalıştırmak uzun vadede ekonomik olabilir.
  • Yetenek ve kolaylık: En güçlü sınır modeller çoğunlukla kapalı tarafta ve kutudan çıkar çıkmaz çalışır. Yine de açık modellerin arayı hızla kapattığını unutmamak gerek. Stanford'un 2025 Yapay Zeka Endeksi'ne göre, en iyi kapalı ve en iyi açık ağırlıklı modeller arasındaki performans farkı, 2024 başından 2025 başına kayda değer biçimde daraldı.

Sonuç

Açık ve kapalı modeller arasındaki seçim ideolojik bir tercih değil, mühendislik ve iş kararıdır. Veri gizliliği, uzun vadeli kontrol ve tedarikçi bağımsızlığı sizin için kritikse, Apache 2.0 lisanslı Mistral veya uygun Qwen sürümleri gibi gerçekten permisif açık ağırlıklı modeller güçlü bir temel sunar. Hızlı başlangıç, en üst düzey yetenek ve sıfır altyapı derdi önceliğinizse kapalı API'ler mantıklıdır. Yalnızca tek bir şeyi unutmayın: bir modele "açık" deniyor olması, onun OSI anlamında açık kaynak olduğu anlamına gelmez. Karar vermeden önce indirdiğiniz modelin lisansını gerçekten okumak, en az modeli seçmek kadar önemlidir.