Yerli yapay zeka Kumru AI nedir, nasıl kullanılır?
Kumru AI nedir, nasıl çalışır, kimler için geliştirilmiştir ve neden ChatGPT alternatifi değildir? Kumru'nun mimarisi, avantajları ve kullanım alanları.

Kumru AI, Türkiye merkezli teknoloji şirketi VNGRS tarafından geliştirilen yerli ve Türkçe odaklı bir yapay zeka dil modelidir. ChatGPT gibi genel amaçlı bir sohbet botu değildir; kurum içi kullanıma yönelik tasarlanmış, veri güvenliği öncelikli senaryolar için geliştirilmiştir. Kumru, 7.4 milyar parametreye sahip olup Türkçe metinler için sıfırdan eğitilmiş ilk temel dil modeli olma özelliği taşır.
Ne amaçla geliştirildi?
Türkiye'de özellikle finans, hukuk ve kamu sektörlerinde kurumlar; bulut tabanlı modelleri veri güvenliği ve regülasyonlar nedeniyle tercih edememektedir. Kumru AI, bu kurumların yerel sunucular üzerinde kullanabileceği, Türkçeyi derinlemesine anlayan ve işleyebilen bir model olarak bu boşluğu doldurmak için geliştirilmiştir.
Nasıl çalışır?
Kumru, modern Mistral mimarisini temel alır. Ancak bu, modelin başka bir sürümden türetildiği anlamına gelmez. Sıfırdan geliştirilmiş olan modelin tokenizer dahil tüm yapısı Türkçeye özel olarak optimize edilmiştir. Eğitiminde 500 GB temizlenmiş veriseti ve 300 milyar token kullanılmış, 8.192 token bağlam uzunluğuna sahiptir. Türkçe tokenizer'ı sayesinde efektif olarak 12.000 token'a kadar bağlamı işleyebilir.
Nasıl kullanılır?
Kumru son kullanıcıya açık bir ürün değildir. Kurum içi kullanım için geliştirilmiş modelin test arayüzü mevcuttur ancak bu nihai ürün değildir. Kullanmak isteyen kurumlar, VNGRS ile iletişime geçerek kendi altyapılarında çalıştırabilir. 16 GB VRAM'e sahip GPU'larda quantization gibi optimizasyonlara gerek kalmadan çalışabilir.
Kullanım süreci nasıl ilerler?
- İhtiyaç analizi: Kurum, VNGRS ile iletişime geçerek kullanım amacı ve senaryolarını paylaşır.
- Altyapı kontrolü: Kurumun donanım ve güvenlik altyapısı analiz edilir.
- Kurulum: Kumru’nun sunuculara kurulumu gerçekleştirilir.
- Entegrasyon: Kurum içi uygulamalarla entegre edilir.
- Test ve özelleştirme: Kullanım senaryosuna göre özelleştirme yapılır.
- Kullanıma geçiş: Sistem aktif olarak kullanılmaya başlanır.
Kullanım alanları ve kurumsal katkısı
Kumru, sadece bir yapay zeka modeli değil; kurumlara özel dijital bir çözüm sunar.
Hangi alanlarda kullanılabilir?
- Finans, hukuk, kamu, medya: Bilgi yönetimi, içerik denetimi, raporlama ve özetleme.
- Akademik araştırmalar: Türkçenin yapısal özelliklerini analiz etmek isteyen araştırmacılar için güçlü bir dil işleme aracıdır.
- İçerik üretimi: Haber, makale, rapor, özet gibi içeriklerin hazırlanması ve düzenlenmesinde kullanılır.
- KOBİ'ler: Uygun donanım gereksinimleri sayesinde küçük ve orta ölçekli işletmelerin de erişebileceği bir çözümdür.
Güvenlik ve regülasyon avantajı nedir?
- Veri gizliliği ve sektörel regülasyonlara tam uyum sağlar.
- Bulut sistemlerine veri çıkışı olmadan güvenli kullanım imkânı sunar.
Neden ChatGPT alternatifi değildir?
Kumru'nun temel hedef kitlesi bireysel kullanıcılar değil, kurum içi çözümler arayan profesyonel yapılardır. Bu yönüyle ChatGPT ile rekabet etmeyi değil, Türkçeye özel ihtiyaçları karşılamayı amaçlar.
- Genel sohbet amaçlı değil, görev odaklıdır.
- Türkçe dilindeki yapılar için optimize edilmiştir.
- Geniş kullanıcı kitlesi yerine belirli kurumlara hizmet verir.
- Sohbet robotlarıyla kıyaslanamaz çünkü kullanım amacı farklıdır.
Neler yapılabilir?
Kumru ile aşağıdaki işlemler gerçekleştirilebilir:
- Doküman özetleme ve sınıflandırma
- Otomatik başlık ve etiket üretimi
- Soru-cevap sistemleri oluşturma
- Metinleri yeniden yazma ve sadeleştirme
- İçerik moderasyonu
Avantajları nelerdir?
- Yerli üretim: Tamamen Türk mühendislerce geliştirilmiştir.
- Türkçeye özel altyapı: Tokenizer dahil tüm sistem dilin doğasına uygun optimize edilmiştir.
- Verimli: Orta seviye donanımda yüksek performans sağlar.
- Güvenli: Yerel sunucuya kurularak veri dışa aktarımı olmadan çalışır.
- Açık kaynak vizyonu: Gelişmiş versiyonları açık kaynaklı olarak paylaşılacaktır.
Hangi aşamadadır?
v0.2.1 sürümündeki Kumru henüz "pekiştirmeli öğrenme" sürecinden geçmemiştir. Bu nedenle hatalı yanıt verme ihtimali vardır. Ancak ilerleyen sürümlerde bu aşama tamamlanacak ve daha yüksek doğruluk sağlanacaktır.
Açık kaynak olacak mı?
Geliştirme süreci ilerledikçe, daha büyük ve multimodal versiyonların üretilmesi planlanmakta, ardından mevcut modelin açık kaynak olarak paylaşılması hedeflenmektedir.
Yükleniyor...















