ilk yerli llm projesi. göründüğü kadarıyla epey hızlı.
ancak herhangi bir reasoning işlemi yok, internete bağlanamıyor. dümdüz llm yapıyor.
şimdilik pek kullanılacak gibi değil.
kendileri şöyle yazmışlar sitelerinde:
kumru, vngrs tarafından türkçe için sıfırdan geliştirilmiş ve eğitilmiş ilk temel dil modelidir. 7.4 milyar parametreye sahiptir. zengin ve güncel kaynaklardan beslenen 500 gb'lık temizlenmiş, tekilleştirilmiş bir veriseti ile 300 milyar token eğitilen model 8,192 token'lık bir context length'e sahiptir. tokenizer'ı da türkçe için sıfırdan eğitildiği için verilen metni tokenize ederken llama-3, gpt-4o gibi multilingual tokenizer'lara göre %40 ile %90 arasında daha az token harcar. bu yüzden de efektif olarak 12k'ya yakın bir context length'e sahiptir. cetvel türkçe llm benchmark'ında llama-3.3-70b, qwen-2-72b, gemma-3-27b, aya-32b gibi kendisinden çok daha büyük açık kaynak modellerden daha yüksek skorlar almıştır. model, verimliliği sayesinde 16 gb vram'e sahip gpu'larda quantization gibi tekniklere gerek duyulmaksızın kurum içi yerinde kullanıma uygundur.
adres:
https://kumru.ai/