Alibaba Qwen 3.5 Küçük Modelleri: OpenAI gpt-oss-120B’yi aşan yeni seri

Alibaba‘nın Qwen takımı, Qwen3.5 Küçük Model Dizisi’ni lanse etti. Model dizisinde Qwen3.5-0.8B, Qwen3.5-2B, Qwen3.5-4B ve Qwen3.5-9B bulunuyor. Minik ve süratli başarım için iyileştirilen Qwen3.5-0.8B ve Qwen3.5-0.2B modelleri, batarya süresinin hayati ehemmiyet taşıdığı aygıtlarda ilk örnek geliştirme ve yayılım maksadıyla istifade edilebilir.

Yalın temsilciler için kuvvetli bir çok modlu altyapı olan Qwen3.5-4B, 262 bin 144 token bağlam penceresini doğrudan destek sağlamakta. Yoğun bir akıl yürütme modeli olan Qwen3.5-9B, mühim harici kıyaslama kriterlerinde (benchmark) 13,5 kat daha büyük olan OpenAI’ın açık kaynaklı gpt-oss-120B modeline üstün geliyor. Bahsedilen ölçütlere çok dilli bilgi ve lisansüstü düzeyde akıl yürütme de dahil.

Qwen3.5 Küçük dizisinin teknolojik alt yapısı, Verimli Hibrit Mimariye temelleniyor. Olağan dönüştürücü (Transformer) mimarilerinden farklı olarak Alibaba, bu mimaride Gated Delta Networks (bir tür doğrusal dikkat) ile seyrek Mixture-of-Experts (MoE) harmanlıyor. Bu sayede firma, çoğunlukla ufak modelleri kısıtlayan “bellek duvarını” bertaraf etmiş oluyor. Gated Delta Networks istifade eden modeller, daha fazla randıman ve kayda değer biçimde daha az bekleme zamanı sağlıyor.

Ek olarak, tabii olarak çok modlu olan Qwen3.5 çok modlu tokenlerde erken füzyon kullanılarak öğretildi. Böylelikle 4B ve 9B modelleri, evvelce on kat daha büyük modellerin ihtiyaç duyduğu görsel kavrama seviyesini gösterebiliyor. Hususiyle de arabirim unsurlarını tanımak veya bir videodaki objeleri saymak benzeri fiiller rahatlıkla icra edilebiliyor.

MMMU-Pro görsel akıl yürütme kıstasında, Qwen3.5-9B 70,1 derece elde ederek 59,7 puan alan Gemini 2.5 Flash-Lite ve 63,0 puan alan Qwen3-VL-30B-A3B modellerini geçiyor. GPQA Diamond mukayesesinde, 9B modeli 81,7 puan alarak, 80,1 puan alan ve parametre sayısı on katından fazla olan gpt-oss-120b modeline üstünlük sağlıyor.

Video-MME (altyazılı) kriterinde, Qwen3.5-9B 84,5 derece elde ederken, 4B 83,5 dereceye ulaştı. Bu suretle modeller, 74,6 puan alan Gemini 2.5 Flash-Lite’tan mühim derecede üstün başarım gösterdi. HMMT Şubat 2025 (Harvard-MIT matematik turnuvası) tetkikinde, 9B modeli 83,2 puan alırken, 4B çeşidi 74,0 puan aldı. 9B çeşidi, OmniDocBench v1.5’te 87,7 puanla doküman tanıma sahasında önder mevkiye oturdu. Eş vakitte, MMMLU’da 81,2 puanla en yüksek seviye çok dilli mevcudiyetini devam ettirerek aynı kıyaslamada 78,2 puan alan gpt-oss-120b’yi geçti.

Modellerin ağırlıkları halihazırda Apache 2.0 lisansları altında Hugging Face ve ModelScope‘da evrensel çapta istifadeye açılıyor. Modeller, ihtiyaç duyulduğunda kişiselleştirme de dahil olmak üzere şirketsel ve işletmesel kullanım maksadıyla yeğlenebilir.

Alibaba Qwen 3.5 Küçük Modelleri: OpenAI gpt-oss-120B’yi aşan yeni seri

+ -