Microsoft, hafif yapılı AI modeli Phi-3 Mini’yi piyasaya sürdü. Bu model, şirketin bu yıl planladığı üç küçük Phi modelinin ilki ve 3,8 milyar parametre ile çalışıyor.
GPT-4 gibi büyük dil modellerine göre daha küçük bir veri seti üzerinde eğitildi ve artık Azure, Hugging Face ve Ollama’da kullanılabiliyor. İşte detaylar…
Microsoft, yapay zeka modeli Phi-3’ün özellikleri Phi-3 Mini, daha küçük boyutuyla GPT-3.5 gibi büyük dil modelleriyle aynı kapasiteye sahip, ancak daha az kaynak tüketiyor. Microsoft, 7 milyar parametreye sahip Phi-3 Small ve 14 milyar parametreye sahip Phi-3 Medium modellerini de piyasaya sürmeyi planlıyor.
Parametreler, bir modelin kaç karmaşık talimatı anlayabileceğini gösterir. Microsoft, Aralık ayında Phi-2’yi piyasaya sürdü ve bu modelin Llama 2 gibi daha büyük modellere benzer performans sergilediğini iddia etti.
Phi-3, Phi-2’den daha iyi sonuçlar veriyor ve büyük modellere yakın yanıtlar sağlayabiliyor. Microsoft Azure AI Platformu kurumsal başkan yardımcısı Eric Boyd, Phi-3 Mini’nin küçük form faktörüyle GPT-3.5 kadar yetenekli olduğunu söyledi. Küçük AI modelleri, genellikle daha düşük maliyetli ve kişisel cihazlarda daha iyi performans gösteriyor. Microsoft, Phi-3’ü küçük veri setleriyle çalışan şirketler için ideal bir çözüm olarak görüyor. Boyd, Phi-3’ün “çocukların kitaplardan ve basit cümle yapılarından öğrendiği” fikriyle eğitildiğini belirtti.
Bu model, Phi-1’in kodlamaya odaklandığı ve Phi-2’nin mantıksal düşünme yeteneklerini geliştirdiği temelden yola çıkıyor. Phi-3, geniş bir genel bilgiye sahip olmasa da, şirketlerin özel uygulamaları için iyi bir seçenek olabilir.