DeepSeek, DALL-E 3’ü Geçtiğini İddia Etti!

Çin merkezli yapay zeka şirketi DeepSeek, bugün DALL-E 3’ü geçmeyi başaran yeni görsel modellerini duyurdu. Bu yeni modeller, özellikle üretkenlikleri ile dikkat çekiyor.
DeepSeek, Janus Pro adını verdiği görüntü modellerinin serisini GitHub ve Hugging Face platformlarında yayımladı. Şu anda bir ve yedi milyar parametre sunan iki farklı versiyonu mevcut. Şirketin açıklamasına göre, büyük versiyon bazı testlerde Stable Diffusion ve DALL-E 3’ü geride bırakıyor. Modeller, hem görsel analizi hem de yazılı içeriklerden görsel üretme yeteneği ile öne çıkıyor. Ancak, henüz tam olarak hangi çözünürlükte çıktılar vermekte olduğu bilinmiyor; bazı örnekler 768 x 768 piksel seviyesinde görüntülenebiliyor. Yedi milyar parametre sunan Janus Pro modeli, gerçekçi fotoğraflar üretebiliyor; ancak sistemin henüz mükemmel olmadığı birkaç örnek ile gösterilmekte.
DeepSeek, GPU teknoloji alanında Amerikan ambargosu altında olmalarına rağmen burada test edilebilen “R1” modelinin OpenAI’ın “01” modelinden daha iyi sonuç sunduğunu öne sürmektedir. R1, AIME, MATH-500 ve SWE-bench Verified kıyaslamalarında açıkça 01’i geride bırakıyor ve birçok testte benzer performans sergiliyor. R1 modeli, toplamda 671 milyar parametreye sahipken, 1,5 milyar ile 70 milyar parametre arasında değişen özelleştirilmiş versiyonları da bulunuyor.
DeepSeek, en küçük modelin standart bir dizüstü bilgisayarda çalıştırılabileceğini vurgularken, R1’in tam kapasiteli versiyonunun hem eğitim hem de kullanım açısından OpenAI’den çok daha maliyet etkin olduğunu belirtmektedir. “AI Asistan” adlı mobil uygulaması, Türkiye ve pek çok ülkede App Store’un en çok indirilen ücretsiz uygulaması konumunda. Şirketin, ABD ambargosuna rağmen 50 bin adet Nvidia H100 GPU’ya sahip olduğu iddia ediliyor. Ek olarak, H200’ler de mevcut ve DeepSeek bu GPU’ları aracılar üzerinden toplamış durumda, bu sayede beklenenden yüksek performans sergilemeyi başarabilmekte.