OpenAI yeni modelleri NVIDIA RTX GPU’larda en hızlı şekilde çalışmaya hazır!

06.08.2025
Okuma Süresi: 4 dakika
A+
A-

NVIDIA, yeni gpt-oss açık model ailesini tüketicilere sunmak için OpenAI ile iş birliğini duyurdu. Bu iş birliği, daha önce yalnızca bulut veri merkezlerinde kullanılabilen en ileri düzey yapay zeka teknolojilerinin, artık RTX destekli PC’ler ve iş istasyonlarında inanılmaz bir hızla çalışmasını mümkün kılıyor.

Bu iş birliği sayesinde, GeForce RTX GPU’lar ve PRO GPU’ların sunduğu yüksek işlem gücü ile desteklenen, daha hızlı ve akıllı bir yerel (on-device) yapay zeka çağı başlıyor. Ekosistemin tamamına hizmet etmek üzere iki yeni model varyantı tanıtıldı:

  • Gpt-oss-20b modeli: En az 16 GB VRAM’e sahip NVIDIA RTX AI PC’lerde yüksek performans için optimize edildi. Bir RTX 5090 GPU üzerinde saniyede 250 token üretim kapasitesine sahip.
  • Gpt-oss-120b modeli: NVIDIA RTX PRO GPU’lar ile hızlandırılmış profesyonel iş istasyonlarında kullanılmak üzere tasarlandı.

Bu modeller, NVIDIA H100 GPU’ları üzerinde eğitildi ve MXFP4 hassasiyetini destekleyen ilk modeller oldu. MXFP4, eski yöntemlere göre performans kaybı olmadan modelin kalitesini ve doğruluğunu artıran bir tekniktir. Her iki model de 131.072 bağlam uzunluğu gibi yerel çıkarımda en uzun bağlamlardan birini desteklemektedir. Ayrıca modeller, mixture-of-experts (MoE) mimarisi ile inşa edildi; düşünce zinciri (chain-of-thought), talimat takibi (instruction-following) ve araç kullanımı gibi gelişmiş yetenekler sunuyor.

RTX AI Garage, geliştiricilerin ve yapay zeka meraklılarının bu modellerle NVIDIA RTX GPU’lar üzerinde nasıl çalışabileceklerini açıklıyor:

  • Ollama Uygulaması: RTX GPU’lar için tam optimize edilmiş gpt-oss modellerini, ek kurulum gerekmeden anında çalıştırabiliyor.
  • Llama.cpp: NVIDIA, açık kaynak topluluğu ile çalışarak RTX GPU’larda performansı artırmayı hedefliyor. Örneğin, CUDA Graphs, yükü azaltmaya yardımcı oluyor. Geliştiriciler, Llama.cpp’in GitHub deposu üzerinden çalışmaya başlayabilir.
  • Microsoft AI Foundry: Windows geliştiricileri, modelleri “Microsoft AI Foundry Local” üzerinden (şu anda halka açık önizlemede) kullanabiliyor. Başlamak için şu komut yeterli:
    Foundry model run gpt-oss-20b

NVIDIA CEO’su Jensen Huang, lansmanın önemini şöyle vurguladı:

“OpenAI, NVIDIA AI üzerinde neler inşa edilebileceğini dünyaya gösterdi ve şimdi açık kaynak yazılımlar alanında inovasyonu ileri taşıyor. Gpt-oss modelleri, geliştiricilere bu son teknoloji açık kaynak temeli üzerinde inşa etme fırsatı sunarak ABD’nin yapay zeka alanındaki liderliğini güçlendiriyor, hem de dünyanın en büyük yapay zeka işlem altyapısı üzerinde.”

OpenAI’nin yeni modelleriyle RTX üzerinde nasıl çalışılacağını öğrenmek isteyenler, RTX AI Garage blog gönderisine, iş birliğiyle ilgili daha fazla detay için ise NVIDIA’nın şirket bloguna göz atabilir.

Peki siz konu hakkında ne düşünüyorsunuz? Yorumlarda paylaşmayı unutmayın..

Teknoku kurucu ve haber editörü olan Barış Eraslan, teknolojiyle ilgili bildiklerini ve güncel haberleri okurlarıyla paylaşıyor. İçerikleri kaçırmamak için takipte kalın!
Bir Yorum Yazın

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.