OpenAI, şimdiye kadarki en kapsamlı yapay zeka modelini tanıttı: GPT-4o. Bu model, kullanıcılarla hem metin hem de ses yoluyla iletişim kurabilen, nesneleri ve görüntüleri de gerçek zamanlı olarak tanıyabilen çok modlu bir model.
Şirket Pazartesi günü yaptığı açıklamada, önümüzdeki birkaç hafta içinde API’nin yanı sıra ChatGPT’de de kullanıma sunulacak olan GPT-4o’nun nesneleri ve görüntüleri de gerçek zamanlı olarak tanıyabildiğini söyledi. Model, diğer çeşitli OpenAI modellerinde zaten ayrı olarak mevcut olan bir dizi yapay zeka yeteneğini sentezliyor. Ancak tüm bu yöntemleri birleştirerek OpenAI’nin en son modelinin her türlü metin, ses ve görsel girdi kombinasyonunu daha verimli bir şekilde işlemesi bekleniyor.
GPT-4o, Birçok Yeteneğini Tek Modele Sentezliyor
- Metin oluşturma
- Sesli sohbet
- Görüntü tanıma
- Nesne tanıma
- Çeviri
- Soru cevaplama
- Ve daha fazlası
Ücretsiz Olarak Yayınlanacak!
OpenAI’nin baş teknoloji sorumlusu Mira Murati, canlı yayın gösterimi sırasında gelişmiş yapay zeka araçlarını kullanıcılara ücretsiz olarak sunmanın şirketin misyonunun “çok önemli” bir bileşeni olduğunu söyledi. Murati “Kullanım kolaylığı söz konusu olduğunda ilk kez gerçekten ileriye doğru büyük bir adım atıyoruz. Ve bu inanılmaz derecede önemli çünkü kendimiz ve makineler arasındaki etkileşimin geleceğine bakıyoruz” dedi. “Ve GPT-4o’nun bu paradigmayı, bu etkileşimin çok daha doğal ve çok çok daha kolay hale geldiği işbirliğinin geleceğine gerçekten kaydırdığını düşünüyoruz.” şeklinde konuştu.
Bu veriyonla GTP-4o; G örüntü, metin ve sesi kullanarak gerçek zamanlı olarak akıl yürütebilen bir yapay zeka asistanı, teknolojinin, kullanıcılara bir matematik probleminde rehberlik etmek, bir konuşma sırasında dilleri tercüme etmek ve insan yüz ifadelerini okumak gibi çeşitli yaratıcı görevleri gerçekleştirmesine olanak tanıyacak.