Apple, MGIE İsimli Yeni Yapay Zeka Modelini Duyurdu
Apple, imajları işlerken metin tabanlı komutları yorumlamak için çok modlu büyük lisan modellerini (MLLM’ler) kullanan MLLM Kılavuzlu İmaj Düzenleme ya da kısaca MGIE ismi verilen yeni bir yapay zeka modeli tanıttı. Diğer bir deyişle, araç, kullanıcının yazdığı metne nazaran fotoğrafları düzenleme yeteneğine sahip. Bunu yapabilen birinci araç olmasa da projenin “insan talimatları bazen mevcut prosedürlerin yakalanıp takip edilmesi için çok kısadır” deniyor.
Şirket, MGIE’yi Santa Barbara’daki Kaliforniya Üniversitesi’nden araştırmacılarla geliştirdi. MLLM’ler, kolay yahut meçhul metin istemlerini, fotoğraf düzenleyicinin izleyebileceği daha detaylı ve net talimatlara dönüştürme gücüne sahip. Örneğin, bir kullanıcı biberli pizzanın fotoğrafını “daha sağlıklı hale getirmek” için düzenlemek isterse, MLLM’ler bunu “sebze materyalleri ekleyin” olarak yorumlayabiliyor ve fotoğrafı bu biçimde düzenleyebiliyor.
MGIE, imgelerde büyük değişiklikler yapmanın yanı sıra metin istemleri yoluyla fotoğrafları kırpabiliyor, tekrar boyutlandırabiliyor ve döndürebiliyor. Hatta parlaklığını, kontrastını ve renk istikrarını iyileştirebilmesi de mümkün. Ayrıyeten MGIE, bir fotoğrafın muhakkak alanlarını düzenleyebiliyor ve örneğin fotoğraftaki bir kişinin saçını, gözlerini ve kıyafetlerini değiştirebiliyor yahut art plandaki öğeleri kaldırabiliyor.
Apple, modeli GitHub aracılığıyla yayınladı fakat ilgilenenler şu anda Hugging Face Spaces‘ta barındırılan bir demoyu da denebiliyor. Apple, bu projeden öğrendiklerini rastgele bir eserine dahil edebileceği bir araç yahut özellik olarak kullanmayı planlayıp planlamadığını ise detaylandırmadı.