Embedding
Embedding, metin, görsel veya ses gibi farklı türdeki verilerin bilgisayarın anlayabileceği sayısal kodlara, yani vektörlere dönüştürülmesidir. Bu sayede, benzer anlam taşıyan veriler sayısal olarak da birbirine yakın durur ve yapay zeka tarafından kolayca karşılaştırılabilir.
Peki bu nasıl oluyor? Düşünsene, bilgisayarlar sadece sayılardan anlar. Senin yazdığın bir cümleyi veya çektiğin bir fotoğrafı doğrudan "anlamlandıramazlar". Embedding tam da burada devreye giriyor. Bir yapay zeka modeli, kelimelerin veya görsellerin anlamlarını, ilişkilerini ve bağlamlarını öğrenerek onları çok boyutlu bir uzayda sayısal noktalara çevirir. "Kedi" ve "pisi" kelimeleri bu uzayda birbirine çok yakın konumlara gelirken, "araba" kelimesi daha uzak bir yerde durur. Bu sayede bilgisayar, iki kelimenin veya cümlenin ne kadar benzer olduğunu sadece sayısal uzaklıklarına bakarak anlayabilir.
Diyelim ki sen bir e-ticaret satıcısısın ve Trendyol'da ürün açıklamaları yazıyorsun. Embedding teknolojisi sayesinde, "kırmızı elbise" arayan bir müşteriye, senin "bordo abiye" açıklaman da önerilebilir çünkü AI, bu iki ifadenin anlam olarak birbirine çok yakın olduğunu embedding'ler aracılığıyla anlar. Ya da bir öğrenci olarak ödevin için araştırma yaparken, Google'da yazdığın bir anahtar kelimeye benzer anlamdaki makaleler, embedding'ler sayesinde karşına çıkar. ChatGPT gibi sohbet botları da senin sorduğun sorunun anlamını embedding'ler sayesinde kavrar ve ona en uygun cevabı bulur.
Embedding'i bazen "etiketleme" veya "kategorize etme" ile karıştırabilirsin. Oysa embedding çok daha fazlası. Etiketleme sadece "bu bir kedi" derken, embedding kedinin tüylerinin rengi, hareketleri, diğer hayvanlarla ilişkisi gibi birçok farklı özelliğini sayısal bir vektörde saklar. Yani sadece bir isim vermek yerine, o şeyin tüm özelliklerini ve diğer şeylerle olan ilişkilerini de sayılara döker. Bu, çok daha derin bir anlamlandırma sağlar.
Bu teknolojiyi doğrudan kullanmak için illa kod yazmana gerek yok. Kullandığın birçok uygulama, arama motoru veya AI aracı zaten arka planda embedding'leri kullanıyor. Sen sadece sorgunu yap veya içeriğini gir, gerisini o halleder.