TF-IDF Oranı Nedir? Nasıl Hesaplanır?
SEO, doğal dil işleme ve bilgi erişim alanlarında sıkça kullanılan kavramlardan biri TF-IDF’dir. Açılımı Term Frequency – Inverse Document Frequency olan bu yöntem, bir kelimenin bir dokümandaki önemini ölçmek için geliştirilmiştir. Özellikle arama motorlarının sayfaları anlamlandırmasında, içeriklerin optimize edilmesinde ve anahtar kelime analizlerinde TF-IDF büyük rol oynar.
TF (Term Frequency) Nedir?
TF (Terim Frekansı), belirli bir kelimenin bir dokümanda ne sıklıkla geçtiğini ifade eder.
- Örneğin, “SEO eğitimi” kelimesi 100 kelimelik bir makalede 5 kez geçiyorsa, TF değeri 5/100 = 0.05 olur.
- Bu değer, kelimenin doküman içindeki önemini gösterir; fakat tek başına yeterli değildir. Çünkü çok kullanılan kelimeler (örneğin “ve”, “ile”, “bu”) TF oranı yüksek olsa bile içerik açısından belirleyici değildir.
IDF (Inverse Document Frequency) Nedir?
IDF (Ters Doküman Frekansı), kelimenin tüm dokümanlar içinde ne kadar ayırt edici olduğunu ölçer. Eğer bir kelime birçok dokümanda geçiyorsa, IDF değeri düşük olur. Ancak nadir kullanılan ve belirli bir konuyu işaret eden kelimeler için IDF değeri yüksektir.
Formül genellikle şu şekildedir:

- N: Toplam doküman sayısı
- n_t: İlgili kelimenin geçtiği doküman sayısı
Bu formül sayesinde yaygın kelimeler filtrelenir, konuya özgü kelimeler öne çıkar.
TF-IDF Oranı Nasıl Hesaplanır?
TF-IDF oranı, bir kelimenin bir dokümandaki önemini belirlemek için TF ve IDF’in çarpımıyla hesaplanır:

- TF(t,d): Belirli bir kelimenin (t) dokümandaki (d) frekansı
- IDF(t): Kelimenin tüm dokümanlar arasında ne kadar ayırt edici olduğu
Örneğin:
- “SEO” kelimesi 100 kelimelik bir makalede 5 kez geçti (TF = 0.05).
- Toplam 1000 dokümanlık bir koleksiyonda 50 dokümanda bulundu (IDF = log(1000/50) ≈ 1.3).
- TF-IDF = 0.05 × 1.3 = 0.065
Bu değer, “SEO” kelimesinin ilgili dokümanda ne kadar önemli olduğunu gösterir.
SEO’da TF-IDF’in Kullanımı
SEO dünyasında TF-IDF, içeriklerin arama motoru dostu hale getirilmesinde yaygın olarak kullanılır. Özellikle anahtar kelime yoğunluğu kavramının yerini, daha gelişmiş bir ölçüm olan TF-IDF almıştır.
- Anahtar kelime analizi: Hedeflediğiniz kelimenin rakip sitelerdeki önemini ölçebilirsiniz.
- İçerik optimizasyonu: TF-IDF analizi, içerikte hangi yardımcı kelimelere de yer verilmesi gerektiğini gösterir.
- Rakip karşılaştırması: Rakip sitelerde hangi kelimelerin öne çıktığını analiz ederek kendi içerik stratejinizi geliştirebilirsiniz.
TF-IDF’in Avantajları
- Kelimeleri yalnızca tekrar sayısına göre değil, bağlamsal önemine göre değerlendirir.
- Rakip analizlerinde kullanılabilir, içerik eksikliklerini gösterir.
- İçeriklerde anahtar kelime doldurma (keyword stuffing) riskini azaltır.
2025’te TF-IDF’in Önemi
Google’ın yapay zekâ tabanlı algoritmaları (RankBrain, BERT, MUM) içerikleri bağlamına göre anlamaya çalışıyor. Ancak TF-IDF hâlâ içerik analizinde önemli bir temel yöntemdir. Özellikle SEO araçlarında (Semrush, Ahrefs, Surfer SEO vb.) içerik optimizasyonu yaparken TF-IDF oranları kullanılmaya devam edilmektedir.