Gezinme istatistikleri
Yandex dizinleme robotu düzenli olarak site sayfalarını tarar ve bunları arama veritabanına yükler. Sayfa erişilemezse robot sayfayı indiremeyebilir.
Yandex Webmaster, sitenizin hangi sayfalarının endeksleme botu tarafından tarandığını bildirir. Ayrıca, botun erişemediği sayfaların URL’lerini görüntüleyebilirsiniz çünkü barındırma sunucusu kullanılamıyordu veya sayfa içeriğinde hatalar vardı.
Sayfalar hakkındaki bilgiler, Yandex Webmaster’daki endeksleme → Tarama istatistikleri sayfasında mevcuttur. Bilgiler, robot sayfayı ziyaret ettikten altı saat sonra günlük olarak güncellenir.
Hizmet, varsayılan olarak site genelindeki verileri sunar. Belirli bir bölüm hakkındaki bilgileri görüntülemek için, site URL alanındaki listeden seçim yapın. Mevcut bölümler, Yandex tarafından bilinen site yapısını yansıtır (manuel eklenen bölümler hariç).
Liste, arama sonuçlarına dahil edilmesi gereken sayfaları içermiyorsa, Yandex’e bunları bildirmek için Sayfaları yeniden dizinle aracını kullanın.
Sayfalar hakkındaki bilgileri filtreleri kullanarak XLS veya CSV biçiminde indirebilirsiniz.
Not
Veriler 20 Şubat 2017’den itibaren mevcuttur.
Sayfa durumu dinamikleri
Sayfa bilgileri şu şekilde sunulur:
- Yeni ve değişen – Robotun ilk kez taradığı sayfaların ve tarandıktan sonra durumu değişen sayfaların sayısı.
- Tarama istatistikleri – Robot tarafından taranan sayfaların sayısı ve sunucu yanıt kodu.
Arama veritabanındaki sayfa değişiklikleri
Robot sayfaya tekrar eriştiğinde HTTP yanıt kodu değişirse değişiklikler gösterilir. Örneğin, 200 OK olur 404 Bulunamadı. Sadece sayfa içeriği değiştiyse, bu Yandex Webmaster’da gösterilmeyecektir.
Değişiklikleri görmek için, seçeneği En son değişiklikler olarak ayarlayın. 50.000’e kadar değişiklik görüntülenebilir.
Yandex Webmaster, sayfalar hakkında aşağıdaki bilgileri gösterir:
- Sayfanın robot tarafından en son ziyaret edildiği tarih (tarama tarihi).
- Sitenin kök dizininden gelen sayfa yolu.
- Tarama sırasında alınan sunucu yanıt kodu.
Bu bilgilere dayanarak, robotun site sayfalarını ne sıklıkla taradığını öğrenebilirsiniz. Ayrıca veritabanına yeni eklenen sayfaları ve yeniden taranan sayfaları görebilirsiniz.
Arama tabanına eklenen sayfalar
-
Bir sayfa ilk kez taranıyorsa, Önceki sütunu N/a durumunu gösterir ve Şu Anda sütunu sunucu yanıtını gösterir (örneğin, 200 OK).
Sayfa arama veritabanına başarıyla yüklendikten sonra, arama veritabanı güncellendiğinde arama sonuçlarında görüntülenebilir. Bu bilgi Arama sayfaları sayfasında gösterilir.
Robot tarafından yeniden endekslenen sayfalar
-
Robot sayfayı daha önce taradıysa, sayfa durumu yeniden tarandığında değişebilir: Önceki sütunu önceki ziyarette alınan sunucu yanıtını gösterir, Şu Anda sütunu son taramada alınan sunucu yanıtını gösterir.
Aramaya dahil edilen bir sayfanın robot için erişilemez hale geldiğini varsayalım. Bu durumda, aramadan çıkarılır. Bir süre sonra, hariç tutulan sayfalar listesinde Arama sayfaları sayfasında bulabilirsiniz.
Aramadan çıkarılan bir sayfa, robotun erişilebilirliğini kontrol edebilmesi için arama veritabanında kalabilir. Genellikle robot, sayfaya bağlantılar olduğu sürece ve robots.txt dosyasında yasaklanmadığı sürece sayfayı istemeye devam eder.
Robot tarafından taranan sayfaların listesi
Sayfaların listesini görüntülemek için, seçeneği Tüm sayfalar olarak ayarlayın. Liste 50.000 sayfaya kadar içerebilir.
Robot tarafından taranan site sayfalarının listesini ve bunlar hakkındaki aşağıdaki bilgileri görüntüleyebilirsiniz:
- Sayfanın robot tarafından en son ziyaret edildiği tarih (tarama tarihi).
- Sitenin kök dizininden gelen sayfa yolu.
- Sayfa en son robot tarafından indirildiğinde alınan sunucu yanıt kodu.
Öneri
Liste, siteden zaten kaldırılmış veya var olmayan sayfaları gösteriyorsa, robot muhtemelen diğer kaynakları ziyaret ederken onlara bağlantılar bulur. Robotun gereksiz sayfalara erişimini durdurmak için Disallow direktifini robots.txt
dosyasında yasaklayın.
Veri filtreleme
Sayfalar ve arama veritabanındaki değişiklikler hakkında bilgileri tüm parametrelere göre (tarama tarihi, sayfa URL’si, sunucu yanıt kodu)
Sunucu yanıtına göre
Robotun taradığı ancak 404 Not Found sunucu yanıtı nedeniyle indirilemeyen sayfaların bir listesini oluşturabilirsiniz.
Robot için erişilemeyen yalnızca yeni sayfaları filtreleyebilirsiniz. Bunu yapmak için, radyo düğmesini Son değişiklikler olarak ayarlayın.
Ayrıca, robot için erişilemeyen sayfaların tam listesini alabilirsiniz. Bunu yapmak için, radyo düğmesini Tüm sayfalar olarak ayarlayın.
URL parçasına göre
Belirli bir parçayı içeren URL’lere sahip sayfaların bir listesini oluşturabilirsiniz. Bunu yapmak için, listeden İçerir seçimini yapın ve parçayı alana girin.
Özel karakterler kullanarak URL’ye göre
Dizenin başlangıcını veya bir alt dizeyi eşleştirmek için özel karakterler kullanabilir ve düzenli ifadeler kullanarak daha karmaşık koşullar belirleyebilirsiniz. Bunu yapmak için listeden URL eşleşmeleri seçimini yapın ve koşulu alana girin. Her birini yeni bir satıra koyarak birden fazla koşul ekleyebilirsiniz.
Koşullar için, aşağıdaki kurallar mevcuttur:
- Koşullardan herhangi biriyle eşleşiyor ("VEYA" işlecine karşılık gelir).
- Tüm koşullarla eşleşiyor ("VE" işlecine karşılık gelir).
Filtreleme için kullanılan karakterler
Karakter |
Açıklama |
Örnek |
* |
Herhangi bir sayıda herhangi bir karakterle eşleşir |
Belirtilen sayfa dahil olmak üzere * karakterini kullanma
Örneğin, belirli bir yıl için haber veya duyuruları bulabilirsiniz: |
@ |
Filtrelenmiş sonuçlar belirtilen dizeyi içerir (ancak mutlaka tam olarak eşleşmez) |
Belirtilen dizeyi içeren URL’lere sahip tüm sayfalar için bilgileri görüntüleyin: |
~ |
Koşul bir düzenli ifadedir |
Bir düzenli ifadeyle eşleşen URL’lere sahip sayfaların verilerini görüntüler. Örneğin, adresinde ~masa|koltuk|yatak parçasını bir veya birkaç kez içeren tüm sayfaları filtreleyebilirsiniz. |
! |
Olumsuz koşul |
Aşağıdaki dize ile başlayan URL’lere sahip sayfalar için verileri hariç tutun: |
Karakter kullanımı büyük/küçük harf duyarlı değildir.
@, !, ~ karakterleri yalnızca dizenin başında kullanılabilir. Aşağıdaki kombinasyonlar kullanılabilir:
Operatör |
Örnek |
!@ |
URL’lerinde tarife içeren sayfalar için verileri hariç tutun: |
!~ |
Düzenli ifadeyle eşleşen URL’lere sahip sayfaları hariç tut |
Sorular ve cevaplar
Bir site oluşturdum, ancak hala endekslenmedi
Belki de siteyi oluşturduğunuzdan bu yana çok az zaman geçti. Robotu web sitesi hakkında bilgilendirmek için, web sitesini ekleyin Yandex Webmaster’a ve haklarınızı doğrulayın. Ayrıca sunucu hatası olup olmadığını kontrol edin. Bir sunucu hatası durumunda, Yandex robotu endekslemeyi durdurur ve siteyi bir sonraki taradığında başka bir deneme yapar.
Yandex çalışanları, sayfaların arama tabanına eklenme hızını artırmaz.
Bir sitenin aramaya girmesi için ne kadar beklemeliyim?
Site endeksleme zaman çerçevesini tahmin etmiyoruz ve bir sitenin endeksleneceğini garanti edemeyiz. Genellikle, robotun siteyi bulmasından itibaren sayfaların arama sonuçlarında gösterilmesine kadar birkaç gün ile iki hafta sürer.
“Tarama geçmişi” grafiğindeki istek sayısı azaldı veya arttı
Yandex robotu tarafından taranan sayfa sayısı farklı günlerde daha yüksek veya daha düşük olabilir. Bu değişiklikler site dizinlemesini veya arama sonuçlarındaki sıralamayı etkilemez.
Eğer fark ederseniz ki:
- Sayfalar arama sonuçlarına daha yavaş giriyor, Sayfaların arama sonuçlarında görünmesi neden bu kadar uzun sürüyor? bölümüne bakın.
- Robot siteye ek yük oluşturuyor ve bunu azaltmak istiyor. Önerileri takip edin.
Sunucumdan gizli bilgi indirmeye çalışıyorsunuz. Ne yapmalıyız?
Robot, bağlantıları diğer sayfalardan alır. Bu, başka bir sayfanın sitenizin gizli bölümlerine bağlantılar içerdiği anlamına gelir. Onları ya bir şifre ile koruyabilir ya da Yandex endeksleme botunu robots.txt
dosyasında endekslemeyi engelleyebilirsiniz. Her iki durumda da, robot gizli bilgileri indirmez.