Hangi dosyalar arama sonuçlarına dahil edilebilir?
Çok fazla CGI parametresi veya iç içe dizin içerenler gibi çok uzun URL’ler, belge dizine almayı engelleyebilir.
Yandex, HTML belgelerinin yanı sıra 10 MB boyutuna kadar olan ve aşağıdaki biçimlerdeki dosyaları dizine alır:
-
PDF.
-
Microsoft Office: DOC, DOCX, XLS, XLSX, PPT, PPTX.
-
OpenOffice: ODT, ODS, ODP, ODG.
-
Metin dosyası biçimleri: RTF, TXT.
-
Flash: SWF.
<frameset\> ve <frame\> etiketlerinin kullanımına izin verilir. Yandex botu, içlerinde yüklenen içeriği dizine alır ve çerçevelerin içeriğine dayanarak orijinal belgeyi bulur.
Biçime özgü dizine alma özellikleri:
-
SWF
Bot, bir SWF dosyasını, eğer ona doğrudan bir bağlantı varsa veya HTML koduna
objectveyaembedöğesi kullanılarak gömülüyse dizine alır.Bir SWF dosyası yararlı içerik içeriyorsa, bu dosyayı barındıran sayfa o içerikle bulunabilir.
Yandex botları, Flash belgelerinin aşağıdaki bölümlerindeki içeriği dizine alır:
-
Metin:
DefineText,DefineText2,DefineEditText,Metadata. -
Bağlantılar:
DoAction,DefineButton,DefineButton2.
-
-
PDF
PDF belgelerinde yalnızca metin içeriği dizinlenir. Görüntü olarak temsil edilen metin dizinlenmez.
Bir PDF belgesi yalnızca görüntüler içeriyorsa, ilk üç sayfa dizinlenir. Metin içeren PDF belgeleri tamamen dizine alınır.
-
Open Office XML ve OpenDocument
Yandex, Open Office XML ve OpenDocument biçimlerindeki belgeleri (Microsoft Office ve Open Office belgeleri dahil) doğru şekilde dizine alır, ancak bu biçimlerin yeni sürümlerine destek hemen eklenmeyebilir.