it-swarm-tr.com

Arama motorları PDF'leri tarıyor mu ve öyleyse bunları oluştururken uyulması gereken herhangi bir kural var mı?

Üzerinde çalıştığım web sitesinde birkaç yüz PDF var. Hiçbirini bir aramada geri döndüğümü görmedim, ancak doğrudan siteden bağlantı var. Ayrıca, ürün belgeleri olduğundan, anahtar kelimelerle doludur.

Google’ın veya diğer arama motorlarının onları taramasını sağlamak için yapmamız gereken özel bir şey var mı?

PDF’lerin Google’ı daha çok sevmesine yardımcı olması için zor ve hızlı kurallar var mı? Örneğin, Adobe'nin oluşturma sırasında oluşturduğu bozuk PDF etiketlerini temizlemek için bunları ghostscript üzerinden çalıştırmalı mıyım?

22
Ben Hoffman

Google kesinlikle PDF dosyalarını indeksler ve arama sorgunuza filetype:pdf ekleyerek sadece PDF dosyalarını arayabilirsiniz ( örnek) ).

Bir PDF öğesini optimize etmek için yapılacak temel şeyleri söyleyebilirim ki kolayca dizine eklenebilir:

  • Anlamlı bir dosya adı verin
  • Tüm belge meta verileri özelliklerini tamamlayın (başlık, yazar, anahtar kelimeler vb.)
  • PDF öğesinin taranmış resimlerden ve gerçek metinden oluştuğundan emin olun
  • Bir HTML belgesinde olduğu gibi başlıkların doğru kullanımı ile iyi içeriğinizin olduğundan emin olun

Daha fazla ipucu için Optimizasyon PDF Belgeler ve Arama Motorlarında PDF’leri Optimize Etmek İçin On Bir İpuçları

17
Dan Diplo

Diğer arama motorları hakkında emin değilim, ancak Google’a gelince, ana kural onları robots.txt ile dışlamak değil.

B , PDF search’i destekleyen ilk duyurularıydı.

1
intlect

Tıpkı bir web sitesine uyumlu hale getirmek gibi, SEO'nuza zarar veremez, PDF erişiminizi incitemez. Adobe'nin yerleşik erişilebilirlik denetleyicisi mükemmel olmaktan uzak, ancak en azından bu alanları düzeltmek sizi başlatacak.

Muhtemelen her 4 ya da 5'e 5 dakika harcıyorum, çoğunlukla da çevrimiçi yaptığımız metin PDF'leri. Sayfa sayısına ve bu sayfaların ne kadar karmaşık olduğuna bağlı olarak zaman eşit şekilde artar.

Düzenlemenizi yapmak için Adobe Acrobat Pro'nuz olduğunu varsayalım:

  • Erişilebilirlik Tam Denetimi'ni çalıştırın. (Hızlı kontrol benim için oldukça anlamsız)
  • Belge özelliklerinde (anahtar kelimeler, konu, dil vb.) Meta bilgileri güncelleyin
  • Etiketlerin eklendiğinden emin olun
  • Metnin metin, resim, görüntü ve arka plan öğesi olarak etiketlendiğinden emin olun.
  • İşe yaramaz kabartmayı (dekorasyon veya tasarım gibi) arka plan olarak etiketleyin
  • Resimlere iyi metin ekleyin
  • Okuma sırasına göre metnin doğru sıralandığından emin olun.
  • İçerik araç çubuğunda, metnin kopyalanmadığından veya aşırı yanlış tercüme edilmediğinden emin olun.
  • Taranan sayfalarda OCR tarayıcıyı kullanın

Tablolar ve gerçekten garip Adobe hataları için daha gelişmiş düzenleme için, CommonLook adında bir eklenti kullanıyoruz. CommonLook işi halleder, ancak neredeyse Adobe araçlarından nefret ettiğim kadar nefret ediyorum.

Rötuş Okuma Sırası aracı, Etiketler araç çubuğu, Okuma Sırası araç çubuğu ve İçerik araç çubuğunu öğrenin. İşim web'e çıkmadan önce tam uyumlu belgeler gerektiriyor, ancak herkes bazı basit etiketleme ve belge özelliklerinden faydalanabilir.

1
MrChrister