it-swarm-tr.com

Externallogin uzantısının hatalı yapılandırılması, arama motoru dizin oluşturma sorununa neden oluyor

Kısa Genel Bakış

Joomla web sitemin arama motoru robotlarında garip bir sorunu var. Bir web yöneticisinin robots.txt dosyası veya diğer arama motoru optimizasyonu parametreleriyle ilgili önemsiz bir sorun olmadığından emin olmak için yapabileceği TÜM standart şeyleri kontrol ettim. Üniversitemin BT çalışanları neler olup bittiğinden habersiz ve Joomla'nın forumlarında yardım etmeye çalışan insanlar da öyle.

Bu soruyu Pro Webmasters stackexchange'te de sordum. Ama Joomla'da bir yerde soruna neden olan gizli bir ortam olabileceğinden şüphelenmeye başlıyorum. Bu yüzden, burada bir yerde eksik olduğum bir ayar olup olmadığını görmek için bu soruyu soruyorum.

Asıl sorun burada başlıyor.

Söz konusu web sitesi: http://gsa.ece.umd.edu/ . Joomla 2.5.x (en yeni) kullanılarak çalışır. Site, 2013 yılının Aralık ayının ortalarından bu yana kullanıma sunuldu ve sitenin Google'da doğru bir şekilde dizine eklenmediğini hemen fark ettim. Google'da web sitesini aradığımda özellikle şu mesajı görüyorum:

ECEGSA - University of Maryland

A description for this result is not available because of this site's robots.txt – learn more.

Şey Aralık ayına kadar Mart ayına kadar olan varsayılan Joomla robots.txt dosyasını kullandım:

User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/

Orada hiçbir şey Google'ın web sitemi aramasını engellememelidir. Ve daha da kafa karıştırıcı bir şekilde, Google Web Yöneticisi araçlarına gittiğimde, "Engellenen URL'ler" sekmesi altında, sitedeki bağlantıların çoğunu denediğimde, hepsi "İzin Verildi" olarak gösterilir. Daha sonra robots.txt dosyasına koyarak bir site haritası eklemeyi denedim. Bu yardımcı olmadı. Aynı tam arama sonucu, web yöneticisi araçlarındaki "Engellenen URL'ler" sekmesinde aynı davranış. Şimdi ek olarak, "site haritaları" sekmesi birkaç bağlantı için "URL kullanıma hazırlandı" şeklinde bir hata olduğunu söylüyor. "Engellenen URL'ler" de bu bağlantıları denedim ve bunlara izin veriliyor!

Daha sonra robots.txt dosyasını silmeyi denedim. Faydası yok. Aynı sorun.

Web Yöneticisi araçlarından bir örnek ekran görüntüsü. Index Status for my website showing no crawl errors and no blocked URLs, in direct contradiction to what the sitemap tab says and what the search result says! FRUSTRATION!

Bu noktada, bunun neden olduğuna dair akılcı bir açıklama yapamam ve burada BT departmanındaki hiç kimse de edemez. Joomla forumlarındaki hiç kimse neler olup bittiğini anlamıyor gibi görünmüyor.

Yukarıda açıklananlara dayanarak Joomla site yapılandırmasında olası bir çakışma olup olmadığını bilen var mı?

5

GÜNCELLEME: Sorun, uzantı yapılandırması düzeltilerek çözüldü

Kullanıcılarımın Üniversite CAS (Merkezi Kimlik Doğrulama Sunucusu) kullanarak giriş yapmasına izin vermek için externallogin adlı bir eklenti kullandım. Bu eklentinin, bir yapılandırma hatası nedeniyle TÜM sayfalarıma HTTP Üstbilgisi yanıtına 303 yönlendirmesi eklediği ortaya çıkıyor.

Sonuç olarak, (a) 303 yönlendirmelerini cezalandırdığı veya muhtemelen (b) 303 yönlendirmesinin işaret ettiği sayfa ( https: //login.umd) nedeniyle sayfalarımın hiçbiri düzgün bir şekilde dizine eklenmemektedir. edu / ), tüm botlara izin vermeyen bir robots.txt dosyasına sahiptir.

[~ # ~] düzeltme [~ # ~]
Bu sorunu gidermek için, herhangi bir sorunla karşılaşırsanız, eklentinin yapılandırmasını aşağıdaki gibi düzeltmeniz gerekir:
1. Uzantılar menüsünde, "Harici Giriş>" altında sunucu yapılandırmasına gidin.
2. Bağlantılar sekmesinde, "Otomatik Giriş/Çıkış" için 'Hayır'ı seçin. Bu durumda, bir kullanıcının tarayıcı oturumunda CAS'da oturum açmış olup olmadığını kontrol etmek için uzantı, web sitenizin tüm sayfalarına otomatik olarak 303 yönlendirmesi eklediğinden, 2. adımda 'Evet'i seçerseniz hata oluşur ve öyleyse otomatik olarak siteye giriş yapar. Bu özellik arama motoru indeksleme sorunlarına neden olacaktır.

Teşekkür
@ Stephen-ostermiller'e ( Pro Webmasterlar için ilgili cevap ), uzantı tarafından eklenen 303 yönlendirmesinin farkına varmamı sağlayarak beni doğru yöne yönlendirdiğiniz için teşekkürler.

2