Robotların sitenizi taramasına engel olmak için aşağıdaki yönergeyi robots.txt dosyanıza ekleyin:
User-agent: *
Disallow: /
Sitenizi yalnızca Google'dan kaldırmak ve gelecekte yalnızca Googlebot'un sitenizi taramasına engel olmak için aşağıdaki yönergeyi kullanın:
User-agent: Googlebot
Disallow: /
Her bağlantı noktasının kendi robots.txt dosyası olmalıdır. Özellikle hem http, hem de https üzerinden içerik sunuyorsanız bu protokollerin her biri için ayrı bir robots.txt dosyası gerekir. Örneğin, Googlebot'un dizine tüm http sayfalarını ekleyip https sayfalarını eklememesi için aşağıdaki robots.txt yönergelerini kullanmalısınız.
http protokolünüz için (http://sunucunuz.com.tr/robots.txt):
User-agent: *
Allow: /
https protokolü için (https://sunucunuz.com.tr/robots.txt):
User-agent: *
Disallow: /
Tüm robotların sitenizdeki bir sayfayı dizine eklemelerini engellemek için noindex meta etiketi kullanın. Aşağıdaki meta etiketini sayfanızın kısmına yerleştirmeniz gerekir:
<meta name="robots" content="noindex">
Sitenizdeki bir sayfanın diğer robotlar tarafından dizine eklenmesine izin verip yalnızca Google'ın robotlarını engellemek için:
<meta name="googlebot" content="noindex">
noindex meta etiketini görmek için sayfanızı taramamız gerektiğinden, küçük bir olasılık da olsa, Googlebot noindex meta etiketini görmeyebilir ve bu durumda etiketi dikkate alamaz. Sayfanız sonuçlarda görünmeye devam ediyorsa, bunun nedeni büyük olasılıkla siz etiketi eklediğinizden beri sitenizi taramamış olmamızdır. (Ayrıca, bu sayfayı engellemek için robots.txt dosyanızı kullandıysanız bu sayfaya erişemez ve etiketi göremeyiz.)
3- Görselleri kaldırma
Bir resmi Google'ın görsel dizininden kaldırmak için robots.txt dosyanıza bir yönerge ekleyin. Örneğin, sitenizin www.siteniz.com.tr/gorseller/kopekler.jpg adresinde görünen kopekler.jpg resmini hariç tutmak istiyorsanız, aşağıdaki yönergeyi robots.txt dosyanıza ekleyin:
User-agent: Googlebot-Image
Disallow: /gorseller/kopekler.jpg
Sitenizdeki tüm görselleri dizinimizden kaldırmak için robots.txt dosyanıza aşağıdaki yönergeyi ekleyin:
User-agent: Googlebot-Image
Disallow: /
Disallow kalıpları, herhangi bir karakter dizisiyle eşleşmek üzere "*" içerebilir ve kalıplar, bir adın sonunu belirtecek şekilde "$" ile bitebilir. Belirli bir dosya türündeki (örneğin .jpg dahil ancak .gif hariç) tüm dosyaları kaldırmak için aşağıdaki robots.txt girişini kullanabilirsiniz:
User-agent: Googlebot-Image
Disallow: /*.gif$
Googlebot-Image, User-agent olarak belirtildiğinde, görseller Google Görsel Arama'dan çıkarılır. Görselleri (Google web arama ve Google Görseller dahil olmak üzere) tüm Google aramalarından çıkarmak istiyorsanız, User-agent Googlebot'u belirtin.
4- Önbelleği alınmış sayfa
Google, taradığı sayfaların otomatik olarak "anlık görüntüsünü" alır ve bu görüntüyü arşive ekler. Bu "önbelleğe alınmış" sürüm, orijinal sayfanın kullanılamaması (sayfanın web sunucusunun geçici olarak devre dışı kalması) durumunda kullanıcılarınızın web sayfasını görebilmesini sağlar. Önbelleğe alınmış sayfa kullanıcılara Google'ın sayfayı en son taradığı zamanki gibi görünür ve bunun önbellekteki sürüm olduğunu belirtmek için sayfanın başında bir mesaj gösteririz. Kullanıcılar arama sonuçları sayfasındaki "Önbellek" bağlantısını tıklayarak önbellekteki sürüme erişebilirler.
Başlamadan önce, aşağıdakilerden birini yapmalısınız:
- Bir sayfanın önbelleğe alınmış sürümünü güncellemek için sayfanın içeriğini değiştirin. Google, daha sonra sayfayı taradığında önbelleğe alınmış sürümü güncelleriz.
- Bir sayfanın önbelleğe alınmış sürümünü Google dizininden kaldırtmak ve Google'ın sayfayı daha sonra önbelleğe almasını önlemek için bu sayfaya arşivlenmemiş bir meta etiket ekleyin. Bu siteyi daha sonra taradığımızda, bu etiketi görür ve sayfayı kaldırırız.
Bu işlem tamamlandığında, Google sayfanın yeni sürümünü tarayana ve önbelleğe alana kadar, önbelleğe alınmış eski içeriğin kaldırılması için acil bir istekte bulunmak üzere Web Yöneticisi Araçları'ndaki URL kaldırma aracını kullanabilirsiniz.
Tüm arama motorlarının siteniz için "Önbellek" bağlantısını göstermesini engellemek üzere sayfanızın <HEAD> kısmına şu etiketi yerleştirin:
<meta name="robots" content="noarchive">
Yalnızca Google tarafından görüntülenmesini önlemek için aşağıdaki etiketi kullanın:
<meta name="googlebot" content="noarchive">
Not: Arşive alınmamış bir meta etiketinin kullanılması durumunda sayfanın yalnızca "Önbellek" bağlantısı kaldırılır. Google, sayfayı dizine eklemeye ve bir parça göstermeye devam eder.
5- Güncel olmayan sayfa veya bağlantı
Google tüm dizinini düzenli olarak günceller. Web taraması yaparken, yeni sayfaları otomatik olarak bulur, güncel olmayan sayfaları kaldırır ve mevcut sayfaların güncellemelerini yansıtır ve Google dizinini mümkün olduğunca yeni ve güncel tutarız.
Arama sonuçlarında sitenize ait güncel olmayan bağlantılar görünüyorsa bu sayfaların başlığında 404 (bulunamadı) veya 410 (gitti) durumunun görünmesini sağlayın. Bu durum kodları, Googlebot'a, istenen URL'nin geçerli olmadığını bildirir. Bazı sunucular var olmayan sayfalar için 200 (Başarılı) durumu döndürecek şekilde hatalı olarak yapılandırılmıştır. Bu, Googlebot'a istenen URL'lerin geçerli olduğunu ve dizine eklenmesi gerektiğini bildirir. Bir sayfa, http başlıklarında gerçek bir 404 hatası döndürürse, herhangi bir kişi web sayfası kaldırma isteği aracını kullanarak sayfayı Google dizininden çıkarabilir. Gerçek 404 hataları döndürmeyen güncel olmayan sayfalar, genellikle başka sayfaların kendileriyle bağlantıları kesildiğinde doğal olarak dizinimizin dışında kalacaktır.