Senin

Sitemap di blogspot - masalah URL restricted by robots.txt

cara kerja robots txt googleSetelah saya posting masalah cara memblokir duplikat konten, kemarin dan tadi buka email ada yg ngirm mail gini (sdh sy balas ke emailnya) :"Mas iwan, sy pasang meta tag untuk membokir duplikat konten dari artikel mas itu lalu saya lihat di google webmaster kok ada semacam warning pada URL restricted by robots.txt . tanggal warning itu terhitung saya habis memasang meta tag itu, padahal sebelumnya ngga ada. gimana nih ,apa brerbahaya buat seo blog saya " , gitu deh intinya saya singkat.

Jawab, gini aja sederhananya...:
- Untuk pengguna hosting gratis blogger/blogspot , memang halaman url http://blog-anda.blogspot.com/search/label/nama label , adalah emang dari sono-nya/default, tidak akan di indeks/crawl oleh search engine , karena pada direktori server blogger /search/label , emang tidak di ijinkan untuk di indeks mesin pencari manapun.

-Pesan "URL restricted by robots.txt" nongol jika memasang atritub meta tag yang mengandung "index" atau "follow" , pada suatu halaman spesifik , yg di artikan sebagai perintah kepada robot search engine untuk melakukan indeks ....nah, karena pada wilayah /search/label , itu tak bisa di indeks , maka muncul-lah pesan "URL restricted by robots.txt" , sebagai konfirmasi dari si robot bahwa halaman pada url itu tidak bisa di indeks.
- Robot.txt blogger/blogspot bisa dilihat pada url :http://blog-anda.blogspot.com/robots.txt , dan semuanya punya format kaya di bawah ini:
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Sitemap: http://free-7a.blogspot.com/feeds/posts/default?orderby=updated

- Artinya emang wilayah search/label/ emang tak akan di crawl oleh searh engine, biar di tambahin script meta tag apapun ,dan pesan " URL restricted by robots.txt" hanyalah konfirmasi saja.

- Dan hubungannya dengan script cara meblokir duplikat konten adalah, script itu akan membuat efektivitas si crawl, yang mana tak akan mengindeks halaman2 archive yang tidak berhubungan dengan "query" yang di ketikan orang di search engine. jadi duplicate contents dari URL restricted by robots.txt , ini tidak di artikan sebagai duplikat konten dari suatu konten kita yang akan menurunkan kualitas SEO dari blog kita ( saya dah menerapakan teknik itu setahun lebih buat blog2 saya)

- Dan dari pihak google webmaster central sendiri sudah mengklarifikasi, bahwa "URL restricted by robots.txt" in blogger is no problem , dan cara memblokir konten biar lebih efektif seacara SEO itu adalah tetap baik jika di jalankan, kalau tidak ya tak apa2, karena banyak teknik optimasi seo dan oleh keyword yg bisa anda lakukan.
cara google spider crawl indeks situs blog
Jika anda ragu dengan seorang seo pemula kaya saya , di bahwa ini saya copy-paste sebuah cuplikan diskusi serta jawaban dari Contributor google Webmaster central yang berhubungan dengan masalah robot.txt di blogspot ini yg pernah saya dokumentasikan, url-nya dari diskusi ini saya lupa , coba cari aja sendiri ya, pasti ada, ini yg saya simpan di catatan lama saya dulu sebagai referensi belajar seo buat saya.
//
- visya
"Google was unable to crawl the URL due to a robots.txt restriction: your robots.txt file might prohibit the Googlebot entirely; it might prohibit access to the directory in which this URL is located; or it might prohibit access to the URL specifically. Often, this is not an error"
can anybody tell me how can i cancel the robots.txt restriction?

-Top Contributor Webmaster Help
Hey visya,
i guess we are dealing with your blog on blogger*com (blogspot*com)? If so you don't need to do anything about robots.txt restrictions.,

This is your robots.txt:
User-agent: Mediapartners-Google
Disallow:

User-agent: *
Disallow: /search -- si only restricts duplicated stuff that not even you want to have indexed
keep cool, see all URLs restricted have /search/ in their path as specified in your robots.txt?

They are restricted because they duplicate what is already seen in posts and on the homepage, for example here:

http://www.yoursite.com/search/label/wisata seo sadau
You recognize having seen all this before --> on your original posts which are not restricted and thus indexed ;-)

/search/ has to be restricted to avoid duplication in the index, and, as I said, you even want to restrict them for robots for your own sake. This restriction is done by default on blogspot*com (and domains that use blogger like yours, of course) and does not need to be resolved in any way, it's not an error (messages in webmastertools are diagnostic only here).
//
Memang masalah meta tag ini untuk para pemula dunia seo kaya saya bisa adi bilang tak susah juga tak gampang, karena kadang kalau salah juga bisa beresiko error tak karuan, bahkan bisa di tendang dari indeks search-engine. Dan salah satu kelebihan hosting sendiri adalah bisa mengatur penuh masalah robot.txt untuk keperluan indeks ini, sehingga bisa memaksimalkan setiap tags , tapi blogspot/blogger juga banyak punya kelebihan secara seo dari yg hosting sendiri, terutama yang mengacu pada seorang blogger, banyak dan sptnya sdh sering saya singgung di posting2 saya.

39 komentar:

  1. O? Gitu toh rupanya. . .Mumpung lage ngikut kontes BELAJAR SEO PARA PEMULA jadi skalian bisa buat nyoba2 gitu. .He he salam kenal ya. . .

    BalasHapus
  2. barusan ane buka-buka webmaster tool dan dapat kasus ini, jadi tanpa disengaja juga cari artikel yang berhubungan dengan restricted ini.. eh nyasar disini..

    ujung-nya ane udapkan terimakasih mas.. :D thanks.

    BalasHapus
  3. Wah, Sama, Aku juga nyari masalh ini di forum
    hehehe?
    Makasih dah, malah tambah lengkap di sini.

    BalasHapus
  4. Kok Linknya pada g'da (g;bisa di akses) kemana ya?
    yang di atas?

    BalasHapus
  5. Blog saya 2hari ini mendadak hilang dari halaman pertama google dan aq cari sampai halaman 10 pun gak ada, tapi masih terindeks.trus sy cek ke google webmaster ada pesan banyak sekali url yang dibatasi robot.Giaman tuh,mas? Sy jadi stress nih...

    BalasHapus
  6. pak, kalo allow tu robot diijinkan utk meng-crawl..n kalo disallow tidak diijinkan gitu ?atau sebaliknya? Bingung saya..

    BalasHapus
  7. pak, web site saya diblogger kan udah nga bisa diatur tuh robots.txt kira kira biar cepet terindex pake ilmu apalgi ya? udah di utak-utik kok tetep ga terindex sama google

    BalasHapus
  8. makasih yah penjelasannya

    BalasHapus
  9. trims tas informasinya, sy pny situs baru yg jg punyak kasus seperti ini :Dibatasi oleh robots.txt, gmn cara agar postingan sy bs ke indeks google.matur nuwun

    BalasHapus
  10. ow, begitu rupanya. terima kasih atas penjelasannya. jadi tertunda beberapa hari bloggingnya karena nyari solusinya...

    BalasHapus
  11. sangat bermanfaat, terima kasih

    BalasHapus
  12. Aku juga dpt 1 nih,oh..jadi...URL restricted by robots.txt, bukan masalah yang perlu dikuatirkan ataupun dipusingkan.
    Thanks u so much..

    BalasHapus
  13. Saya juga nih mas dapat 1 restricted
    User-agent: Mediapartners-Google
    Disallow:

    User-agent: *
    Disallow: /search

    Sitemap: http://heru-wahyuno.blogspot.com/feeds/posts/default?orderby=updated

    trus setelah itu postingan baru saya tidak diindex google, sebelumnya tidak pernah terjadi kayak gitu....itu apa ada hubungannya mas ?? Bagaimana mengatasinya !! Mohon pencerahannya....

    BalasHapus
  14. @ Heru
    Biasanya jika saya ngalamin gitu , langkah yg sy alkukan :

    1 - pasang rel='canonical' di dalam head tag

    2 - Lalu bikin artikel dengan memberikan link ke google..

    3 - Lalu ping di google blogsearch
    http://blogsearch.google.com/ping

    Lalu tunggu bbrp hari dg sabar...hampir semua blog2 sy pernah ngalamin masalah spt itu..

    gt pengalaman saya ..semoga cukup membantu

    BalasHapus
  15. maksudnya cara pasang
    1 - pasang rel='canonical' di dalam head tag

    kode lengkapnya seperti apa mas, terus diletaakkan disebelah mana ?
    sy jg ngalami masalah spt itu, gak keindek biasanya 2 menit stlh bikin artikel lsg ke indek ni 10 hr

    BalasHapus
  16. Ow begitu ya maz
    makasih informasinya, soalnya restricted robots itu muncul lagi

    BalasHapus
  17. hmmmm....
    jawaban atas pertanyaan saya ternyata ada disini,
    terima kasih infonya.
    Salam Kenal..

    BalasHapus
  18. lalu fungsinya disallow mediapartners-google gimana gan?

    BalasHapus
  19. ternyata bukan daku ajah yang binggung masalah google bot. thanks atas inpo nya gan

    BalasHapus
  20. nice info gan .... tadinya saya pikir kok di webmaster saya banyak sekali URL restricted by robots.txt , skrg sudah paham .. thanks for sharing n jangan lupa kunjungan balik yah gan ke http://www.sandjayainterior.co.cc/

    BalasHapus
  21. mau tanya nih gan.. maklum newbie nih... URL restricted by robots.txt ini berpengaruh gak sama kedatangan google last accses ke blog kita?? masalhnya dah 10 hari googlw boot dak mampir2 ke blog ku, padahal tiap hari update posting dan biasanya google boot datang paling lama 3 hari sudah update posting... tolong pencerahannya gan...

    BalasHapus
  22. @Rafless bencoolen

    Kalau dari pengalaman saya sendiri restricted by robots.txt sama sekali nggak ngaruh sama sekali di urusan SEO,.. di acc google webmaster saya banyak banget bahkan ada yg ratusan/blognya tapi traffic dari search engine termasuk google tetap naik terus.

    restricted by robots.txt itu kan cuma indikator/laporan/pemberitahuan, bahwa halaman /search/label tidak bisa di crawl oleh spider, karena emang dari sononya begitu spt sdh dijelaskan pd post diatas. dalam hal ini pendapat saya si google ini emang dodol bin bego bin kurang kerjaan, kalau suatu halaman ga boleh di crawl kenapa dibuat dan diberikan ke blogger...kan jadi bikin bingung dan ribet orang aja...

    By the way... masalah google boot yg ga mampir itu.. saran sy, terutama untuk blog2 yg umurnya masih baru, sebaiknya tidak usah kebanyakan unsur javascript, spt utk iklan ppc, widget LinkWithin, slide iklan...etc , intinya jangan kebanyakan muatan link di home page/tampil simple aja dulu, supaya boot mudah menemukan inti konten blog kita, karena kalau kebanyakn out-link yg tidak relevan dengan tema blog kita, memang bisa dianggap spam oleh spider....menurut pengalaman sy begitu...

    BalasHapus
  23. Akhirnya terjawab juga disini masalah yang sempat sedikit memusingkan aku karena mendapat pesan error robots.txt seperti ini nih "URL restricted by robots.txt". Tidak tanggung2 web crawl error-nya => 18 pages dan web crawl error source-nya => 21 pages !! Siapa yang tidak takut kalo dapat pesan seperti itu. Kesimpulannya berarti "URL restricted by robots.txt" yang terjadi pada blogku memang dikarenakan si empunya blogspot.com yang tidak mengijinkan robots Google untuk meng-indeks, tidak ada masalah dengan meta tag yang sudah aku pasang di blog.

    BalasHapus
  24. Wah, terjawab juga masalah yang slama ini mengganggu pikiran saya.Thanks ga.

    BalasHapus
  25. Makasih gan informasinya...Postingannya saya suka, sangat bermanfaat. Terlebih lagi itu juga terjadi pada saya sendiri...
    Salam!

    BalasHapus
  26. Crawl errors: Restricted by robots.txt ngaruh Banget gak sama urusan SEO ya bang....?? :) Thank.

    BalasHapus
  27. Baru tahu saya sob, soal Restricted by robots.txt. hihii
    thank sob atas infonya :)

    BalasHapus
  28. Postingannya saya suka, sangat bermanfaat.

    BalasHapus
  29. waaaah, akhirnya ketemu juga waktu kesasar ksini..
    saya sempet bingung knapa di webmaster pada banyak restrictred...

    ternyata gpp toh

    BalasHapus
  30. thank infonya ..
    jadi lega ..
    kirain ada error, ternyata emg udah dari sononya gak bisa di index .. :D ..

    BalasHapus
  31. mas, saya mau nanya nih, kalo misalkan dari postingan kita ada restricted by robot, apa postingan tersebut tidak akan ada dalam search engine? atau kata yang direstrictednya saja? terima kasih. mohon kungan baliknya :D.

    BalasHapus
  32. saya muter2 cari informasi mengeai hal ini, , ,
    ternyata ga berpengaruh ya, hhe
    saya hampir di buat bingung. . .
    Tanks

    BalasHapus
  33. ooo...jadi tau..punya saya juga "URL restricted by robots.txt", ternyata ga ada masalah to..
    saya cari2 infonya inggris semua bikin tambah pusing..hehe
    thanks pencerahannya

    BalasHapus
  34. thanks infonya gan. Ternyata dalam Seo banyak juga yang harus diwaspadai seperti duplicate keyword yang kadang tidak disadari

    BalasHapus
  35. oalah..., ngono toh.. makasih infonya, sangat mencerahkan

    BalasHapus
  36. ane masih newbie nih gan... blog masih seumur jagung... boleh tukeran link gak? harisk-smart.blogspot.com

    BalasHapus
  37. oalah gitu to ternyata, baru paham, lha terus ada hubunganya gak sama masa depan blog kita kalao terus terusan di "Restricted" gan ?

    BalasHapus
  38. makasih gan untuk ilmu seonya,,, awalnya ane kira error tuh!!

    BalasHapus