Setelah saya posting masalah cara memblokir duplikat konten, kemarin dan tadi buka email ada yg ngirm mail gini (sdh sy balas ke emailnya) :"Mas iwan, sy pasang meta tag untuk membokir duplikat konten dari artikel mas itu lalu saya lihat di google webmaster kok ada semacam warning pada URL restricted by robots.txt . tanggal warning itu terhitung saya habis memasang meta tag itu, padahal sebelumnya ngga ada. gimana nih ,apa brerbahaya buat seo blog saya " , gitu deh intinya saya singkat.
Jawab, gini aja sederhananya...:
- Untuk pengguna hosting gratis blogger/blogspot , memang halaman url http://blog-anda.blogspot.com/search/label/nama label , adalah emang dari sono-nya/default, tidak akan di indeks/crawl oleh search engine , karena pada direktori server blogger /search/label , emang tidak di ijinkan untuk di indeks mesin pencari manapun.
-Pesan "URL restricted by robots.txt" nongol jika memasang atritub meta tag yang mengandung "index" atau "follow" , pada suatu halaman spesifik , yg di artikan sebagai perintah kepada robot search engine untuk melakukan indeks ....nah, karena pada wilayah /search/label , itu tak bisa di indeks , maka muncul-lah pesan "URL restricted by robots.txt" , sebagai konfirmasi dari si robot bahwa halaman pada url itu tidak bisa di indeks.
- Robot.txt blogger/blogspot bisa dilihat pada url :http://blog-anda.blogspot.com/robots.txt , dan semuanya punya format kaya di bawah ini:
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Sitemap: http://free-7a.blogspot.com/feeds/posts/default?orderby=updated
- Artinya emang wilayah search/label/ emang tak akan di crawl oleh searh engine, biar di tambahin script meta tag apapun ,dan pesan " URL restricted by robots.txt" hanyalah konfirmasi saja.
- Dan hubungannya dengan script cara meblokir duplikat konten adalah, script itu akan membuat efektivitas si crawl, yang mana tak akan mengindeks halaman2 archive yang tidak berhubungan dengan "query" yang di ketikan orang di search engine. jadi duplicate contents dari URL restricted by robots.txt , ini tidak di artikan sebagai duplikat konten dari suatu konten kita yang akan menurunkan kualitas SEO dari blog kita ( saya dah menerapakan teknik itu setahun lebih buat blog2 saya)
- Dan dari pihak google webmaster central sendiri sudah mengklarifikasi, bahwa "URL restricted by robots.txt" in blogger is no problem , dan cara memblokir konten biar lebih efektif seacara SEO itu adalah tetap baik jika di jalankan, kalau tidak ya tak apa2, karena banyak teknik optimasi seo dan oleh keyword yg bisa anda lakukan.
Jika anda ragu dengan seorang seo pemula kaya saya , di bahwa ini saya copy-paste sebuah cuplikan diskusi serta jawaban dari Contributor google Webmaster central yang berhubungan dengan masalah robot.txt di blogspot ini yg pernah saya dokumentasikan, url-nya dari diskusi ini saya lupa , coba cari aja sendiri ya, pasti ada, ini yg saya simpan di catatan lama saya dulu sebagai referensi belajar seo buat saya.
//
- visya
"Google was unable to crawl the URL due to a robots.txt restriction: your robots.txt file might prohibit the Googlebot entirely; it might prohibit access to the directory in which this URL is located; or it might prohibit access to the URL specifically. Often, this is not an error"
can anybody tell me how can i cancel the robots.txt restriction?
-Top Contributor Webmaster Help
Hey visya,
i guess we are dealing with your blog on blogger*com (blogspot*com)? If so you don't need to do anything about robots.txt restrictions.,
This is your robots.txt:
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search -- si only restricts duplicated stuff that not even you want to have indexed
keep cool, see all URLs restricted have /search/ in their path as specified in your robots.txt?
They are restricted because they duplicate what is already seen in posts and on the homepage, for example here:
http://www.yoursite.com/search/label/wisata seo sadau
You recognize having seen all this before --> on your original posts which are not restricted and thus indexed ;-)
/search/ has to be restricted to avoid duplication in the index, and, as I said, you even want to restrict them for robots for your own sake. This restriction is done by default on blogspot*com (and domains that use blogger like yours, of course) and does not need to be resolved in any way, it's not an error (messages in webmastertools are diagnostic only here).
//
Memang masalah meta tag ini untuk para pemula dunia seo kaya saya bisa adi bilang tak susah juga tak gampang, karena kadang kalau salah juga bisa beresiko error tak karuan, bahkan bisa di tendang dari indeks search-engine. Dan salah satu kelebihan hosting sendiri adalah bisa mengatur penuh masalah robot.txt untuk keperluan indeks ini, sehingga bisa memaksimalkan setiap tags , tapi blogspot/blogger juga banyak punya kelebihan secara seo dari yg hosting sendiri, terutama yang mengacu pada seorang blogger, banyak dan sptnya sdh sering saya singgung di posting2 saya.
O? Gitu toh rupanya. . .Mumpung lage ngikut kontes BELAJAR SEO PARA PEMULA jadi skalian bisa buat nyoba2 gitu. .He he salam kenal ya. . .
BalasHapusbarusan ane buka-buka webmaster tool dan dapat kasus ini, jadi tanpa disengaja juga cari artikel yang berhubungan dengan restricted ini.. eh nyasar disini..
BalasHapusujung-nya ane udapkan terimakasih mas.. :D thanks.
Wah, Sama, Aku juga nyari masalh ini di forum
BalasHapushehehe?
Makasih dah, malah tambah lengkap di sini.
Kok Linknya pada g'da (g;bisa di akses) kemana ya?
BalasHapusyang di atas?
Blog saya 2hari ini mendadak hilang dari halaman pertama google dan aq cari sampai halaman 10 pun gak ada, tapi masih terindeks.trus sy cek ke google webmaster ada pesan banyak sekali url yang dibatasi robot.Giaman tuh,mas? Sy jadi stress nih...
BalasHapuspak, kalo allow tu robot diijinkan utk meng-crawl..n kalo disallow tidak diijinkan gitu ?atau sebaliknya? Bingung saya..
BalasHapuspak, web site saya diblogger kan udah nga bisa diatur tuh robots.txt kira kira biar cepet terindex pake ilmu apalgi ya? udah di utak-utik kok tetep ga terindex sama google
BalasHapusmakasih yah penjelasannya
BalasHapustrims tas informasinya, sy pny situs baru yg jg punyak kasus seperti ini :Dibatasi oleh robots.txt, gmn cara agar postingan sy bs ke indeks google.matur nuwun
BalasHapusow, begitu rupanya. terima kasih atas penjelasannya. jadi tertunda beberapa hari bloggingnya karena nyari solusinya...
BalasHapusthx for post
BalasHapussangat bermanfaat, terima kasih
BalasHapusAku juga dpt 1 nih,oh..jadi...URL restricted by robots.txt, bukan masalah yang perlu dikuatirkan ataupun dipusingkan.
BalasHapusThanks u so much..
Saya juga nih mas dapat 1 restricted
BalasHapusUser-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Sitemap: http://heru-wahyuno.blogspot.com/feeds/posts/default?orderby=updated
trus setelah itu postingan baru saya tidak diindex google, sebelumnya tidak pernah terjadi kayak gitu....itu apa ada hubungannya mas ?? Bagaimana mengatasinya !! Mohon pencerahannya....
@ Heru
BalasHapusBiasanya jika saya ngalamin gitu , langkah yg sy alkukan :
1 - pasang rel='canonical' di dalam head tag
2 - Lalu bikin artikel dengan memberikan link ke google..
3 - Lalu ping di google blogsearch
http://blogsearch.google.com/ping
Lalu tunggu bbrp hari dg sabar...hampir semua blog2 sy pernah ngalamin masalah spt itu..
gt pengalaman saya ..semoga cukup membantu
maksudnya cara pasang
BalasHapus1 - pasang rel='canonical' di dalam head tag
kode lengkapnya seperti apa mas, terus diletaakkan disebelah mana ?
sy jg ngalami masalah spt itu, gak keindek biasanya 2 menit stlh bikin artikel lsg ke indek ni 10 hr
Ow begitu ya maz
BalasHapusmakasih informasinya, soalnya restricted robots itu muncul lagi
hmmmm....
BalasHapusjawaban atas pertanyaan saya ternyata ada disini,
terima kasih infonya.
Salam Kenal..
lalu fungsinya disallow mediapartners-google gimana gan?
BalasHapusternyata bukan daku ajah yang binggung masalah google bot. thanks atas inpo nya gan
BalasHapusnice info gan .... tadinya saya pikir kok di webmaster saya banyak sekali URL restricted by robots.txt , skrg sudah paham .. thanks for sharing n jangan lupa kunjungan balik yah gan ke http://www.sandjayainterior.co.cc/
BalasHapusmau tanya nih gan.. maklum newbie nih... URL restricted by robots.txt ini berpengaruh gak sama kedatangan google last accses ke blog kita?? masalhnya dah 10 hari googlw boot dak mampir2 ke blog ku, padahal tiap hari update posting dan biasanya google boot datang paling lama 3 hari sudah update posting... tolong pencerahannya gan...
BalasHapus@Rafless bencoolen
BalasHapusKalau dari pengalaman saya sendiri restricted by robots.txt sama sekali nggak ngaruh sama sekali di urusan SEO,.. di acc google webmaster saya banyak banget bahkan ada yg ratusan/blognya tapi traffic dari search engine termasuk google tetap naik terus.
restricted by robots.txt itu kan cuma indikator/laporan/pemberitahuan, bahwa halaman /search/label tidak bisa di crawl oleh spider, karena emang dari sononya begitu spt sdh dijelaskan pd post diatas. dalam hal ini pendapat saya si google ini emang dodol bin bego bin kurang kerjaan, kalau suatu halaman ga boleh di crawl kenapa dibuat dan diberikan ke blogger...kan jadi bikin bingung dan ribet orang aja...
By the way... masalah google boot yg ga mampir itu.. saran sy, terutama untuk blog2 yg umurnya masih baru, sebaiknya tidak usah kebanyakan unsur javascript, spt utk iklan ppc, widget LinkWithin, slide iklan...etc , intinya jangan kebanyakan muatan link di home page/tampil simple aja dulu, supaya boot mudah menemukan inti konten blog kita, karena kalau kebanyakn out-link yg tidak relevan dengan tema blog kita, memang bisa dianggap spam oleh spider....menurut pengalaman sy begitu...
Akhirnya terjawab juga disini masalah yang sempat sedikit memusingkan aku karena mendapat pesan error robots.txt seperti ini nih "URL restricted by robots.txt". Tidak tanggung2 web crawl error-nya => 18 pages dan web crawl error source-nya => 21 pages !! Siapa yang tidak takut kalo dapat pesan seperti itu. Kesimpulannya berarti "URL restricted by robots.txt" yang terjadi pada blogku memang dikarenakan si empunya blogspot.com yang tidak mengijinkan robots Google untuk meng-indeks, tidak ada masalah dengan meta tag yang sudah aku pasang di blog.
BalasHapusWah, terjawab juga masalah yang slama ini mengganggu pikiran saya.Thanks ga.
BalasHapusMakasih gan informasinya...Postingannya saya suka, sangat bermanfaat. Terlebih lagi itu juga terjadi pada saya sendiri...
BalasHapusSalam!
Crawl errors: Restricted by robots.txt ngaruh Banget gak sama urusan SEO ya bang....?? :) Thank.
BalasHapusBaru tahu saya sob, soal Restricted by robots.txt. hihii
BalasHapusthank sob atas infonya :)
Postingannya saya suka, sangat bermanfaat.
BalasHapuswaaaah, akhirnya ketemu juga waktu kesasar ksini..
BalasHapussaya sempet bingung knapa di webmaster pada banyak restrictred...
ternyata gpp toh
thank infonya ..
BalasHapusjadi lega ..
kirain ada error, ternyata emg udah dari sononya gak bisa di index .. :D ..
mas, saya mau nanya nih, kalo misalkan dari postingan kita ada restricted by robot, apa postingan tersebut tidak akan ada dalam search engine? atau kata yang direstrictednya saja? terima kasih. mohon kungan baliknya :D.
BalasHapussaya muter2 cari informasi mengeai hal ini, , ,
BalasHapusternyata ga berpengaruh ya, hhe
saya hampir di buat bingung. . .
Tanks
ooo...jadi tau..punya saya juga "URL restricted by robots.txt", ternyata ga ada masalah to..
BalasHapussaya cari2 infonya inggris semua bikin tambah pusing..hehe
thanks pencerahannya
thanks infonya gan. Ternyata dalam Seo banyak juga yang harus diwaspadai seperti duplicate keyword yang kadang tidak disadari
BalasHapusoalah..., ngono toh.. makasih infonya, sangat mencerahkan
BalasHapusane masih newbie nih gan... blog masih seumur jagung... boleh tukeran link gak? harisk-smart.blogspot.com
BalasHapusoalah gitu to ternyata, baru paham, lha terus ada hubunganya gak sama masa depan blog kita kalao terus terusan di "Restricted" gan ?
BalasHapusmakasih gan untuk ilmu seonya,,, awalnya ane kira error tuh!!
BalasHapus