Apa Itu Robot.txt?
Robot.txt adalah sebuah ketentuan pengguna blog untuk mencegah dari mesin pencari, yang tidak di izinkan untuk di index. Robot.txt ini juga berguna sebagai mengontrol dari halaman yang tidak boleh di index dari mesin pencari dan situs media sosial seperti: Facebook, Twitter dan lain-lain. Atau Anda ingin lebih jelas dan detailnya Anda bisa membaca dari situs Wikipedia dalam bahasa Indonesia.
Cara Setting Robot.txt di Blogger
Semua plaform Blogger sudah memiliki robot.txt didalamnya. Secara default robot.txt di blogspot seperti dibawah ini:
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Allow: /
Sitemap: http://compyku.blogspot.com/feeds/posts/default?orderby=UPDATED
Mari kita bahas satu persatu dari kode di atas.
1.User-agent: Mediapartners-Google: User agent milik google menandakan bahwa blog ini partner dari google. Kode ini juga difungsikan untuk robot Google Adsense yang membantu mereka untuk menampilkan iklan yang relevan di blog Anda sesuai niche blog Anda.
2.Disallow: Yang tidak di perbolehkan tidak ada.
3. User-agent: Semua robot search engine/mesin pencari.
4. Disallow: /search: Tidak di perbolehkan merayapi folder seach dll, seperti search/label dan seterusnya. Itu berarti link memiliki kata kunci pencarian setelah nama domain akan diabaikan. seperti yang saya katakan search/label/seo tidak akan di index.
5. Allow: /: Mengizinkan semua halaman untuk di rayapi, kecuali yang di larang di atas. Tanda “/” mengacu pada homepage dan berarti robot dapat merayapi homepage blog kita.
6.Sitemap: http://compyku.blogspot.com/feeds/posts/default?orderby=UPDATED: Sitemap atau alamat feeds blog. Kode ini mengacu pada setimap blog, yang akan mempermudah robot untuk merayapi dan mengindex setiap artikel di terbitkan.
Catatan: Sitemap di atas hanya dapat memberi tahu web crawler sekitar 25 artikel yang baru di terbitkan dan jika Anda ingin mengoptimalkan agar lebih dari itu, Anda bisa merubahnya menjadi sitemap sebagai berikut:
Sitemap: http://compyku.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
Sitemap di atas untuk memberi tahu bahwa artikel Anda di kisaran 500, jika Anda memiliki lebih dari 500 artikel Anda bisa menggunakan sitemap di bawah ini:
Sitemap: http://compyku.blogspot.com/atom.xml?redirect=false&start-index=500&max-results=1000
Nah di atas adalah penjelasan tentang kode robot.txt. Jika Anda ingin memodifikasi robot txt, saya tekankan untuk hati hati. Pada saat ini sitemap yang saya gunakan di situs ini adalah sebagai berikut: Jika Anda ingin mencoba seperti yag saya gunakan silahkan gunakan kode ini.
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /p/about.html
Allow: /
Sitemap: https://www.buatblog.net/feeds/posts/default?orderby=updated
Saya menggunakan kode robot.txt di atas karena menjaga agar tidak terjadi kesalahan pada situs saya, Jadi saya memilih yang simpel saja. Nah untuk sitemap saya menggunakan itu karena artikel di situs ini masih kurang dari 40 artikel, maka saya belum menggunakan yang lebih dari 500.
Nah kode di bawah ini adalah untuk mencegah duplikat konten yang terdapat di blog Anda, itu bisa disebabkan karena di akses dari mobile phone. Anda bisa mencegahnnya dengan setting robot.txt di blogger Anda dengan kode berikut:
User-agent: Mediapartners-Google
Disallow:
User-agent: Googlebot
Disallow: /search
Disallow: /?m=1
Disallow: /?m=0
Disallow: /*?m=1
Disallow: /*?m=0
User-agent: *
Disallow: /search
Sitemap: http://compyku.blogspot.com/feeds/posts/default?orderby=UPDATED
Menambahkan Custom Robot.txt di Blogspot/Blogger Anda
Sekarang bagian utama dari tutorial ini adalah bagaimana menambahkan custom robot.txt di blogger. Berikut adalah langkah-langkah untuk melakukan setting robot.txt di blogspot Anda.
- Masuk ke blog blogger Anda.
- Arahkan ke Settings >> Shearch Preferences >> Crawlers and Indexing >> Custom robots.txt >> Edit >> Yes
- Sekarang pastekan kode file robots.txt Anda dalam kotak. Anda bisa mengambil salah satu contoh robot.txt di atas.
- Klik tombol Save Changes.
- Dan selesai!
Anda bisa cek setingan robot,txt Anda dengan cara masuk di google webmasters tool lalu klik Crawl >> Robot.txt Tester. Lihat gambar di bawah ini:
Akhir dari saya: Saya berusaha menjelaskan tentang cara setting robot.txt di blogger dengan sangat hati-hati agar tidak terjadi kesalahan yang berakibat fatal untuk pembaca dan apabila ada yang paham benar dengan robot.txt, Anda bisa memberi tahu kesalahan saya dengan cara komntar di bawah ini. Terima kasih.
0 komentar:
Posting Komentar