Cara Menggunakan Robots.txt pada Blog

Penggunaan robots.txt biasa dilakukan para pakar SEO dalam mengoptimalkan pencarian situs mereka pada penelusuran Google. Pada praktiknya robot ini adalah perintah dalam bentuk txt yang diaktifkan untuk tujuan perayapan atau pengindeksan dan terpasang pada pengaturan situs terutama platform blogger.

Setting Standart Robot.txt

Pengaturan pada robots.txt bisa dikonfigurasikan sebagai perintah bahkan juga larangan pada googlebot. Googlebot sendiri adalah program perayapan (crawler) dan pengindeksan (index) milik google yang bertugas mengumpulkan segala informasi yang ada pada situs.

Settingan robots.txt yang standart berikut akan memerintahkan googlebot merayapi dan mengindeksi seluruh konten pada situs web atau blog juga akan membantu mempercepat konten tersebut tayang pada sitemap Anda.

User-agent: Mediapartners-Google
Allow: /
User-agent: *
Allow: /
Sitemap: http://www.example.com/sitemap.xml

Ganti www.example.com dengan alamat situs Anda, namun sebelumnya pasang terlebih dahulu sitemap pada webmaster tools atau search console milik Anda.

baca:cara menambahkan sitemap pada google search console

Jika situs Anda mengaktifkan fitur robots.txt ini maka googlebot akan merayapi dan mengindeks sesuai konfigurasi atau permintaan dan tercantum pada sitemap. Bagi Anda yang masih pemula harap untuk memahami fungsi terpenting dari robots.txt ini agar tidak salah langkah dalam penggunaanya karena bisa berakibat situs Anda diabaikan oleh mesin penelusuran Google.

Fungsi Robots.txt pada halaman situs

1. Memblokir Postingan

Penggunaan robots.txt untuk menyembunyikan halaman situs dari penelusuran google dikarenakan suatu sebab. Googlebot akan merayapi bagian terpenting dari sebuah halaman situs Anda terutama yang mengarah (direct) langsung pada konten bukan dari label atau kategori. Misal seperti http://namablog.blogspot.com/search/label/Android?&max-results=8 dan Anda inginkan agar konten langsungnya dapat dirayapi dan diindeks tanpa perantara subdirektori (search label) seperti http://namablog.blogspot.com/2019/31/cara-flashing-android.html. dengan mencegah /search berikut.

User-agent: Googlebot
Disallow: /search

Dengan demikian googlebot tidak merayapi susunan (direktori) dari label dan mengindeksi langsung ke judul. Googlebot tetap akan memilah situs mana yang lebih relevan dengan kata kunci pada penelusuran dan memiliki trafik yang baik. Cara lainnya menggunakan tag <meta name="robots" content="noindex" /> yang diletakkan setelah tag <head> pada susunan html template untuk mencegah googlebot merayapi seluruh pencarian arsip (archieve) dalam situs karena membebani antrian crawl (rayapan). Kemudian cara yang lain lagi adalah menggunakan tajuk robot khusus.

Menggunakan robots.txt untuk melarang googlebot merayapi sebuah halaman situs web atau blog dikarenakan sebab judul yang sudah tidak ada (dihapus) dari postingan dan mengabaikannya dari indeksi pencarian google. Misal https://namablog.blogspot.com/2019/31/cara-flashing-android.html sudah dihapus dari postingan maka Anda mengecualikannya.

User-agent: Mediapartners-Google
Allow: /
User-agent: *
Allow: /
User-agent: Googlebot
Disallow : /cara-flashing-android.html
Allow: /
Sitemap: http://namablog.blogspot.com/sitemap.xml

Contoh yang lainnya penggunaan pada halaman ststis /p/about.html yang tidak perlu ada perayapan atau pengindeksan karena halaman tersebut hanya difungsikan sebagai form (furmulir) atau informasi legasitas situs milik Anda seperti terms of service, disclaimer, dan lain-lain.

User-agent: Mediapartners-Google
Allow: /
User-agent: *
Allow: /
User-agent: Googlebot
Disallow : /p/
Allow: /
Sitemap: http://namablog.blogspot.com/sitemap.xml

2. Pemblokir Gambar

Anda bisa menyembunyikan salah satu konten khusus gambar tertentu yang tidak ingin tersebar di penelusuran karena takut copyrights dan mengecualikan artikel (tulisan). menggunakan perintah disallow dan diiringi dengan garis miring (/).

User-agent: Googlebot-image
Disallow: /foto-tahun-baru.jpg
Sedangkan untuk memblokir seluruh atau semua konten gambar berformat (.jpg) dari penelusuran menggunakan perintah bintang (*) diawal dan string ($) diakhir berikut.
User-Agent: Googlebot-image
Disallow: /*.jpg$

Sedangkan untuk memblokir seluruh atau semua konten gambar berformat (.png) dari penelusuran menggunakan perintah bintang (*) diawal dan string ($) diakhir berikut.

User-agent: Googlebot-image
Disallow: /*.png$

Demikianlah cara penggunaan yang tepat pada robot.txt, semoga bermanfaat.

ARTIKEL TERKAIT

Beragam informasi seputar teknologi dan gadget dikemas dari berbagai sumber dan pengalaman dalam bentuk tutorial

Comment Policy: Silahkan isi komentar Anda sesuai dengan bahasan topik pada postingan. Komentar yang berisi link atau tautan tidak akan ditampilkan sebelum disetujui.
Buka Komentar Disqus

This website uses cookies to ensure you get the best experience on our website. Info