Cara Mengenali dan Menghilangkan SPAM di Laporan Google Analytics

Setiap blogger pasti tahu Google Analytics tapi apakah setiap blogger menggunakan tool gratis dari google tersebut untuk mendapatkan data dari websitenya? Tidak juga. Tidak sedikit juga blogger memilih untuk tidak menggunakan tool gratis dari google ini untuk mengumpulkan data dari webnya. Salah satu tool analytics yang banyak digunakan teman-teman blogger komunitas indonesia adsense publisher adalah hitstats.com.

Tulisan ini bukan tentang perbandingan tool analitik mana yang lebih banyak dipakai tapi bagaimana seorang blogger harus menyaring data yang disampaikan Google Analytics agar dapat menganalisa, membuat strategi dan membuat konten yang akan membuat blog yang dikelola berkembang. Kenapa data di google analytics harus disaring?

Ide tulisan ini muncul ketika kang ghani beberapa waktu lalu pernah membuat thread yang mewanti-wanti blogger pada sebuah spam yang muncul di laporan Google Analytics. Spam ini tidak hanya mengganggu data yang dikumpulkan oleh Analytics tetapi juga membebani server hosting dari blog yang bersangkutan. Untuk hosting spam akan membuat kecepatan situs untuk tampil menjadi lebih lambat karena membebani bandwith hosting blog.

Semua mungkin sudah tau apa itu Spam? Singkatnya spam adalah penawaran yang dikirim oleh seseorang kepada anda (dan saya) dimana penawaran tersebut tidak anda butuhkan dan sifatnya mengganggu. Ibaratnya anda mendapat teror sms atau telpon promosi dari telemarketing sebuah perusahaan.

Selama ini saya mengetahui spam hanya ada di email, tetapi thread yang ditulis oleh moderator IAPD tentang spamming url yang ada di dashboard Google Analytics beliau beberapa saat yang lalu, saya coba kembali belajar tentang pemfilteran data di Google Analytics. Sebelumnya saya pernah membaca sebuah spam yang terdapat di laporan kata kunci yang berjudul “Ghost spam is free from the politics” beberapa tahun yang lalu.

Saya pernah mendapatkan spam tersebut dan saya melakukan filtering terhadap kata kunci spam tersebut. Tapi ternyata ada banyak cara dan celah yang digunakan oleh Spammer dengan memanfaatkan kode analytics yang diberikan oleh google. Kita akan membahas lebih lanjut celah-celah yang dimanfaatkan oleh spammer lebih lanjut dengan bantuan Himanshu Sharma.

Apakah spam bot ini hanya muncul di google analytics? Tidak juga karena di selain di google analytics saya juga sering mendapatkan spam yang terlihat seperti situs perujuk. Silahkan coba dilihat pada gambar dibawah.

Data Situs Perujuk dimana Spam Bot ikutan nyampur

Situs perujuk yang terindikasi sebagai spam mengirimkan data palsu ke google analytics. Data google analytics itu penting apalagi jika anda blog atau website anda ditujukan untuk menambah penghasilan. Dalam salah satu artikel Neil Patel yang saya terjemahkan disini ada 3 data yang dapat membantu kita untuk membuat sebuah konten yang sesuai dengan pengunjung.

Makanya tindakan penting yang anda butuhkan untuk mendapatkan data yang bersih adalah dengan melakukan filtering terhadap semua spam bot yang muncul di dalam analytics anda.

Bagaimana cara menemukan situs yang terindikasi spam tersebut? Saya menemukan sebuah artikel yang sangat bagus dari Himanshu Sharma, www.optimizesmart.com. Menurut pengarang buku Maths and Stats for Web Analytics and Conversion Optimization tersebut, anda harus mengidentifikasi tipe spam yang ada di dalam google analytics.

Sharma menemukan spam yang terdapat di google analytics terdapat di beberapa tempat di laporan google analytics yaitu

  • laporan event,
  • laporan landing page,
  • laporan referer,
  • laporan Search Organic,
  • Laporan Keyword,
  • Laporan Language,
  • Laporan transaksi dan sales.

Wah banyak juga ya..

Spammers menurut Sharma melakukan aksi spam dengan cara mengirimkan “fake hit” ke data Google Analytics anda. Apa itu hit? Sebuah hit adalah istilah yang digunakan google dimana pelacak yang telah ditanamkan (kode pelacakan google analytics) di dalam blog atau website dikirimkan ke sebagai data di laporan yang terdapat di akun google analytics.

Jadi si spammer melakukan sebuah modifikasi yang memanfaatkan perintah ga('send','pageview'); yang akan mengirimkan hit ke laporan GA di akun blog. Perintah ga(‘send’,’pageview’); adalah perintah standar di semua kode GA.

(wah hebat banget spammernya)

Cara Mengenali Spam di Laporan Google Analytics

Menurut artikel yang diterbitkan oleh Himanshu Sherma cara mengenali spam di laporan Google Analytic adalah dari bounce rate atau rasio pentalan yang terdapat di dalam laporan.  Seperti yang terlihat di dashboard statistik blog saya diatas beberapa situs perujuk yang terlihat terindikasi sebagai spam.

Di google analytics anda dapat mengenali situs spam dengan masuk ke laporan Referrals (Situs Perujuk). Laporan ini dapat anda temukan pada menu sidebar bernama Acquitition (Akuisisi) >> All Traffic (Semua Lalu Lintas).

laporan situs perujuk yang terindikasi spam

Sharma menyarankan agar periode laporan yang digunakan dua bulan belakang. Misal anda melihat data analytics di tanggal 8 Desember 2016, maka periode pengumpulan data yang anda tayangkan adalah dari 1 Oktober 2016 hingga 8 Desember 2016. Dengan mengatur periode pengumpulan data seperti itu maka anda akan melihat situs perujuk yang merupakan spam.

Gambar diatas merupakan contoh spam referal yang saya dapatkan di laporan google analytics milik saya.

Setelah mengatur periode pengumpulan data, anda melakukan sortir di kolom Bounce Rate (Rasio Pentalan). Situs referal yang mempunyai rasio 100%, 0% dengan jumlah sesi 10 atau lebih adalah situs spam yang merusak data Google Analytics anda.

Buat daftar situs spam yang memenuhi kriteria diatas. Cara mudahnya adalah dengan mengunduh data tersebut langsung dari tampilan laporan yang anda buka.

Setelah anda membuat daftar dari situs-situs spamming di data google analytics langkah selanjutnya adalah membuat filter yang akan menolak fake hit yang dikirim situs spam tersebut ke akun GA.

Caranya adalah dengan melakukan filtering.

Cara Menghilangkan Spam di Laporan Google Analytics

Ada banyak kegunaan menu filter di Google Analytics. Salah satunya adalah memisahkan data dan kemudian menyaring data tersebut untuk keperluan yang kita tetapkan sendiri. Dalam konteks pembahasan kali ini Sharman memberikan panduan untuk memisahkan dan menghilangkan situs-situs spam yang membuat data analytics menjadi tidak valid.

 

  1. Buat salinan dari All Website Data (Semua Data Situs)
  2. masuk ke tab admin lalu klik pengaturan View
  3. Klik salin (copy View)
  4. Buat judul view “nama blog + test view” lalu klik tombol biru create view
  5. Balik lagi ke tab Admin lalu klik Filter
  6. Klik tombol Buat Filter Baru
  7. Buat Filter Exclude yang baru dan tempelkan daftar situs spam yang anda dapatkan
  8. Klik Verifikasikan Filter lalu klik tombol Simpan
  9. Jika filter ini berhasil menyaring Spam anda aplikasikan di filter utama
Saya sendiri melewati satu langkah yang telah disampaikan oleh Sharman. Langkah tersebut adalah membuat regular expression atau regex. Dalam contoh yang ada di situs optimize smart Sharman memberikan contoh begini.

Ini daftar spam yang terdapat di laporan referal (situs perujuk) yang didapat dalam akun google analytics optimize smart

Dari daftar tersebut Sharman membuat regular expression yang akan ia pakai untuk filtering nantinya. semalt.com, semalt.semalt.com, buttons-for-website.com, blackhatworth.com, 7makemoneyonline.com.
Begini bentuk regex dari daftar diatas,
semalt|buttons|blackhatworth|7makemoneyonline(.com)+
Keliatannya mudah, akan tetapi dari daftar yang saya sudah kumpulkan dari data yang terdapat di akun Google Analytics saya menemukan beragam TLD. Contoh yang diberikan oleh Sharman hanya situs dengan ekstensi .com, sedangkan daftar yang saya punyai mempunyai beragam ekstensi TLD mulai dari .com, .net, .org hingga domain aneh sepert gq, ml, cn, dan lain-lain.
Oleh karena itu tulisan tentang cara mengenali dan menghilangkan spam di Laporan Google Analytics ini masih sangat jauuuh dari sempurna. Mungkin membutuhkan waktu beberapa minggu karena regular expression ini butuh waktu untuk mempelajarinya.

footnote:

  1. Sending data to google analytics
  2. Guide to removing referer spam and fake traffic in Google Analytics
Advertisements

Tinggalkan Balasan