[Seri Kuantitatif] Ternyata, Tidak Semua Random Sampling Adalah 'Random'
Saya sering mendengar orang bilang ini samplingnya sudah random. Akan tetapi setelah dikulik-kulik, ternyata bukan benar-benar 'random sampling'. Apa maksudnya?
Kita mulai dengan contoh berikut:
Rambo, seorang researcher aplikasi X, ingin mencari tahu berapa banyak penggunanya yang sudah tahu fitur baru aplikasi tersebut.
Diapun mengirim survey ke 10.000 penggunanya. Sepuluh ribu orang ini dipilih secara capcipcup saja dari total 1 juta penggunanya. Rambo yakin ini sudah cukup random.
Setelah selesai, Rambo melaporkan bahwa 75% penggunanya aware terhadap fitur baru tadi.
Pernah ada yang seperti Rambo?
Sebenarnya, Rambo tidak bisa langsung bilang bahwa 75% penggunanya aware terhadap fitur baru tadi karena sampelnya belum tentu mewakili populasi. Hal ini karena pengambilan sampelnya bukan random sampling.
Hah kok ga bisa? Kok bukan random, kan uda pilih-pilih acak capcipcup.
Agar lebih jelas, kita bahas dua jenis cara pengambilan sampel: random sampling (probability sampling) dan non-probability sampling.
Random sampling (Probability sampling)
Sederhananya, random sampling itu memilih partisipan survey di awal secara acak. Dengan begitu, semua orang punya kesempatan yang sama untuk mengisi survey - jadi semua tipe orang akan terwakili.
Maka, hasilnya akan bisa menunjukkan kondisi di kehidupan nyata.
Ada dua cara yang biasa dipakai untuk melakukan random sampling:
Skip numbers - Urutkan daftar pengguna (mis. berdasarkan abjad). Lalu, kita tentukan nomor urut pertama dan jumlah jeda per partisipan (mis. mulai dari nomor urut 3 dan jeda 5). Misalnya, maka partisipan yang akan dipilih adalah nomor urut 3, 8, 13, 18, 23, dst.
Randomized numbers - Setelah membuat daftar pengguna dengan nomor urut seperti sebelumnya, lalu buat angka acak memakai excel (=randbetween). Angka-angka yang keluar adalah adalah nomor urut partisipan yang akan kita kirimi survey.
Non-probability sampling
Kalau ini, researcher mencari partisipan ‘seketemunya’ - selama sesuai kriteria.
Karena ‘seketemunya’, bisa jadi survey hanya diisi oleh segmen tertentu.
Makanya, hasilnya belum tentu sesuai kondisi di kehidupan nyata.
Biasanya teknik ini hanya akan dipakai untuk research kuantiatif bila:
Kita tidak punya daftar calon partisipan untuk dilakukan randomisasi.
Kita sudah punya proporsi tiap kriteria di populasi. Asumsinya, bila disamakan begitu maka hasilnya akan mendekati populasi. Misal: Pria-wanita = 50:50, 25-35 vs 36-45 = 50:50.
Jumlah pengguna masih relatif kecil sehingga variasi tipe penggunanya belum terlalu banyak, jadi aman untuk memakai non-probability sampling saja.
Untuk ini, ada dua cara juga yang biasa dipakai:
Convenience sampling - ini mencari partisipan dari yang paling mudah diakses oleh researcher. Contohnya, ingin mencari partisipan anak-anak, maka datangi SD dekat rumah.
Snowballing - caranya adalah dengan meminta bantuan partisipan yang sudah direkrut untuk dikenalkan ke kenalannya yang sesuai kriteria agar dapat jadi partisipan juga.
Jadi, untuk memastikan hasil surveynya menggambarkan populasi, kita perlu memakai random sampling yang bukan asal capcipcup tapi ada mekanisme randomisasi tertentu.
Kalau dari contoh Rambo, terlihat bahwa ada kemungkinan partisipan surveynya itu hanya dari segmen tertentu saja - misalnya, hanya orang yang buka aplikasi setiap hari.
Maka, yang bisa disimpulkan dari survey Rambo adalah: 75% ORANG YANG ISI SURVEY menyatakan bahwa tahu tentang fitur baru dari aplikasi X. (belum tentu semua pengguna)
Apakah ada yang pernah melakukan hal yang sama seperti Rambo? Ceritakan di komen ya.