Wah gimana nih, kok judulnya kali ini malah ngajarin bagaimana caranya bohong dengan statistik????
"How to Lie with Statistics" adalah buku karangan Darrel Huff tahun 1954, lalu diterjemahkan ke dalam Bahasa Indonesia menjadi "Berbohong dengan Statistik" oleh J. Soetikno Pr. dan Christina M. Udiani pada tahun 2002.
Yeah, right!! Ini adalah buku yang umurnya sudah sangat tua!! Bahkan seumuran dengan ayah saya!! Tapi teman, sampai saya menuliskan artikel ini, jika kita menuliskan kata "berbohong dengan " di google, maka secara otomatis suggestion yang muncul paling atas alias nomor 1 adalah "berbohong dengan statistik". Disusul saran berikutnya barulah "berbohong dengan menyebut nama allah"
Ahhh, itu kan orang Indonesia yang seringnya dan sukanya mengarang data min!
Waitsss.. ketika Anda memasukkan kata pencarian di google "how to lie ", maka secara otomatis yang muncul sebagai suggestion pertama kali adalah "how to lie with statistics"
Tentu ini bukanlah sebuah kebetulan belaka.
Kecil kemungkinan kedua hal ini terjadi karena kesalahan dari google.
Prediksi saya adalah memang banyak kasus yang selama hanyalah kebohongan!!!
Ketika saya membaca buku Darrel Huff ini, saya merasa bahwa mungkin benar selama ini apa yang disajikan semuanya "hanyalah sebuah kebohongan statistik" belaka..
Contoh sederhana terkait sebaran data mean, median, modus yang sudah diajarkan sejak kita duduk di bangku sekolah dasar. Tentu Anda semua sudah paham benar arti dan makna dari ketiga hal tersebut bukan?
Mean atau yang sering kita sebut rata-rata merupakan penjumlahan dari semua data yang ada dibagi dengan jumlah data dimiliki. Contoh data berat badan 5 orang adalah 65, 30, 72, 65, 55. Berdasarkan data yang dimiliki maka diketahui rata-rata adalah 57.4 (diperoleh dari [65+30+72+65+55]÷5)
Median atau yang sering kita sebut nilai tengah. Karena yang dicari adalah nilai yang posisinya berada tepat di tengah, maka data-data tersebut harus diurutkan terlebih dahulu!! Berdasarkan contoh yang sama, mari coba kita urutkan menjadi 30, 55, 65, 65, 72 karena jumlah data kita adalah lima, maka data ke-3 adalah data yang tepat berada di tengah. Maka median dari data kita adalah 65.
Modus adalah data yang paling sering muncul atau jika menggunakan bahasa ilmiah maka data yang memiliki frekuensi terbesar. Masih menggunakan contoh yang sama, maka dengan mudah kita menentukan modus data adalah 65 karena 65 muncul sebanyak 2 kali sedangkan yang lainnya hanya muncul 1 kali.
Nah, pertanyaannya sekarang dalam menggambarkan kondisi nyata sehari-hari:
Kapan mean digunakan?
Kapan median digunakan?
Kapan modus digunakan?
Kakak saya pernah dan sering bertanya apa pentingnya belajar ini dan itu di sekolah klo tidak bisa diterapin di kehidupan sehari-hari, kali ini saya ajak kita semua mikir!! Kapan dan dimana sebaran data ini berfungsi di kehidupan nyata kita?? Betapa pentingnya pelajaran ini sehingga ditanamkan sejak SD namun hingga tua masih saja banyak diantara kita yang mung kin tertipu oleh statistik sederhana ini.
Saya berikan contoh lagi ya teman..
Bayangkan, Anda adalah seorang freshgraduate dari universitas terkenal dengan akreditasi terbaik di Indonesia. Anda adalah lulusan terbaiknya!! Lalu secara tidak sengaja, Anda menemukan lowongan yang sesuai dengan diri Anda dan di kolom lowongan tersebut ada tambahan keterangan "Jika Anda bergabung dengan kami, rata-rata pendapatan di perusahaan kami adalah 15 juta per bulan" (just info, UMK Surabaya tahun 2018 adalah Rp 3.583.312,-)
Wow, tawaran yang menggiurkan bukan? Mata Anda langsung terbuka lebar pada kata-kata "RATA-RATA 15 JUTA PER BULAN"
Dengan semangat perjuangan '45, Anda pun mendaftarkan diri dan secepat kilat Anda diterima bekerja di perusahaan tersebut. Ternyataaaaaaaa.... di bulan pertama, gaji Anda sebesar 5 juta rupiah.
Yah, benar HANYA lima juta rupiah!!
Loh, apa yang salah????
Katanya rata-rata 15 juta? Kok Anda cuma dapat 5 juta?
Teman, coba tengoklah kembali definisi yang sudah saya tuliskan di atas!
Rata-rata adalah hasil penjumlahan semuanya, termasuk gaji manager, direktur bahkan security sekalipun.
Maka, dalam kasus ini apakah mean relevan digunakan???
Jika mean tidak relevan, maka apakah yang lebih tepat digunakan? Median atau modus?
Ketika kita menggunakan median, maka sebenarnya kita ingin menyampaikan bahwa ada 50% orang yang pendapatannya di bawah Anda, dan ada 50% juga orang yang pendapatannya di atas Anda.
Ketika kita menggunakan modus, maka data yang akan Anda sampaikan hanyalah sebagian besar orang-orang berpendapatan X, mungkin Anda seperti mereka jika posisi yang Anda lamar adalah sama dengan mereka.
Teman, kembali pada cuplikan kata-kata diatas "RATA-RATA 15 JUTA PER BULAN", apakah data ini salah??? Kecil kemungkinan ini salah, saya meragukan perusahaan berani memalsukan angka 15 juta tersebut. TETAPI yang perlu Anda dan saya garis bawahi adalah kata RATA-RATA!!!
~ITULAH YANG DISEBUT "BERBOHONG DENGAN STATISTIK"~