Ilmu Statistik dan manfaatnya dalam kehidupan sehari hari

Statistik merupakan salah satu cabang dari ilmu matematika, yang berkaitan dengan pengolahan sekumpulan data. Berdasarkan www.amstat.org definisi statistik adalah “Statistics is the science of learning from data, and of measuring, controlling, and communicating uncertainty; and it thereby provides the navigation essential for controlling the course of scientific and societal advances (Davidian, M. and Louis, T. A., 10.1126/science.1218685)” Jadi statistik adalah ilmu pengetahuan tentang data yang mencakup pengumpulan data, mengklasifikasian data, meringkas, mengorganisir, menganalisis data, serta menafsirkan informasi numerik yang dikandung data sehingga menjadi informasi yang bermanfaat.

Statistik digunakan dalam berbagai disiplin ilmu yang berbeda (baik ilmiah dan non-ilmiah) untuk membuat keputusan dan menarik kesimpulan berdasarkan data.

Sebagai contoh:

  • Dalam industri farmasi, sebuah perusahaan Farmasi ingin mengetahui apakah obat baru yang mereka temukan lebih ampuh dari obat lama atau tidak, sehingga apabila hasilnya lebih baik maka mereka akan segera melauncingnya ke pasar. Untuk mengetahui tingkat kemanjuran obat baru tersebut maka mereka dapat berkonsultasi dengan ahli statistik, yang dapat membantu mereka untuk menganalisis kemanjuran obat tersebut melalui serangkaian percobaan. Statistikawan akan melakukan suatu analisis efek obat berdasarkan data yang dikumpulkannya dari beberapa sampel dan menggeneralisasi  hasil dari temuannya. Jika obat gagal untuk mengurangi gejala negatif atau dengan kata lain keampuhannya tidak lebik dari obat lama maka perusahaan tidak perlu melauncing obat baru tersebut.
  • Dalam bisnis, manajer seringkali harus memutuskan target konsumen manakah yang memiliki potensi yang besar untuk produk yang mereka tawarkan. Untuk menetapkan target konsumen maka mereka terlebih dahulu harus mengklasifikasikan berbagai konsumen mereka menjadi beberapa kelas atau golongan (segmentasi). Selanjutnya dianalisis segmen mana yang paling potensial untuk produk mereka. Setelah manajer mengetahui segmen potensialnya selanjutnya dia akan melakukan targeting yaitu yaitu dengan memilih target konsumen yang menjadi pilihan.  Misalnya , sebuah perusahaan kartu kredit harus menilai seberapa berisiko pelanggan potensial . Di dunia kredit , risiko sering diukur dengan mengukur kemungkinan bahwa seseorang akan lalai dalam membayar tagihan kartu kredit mereka . Ini jelas merupakan tugas yang rumit karena kita memiliki informasi yang terbatas tentang kecenderungan individu untuk tidak membayar tagihan mereka . Untuk mengukur risiko , manajer sering merekrut ahli statistik untuk membangun model statistik yang memprediksi kemungkinan seseorang akan lancar atau tidak dalam membayar tagihan mereka . Manajer kemudian dapat menerapkan model tersebut  kepada pelanggan potensial untuk mengurangi risiko,  yaitu dengan hanya menawarkan kredit hanya kepada suatu kelompok konsumen terstentu saja.

 Untuk contoh yang lebih konkret, Misalnya sesorang bernama Dave, perlu menurunkan berat badannya. Dave menduga bahwa cara terbaik baginya untuk menurunkan badannya tersebut adalah melalui diet atau melakukan  latihan rutin. Seorang konselor kesehatan yang  telah  di sewa oleh dave menyarankan untuk memilih salah satu dari empat pilihan program diet berikut :

  1. Diet model atkin
  2. Diet model south beach
  3. Diet dengan cara  mengurangi asupan kalori (reduced calori)
  4. Boot Camp, yaitu dengan latihan pisik rutin yang sangat keras.

Dave memahami bahwa dengan menggunakan data-data  yang tercakup pada masing-masing program diet  dalam pengambilan keputusannya dapat memberikan wawasan tambahan yang bermanfaat, si dave  memutuskan untuk menganalisis beberapa kecenderungan dari histori data tingkat penurunan bobot individu dari beberapa program diet yang dianjurkan oleh konselor kesehatannya. Berikut data-data  penurunan bobot untuk masing-masing individu  yang telah melakukan program  diet tersebut selama periode delapan minggu.

Berat
Diet 1 2 3 4 5 6 7 8
Atkins 310 310 304 300 290 285 280 284
Sout Beach 310 312 308 304 300 295 290 289
Reduced Calori 310 307 306 303 301 299 297 295
Boot camp 310 308 305 303 297 294 290 287

Berdasarkan angka-angka ini,program  Diet mana yang sebaiknya diambil Dave?

Bagaimana jika tujuan Dave adalah untuk menurunkan berat badan yang paling besar? Atkins diet akan tampak seperti pilihan yang wajar karena ia akan kehilangan bobot paling besar pada akhir periode delapan minggu. Namun, sifat protein tinggi diet mungkin tidak menarik bagi Dave. Juga, Atkins tampaknya memiliki beberapa pasang surut dalam penurunan berat badan (lihat minggu 7 sampai minggu 8). Bagaimana jika Dave ingin menurunkan berat badan dengan cara yang stabil dan mantap? Maka mungkin boot camp akan menjadi pilihan Dave karena data menunjukkan penurunannya  mantap dan stabil dalam penurunan berat badan

Ada dua jenis statistik yang sering disebut ketika membuat keputusan, yaitu Statistik Deskriptif dan Inferensia.

Statistik Deskriptif: Statistik deskriptif menggunakan metode numerik dan grafis untuk mencari pola dalam data, untuk meringkas informasi yang terungkap dalam kumpulan data, dan menyajikan informasi dalam bentuk yang nyaman, selanjutnya dapat digunakan untuk membuat keputusan. Tujuan utama dari statistik deskriptif adalah untuk menjelaskan suatu kumpulan data. Dengan demikian, kelas statistik deskriptif meliputi langkah-langkah numerik (misalnya mean atau median) dan menampilkan grafis dari data (mis. pie chart atau grafik batang).

Statistik inferensial: statistik inferensial menggunakan data sampel untuk membuat estimasi, keputusan, prediksi, atau generalisasi tentang satu set data yang lebih besar. Beberapa contoh statistik inferensial mungkin z statistik atau t-statistik.

  1. Statistik Deskriptif

Dave dapat menggunakan beberapa statistik deskriptif  untuk lebih memahami pola makannya dan barangkali ada informasi bermanfaat yang dapat dia terapkan untuk  mengubah  kebiasaan diet nya. Tabel di bawah ini menampilkan isi kalori dari makanan yang telah dimakan Dave pada minggu terakhir.

Hari Sarapan kalori Makan siang Kalori Makan malam kalori Snack Kalori
Minggu Kopi 200 Makan pizza 1200 Makanan sisa 1000 3 soda 300
Senin Sepiring protein 175 Salad 375 Makanan Beku 275 3 soda 300
Selasa 0 Super burrito 750 Makanan beku 300 3 soda 300
Rabu Buah-buahan 200 Salad 375 Makanan beku 300 3 soda 300

Informasi apa yang bisa dipetik dari log asupan kalori diatas? Hal paling sederhana yang harus dilakukan adalah dengan melihat  total kalori yang dikonsumsi setiap hari. Total ini ditunjukkan di bawah ini.

Hari Total harian kalori
Minggu 2700
Senin 1125
Selasa 1350
Rabu 1175

Informasi  apakah yang dapat diambil dari tabel diatas?

  • Hari dengan konsumsi kalori paling banyak adalah  hari Minggu.
  • Menikmati tiga soda per malam, akan menyumbang sekitar 20% dari kalori Dave setiap harinya (kecuali di hari Minggu).
  • Dave cenderung memiliki kalori yang lebih tinggi di waktu makan siang pada hari-hari ketika dia melewatkan sarapan (atau hanya memiliki kopi).

Poin ketiga diatas adalah cukup menarik untuk  dianalisis. Ketika Dave melewati sarapannya maka makan siang secara signifikan lebih tinggi dalam asupan kalorinya dari pada hari-hari yang dia melakukan sarapan.  Berdasarkan data-data ini Dave dapat mengambil suatu informasi yang cukup jelas – ia harus memulai setiap hari dengan sarapan yang sehat karena ini menghindari asupan kalori yang tinggi di waktu makan siang yang secara keseluruhan akan menghindari penambahan jumlah asupan kalori per hari.

  1. Statistik Inferensial

Tujuan utama dari statistik inferensial adalah untuk membuat kesimpulan tentang populasi berdasarkan dari sampel data dari populasi itersebut. Salah satu yang paling umum digunakan dalam teknik inferensial adalah pengujian hipotesis.

Definisi kunci
Satuan Eksperimental: Sebuah objek pada data yang dikumpulkan.
Populasi: Satu set unit yang menarik untuk belajar.
Variabel: Karakteristik atau milik unit eksperimental individu.
Contoh: Sebuah subset dari unit populasi.

Apa yang dimaksud dengan hipotesis statistik? Hipotesis adalah pendugaan tentang hubungan antara dua (atau lebih) variabel. Sebagai contoh, perhatikan pertanyaan yang akan menjadi penting untuk seorang CEO sebuah  Perusahaan sepatu lari: Apakah seseorang pelari marathon memiliki kesempatan yang lebih baik dalam  menyelesaikan maratonnya jika mereka memakai sepatu merek perusahaannya daripada jika mereka memakai merek pesaing? Maka Hipotesis dari CEOnya menjadi : pelari yang mengenakan sepatu dari perusahaannya akan memiliki kesempatan yang lebih baik dalam menyelesaikan balapan semenjak dia menggunakan sepatu tersebut. Setelah hipotesis terbentuk, mekanisme selanjutnya adalah melakukan uji dari hipotesis tersebut. Langkah pertama adalah mendefinisikan variabel. Ada beberapa  jenis variabel, diantaranya  yaitu  variabel dependen dan variabel independen.

Definisi
Dependent Variable: Variabel yang mewakili efek yang sedang diuji
Variabel Independen: Variabel yang mewakili masukan untuk variabel dependen, atau variabel yang dapat dimanipulasi untuk melihat apakah mereka penyebabnya.

Dalam contoh ini, variabel dependen adalah apakah seorang individu pelari  mampu menyelesaikan maraton. Sedangkan variabel independennya  adalah merek sepatu yang mereka kenakan, merek CEO atau merek yang berbeda.

Variabel ini akan dioperasionalkan dengan mengadopsi ukuran  variabel dependen (Pelari yang  menyelesaikan maraton) dengan mengadopsi ukuran untuk jenis sepatu yang mereka kenakan (jika mereka memakai merek CEO ketika mereka berlari balapan).

Setelah variabel dioperasionalkan dan data dikumpulkan, selanjutnya adalah memilih uji statistik untuk mengevaluasi data-data. Dalam contoh ini, CEO mungkin membandingkan proporsi pelari  yang menyelesaikan maraton yang mengenakan sepatu CEO terhadap proporsi yang menyelesaikan maraton yang mengenakan merek yang berbeda. Jika CEO hipotesis benar (bahwa memakai sepatu merek CEO membantu untuk menyelesaikan maraton) maka orang akan berharap bahwa tingkat penyelesaian akan lebih tinggi bagi mereka yang memakai merek CEO dan uji statistik akan mendukung hal tersebut.

Karena tidak realistis untuk mengumpulkan data pada setiap pelari dalam perlombaan, pilihan yang lebih efisien adalah dengan mengambil sampel pelari dan mengumpulkan pengukuran dependen dan independen pada mereka. kemudian melakukan uji inferensial pada sampel dan (dengan asumsi uji  telah dilakukan dengan benar) menggeneralisasi kesimpulannya untuk seluruh total individu dari pelari maraton.

Ada beberapa perbedaan dari deskriptif dan inferensial yang dapat kita soroti dalam menentukan langkah kunci dari permasalahannya, yaitu:

Elemen Masalah statistik deskriptif

1) Tentukan populasi (atau contoh)

2) Pilih variabel yang akan diselidiki

3) Pilih tabel, grafik, atau alat ringkasan numerik.

4) Mengidentifikasi pola dalam data.

Elemen Masalah  inferensial statistik
1) Mendefinisikan populasi
2) Pilih variabel yang akan diselidiki
3) Pilih sampel dari unit populasi
4) Jalankan uji statistik pada sampel.
5) Generalisasi hasil untuk populasi dan menarik kesimpulan.

sameyadi

Leave a Reply

Your email address will not be published. Required fields are marked *