Inisiasi 1
Pengertian Data dan Statistik
Data dan statistik mempunyai hubungan yang sangat erat.
Selain itu, keduanya juga mempunyai hubungan yang sangat erat dengan kehidupan
manusia sehari-hari, dengan bidang ilmu pengetahuan, baik yang eksakta, sosial,
ekonomi, bisnis dan lain-lain. Data dan statistik serta fungsi keduanya, banyak
memberikan kegunaan yang sangat tidak ternilai bagi manusia, bagi kita semua.
DATA, KEGUNAAN
DAN FUNGSINYA
Anda sebagai individu, seorang manajer, atau mungkin
seorang pengusaha, menginginkan untuk:
v Mengetahui
siapa saja yang akan pensiun tahun depan, dari bagian mana, apa jabatannya,
berapa pesangon yang akan didapat, dan sebagainya. Tujuannya adalah antara
lain:
·
Mempersiapkan dana, berapa besarnya untuk pembayaran pesangon
mereka.
·
Mempersiapkan penerimaan karyawan baru untuk mengganti
karyawan yang bakal pensiun tersebut (walaupun tidak semua).
Untuk
maksud tersebut, Anda memerlukan data berupa data pegawai, yang mungkin cukup
didapat dari dalam perusahaan sendiri.
v Mengetahui
tingkat kepuasan konsumen produk yang anda pasarkan, bagaimana respon mereka
terhadap mutu produk Anda, harga, pelayanan dan sebagainya. Untuk inipun, Anda
perlu data, malah mungkin data tersebut perlu dikumpulkan di lapangan melalui
survei (terlepas dari apakah dilakukan sendiri atau dengan membayar lembaga
riset yang Anda percayai).
v Mengetahui
apakah proses produksi saat ini masih terkendali atau tidak. Berapa persen dari
produksi yang tertolak karena dianggap cacat, lengkap dengan perinciannya per
mesin, per lokasi, kapan, mengapa dan lain-lain. Untuk inipun, Anda memerlukan
data (yang didapat dari bagian produksi).
v Mengetahui
perkembangan perekonomian (trend) untuk jangka waktu tertentu, pertumbuhan
penduduk penduduk, pendapatan nasional dan sebagainya . Termasuk juga
mengetahui faktor-faktor atau variabel
yang mempengaruhi pertumbuhan ekonomi.
Dari contoh-contoh tersebut diatas, kita mengetahui
betapa pentingnya data. Dengan data, kita mengetahui gambaran perusahaan
sekarang, masalah apa yang sedang dihadapi, mengapa terjadi masalah-masalah
tersebut, bagaimana cara pemecahannya. Dengan data, kita dapat meramal atau
memperkirakan, apa yang kira-kira bakal terjadi di masa mendatang. Dengan data,
kita pun bisa membuat perencanaan, peramalan, mengontrol pelaksanaan,
mengevaluasi target apakah tercapai atau tidak, dan sebagainya. Dengan adanya
data, kita dapat banyak mengetahui tentang berbagai hal. Dengan data, kita bisa
mengambil keputusan-keputusan, kebijakan-kebijakan perusahaan, dan sebagainya.
Pendeknya, fungsi dan manfaat data sangat penting dan banyak sekali. Sering
kali, akan berbahaya jika kita mengambil kesimpulan dan keputusan tanpa
didukung oleh data. Orang bilang ”Speak
with data”, berbicaralah dengan data agar objektif dan lebih akurat. Sebenarnya
apa itu data?
PENGERTIAN DATA
DAN PENGGOLONGANNYA
Dari uraian di atas, sebenarnya data adalah kumpulan
keterangan atau informasi yang diperoleh dari suatu pengamatan, dapat berupa
angka, lambang atau sifat. Jika kita mendapatkan data yang tidak baik, sebaik
apa pun cara pengolahan data yang kita lakukan, hasilnya atau kesimpulan yang
didapat dari data tersebut tetap tidak baik. Semisal, ungkapan ”garbage in, garbage out”, yang artinya
jika yang masuk sampah, yang keluar pun juga sampah. Jadi, syarat utama agar
analisa data secara statistik menghasilkan informasi atau kesimpulan yang baik
adalah data yang diolah haruslah juga baik.
Apa itu data yang baik? Data yang baik
adalah data yang sifatnya representatif (mewakili), objektif (sesuai dengan apa
yang ada atau yang terjadi), relevan (ada hubungannya dengan persoalan yang
sedang dihadapi dan akan dipecahkan), mempunyai tingkat ketelitian yang tinggi
atau standard error (kesalahan baku) yang kecil.
Dari mana data diperoleh? Data dapat
diperoleh dari sumber internal (internal
data) dan sumber eksternal (external
data). Data internal adalah data yang didapat oleh organisasi itu sendiri
untuk keperluan operasi sehari-hari. Organisasi dimaksud dapat berupa instansi
pemerintah maupun swasta, misalnya departemen-departemen, Biro Pusat Statistik,
BAPPENAS, BUMN, perusahaan-perusahaan swasta dan sebagainya. Sedangkan, data
eksternal adalah data yang didapat dari luar organisasi yang bersangkutan,
biasanya menggambarkan keadaan di luar organisasi tersebut. Contoh data jenis
ini misalnya data pendapatan nasional, penduduk, harga-harga bahan pokok yang
dukumpulkan oleh Biro Pusat Statistik, data keuangan negara yang dikumpulkan
oleh departemen keuangan, data perbankan dari Bank Indonesia dan sebagainya,
termasuk data yang dikumpulkan oleh badan-badan internasional, seperti UNESCO,
IMF, FAO dan lain-lain.
1. DATA
KUANTITATIF DAN DATA KUALITATIF
v DATA KUANTITATIF
Banyak
data yang berbentuk angka atau bilangan, misalnya luas tanah, jumlah penduduk
dan sebagainya. Untuk jenis data ini dapat dilakukan perhitungan-perhitungan
atau operasi matematika, seperti penambahan, pengurangan, perkalian, pembagian
dan sebagainya. Data kuantitatif nilainya bisa berubah-ubah sehingga disebut variabel.
Data kuantitatif dapat dibagi
atas:
·
Data
Interval
Ukuran
data mempunyai interval atau jarak, misalnya berat badan antara 50-60 kg.
·
Data
Rasio
Data
berupa angka dalam arti yang sebenarnya, sehingga mempunyai nilai nol.
Data
jenis ini diperoleh melalui pengukuran dan memiliki tingkat pengukuran paling
tinggi diantara jenis data lainnya.
v DATA KUALITATIF
Data
kualitatif adalah data yang bukan berbentuk angka atau bilangan, misalnya
kepuasan pelanggan (sangat puas, puas, kurang puas dan sebagainya), sehingga
kita tidak dapat melakukan operasi matematika terhadapnya. Jenis data ini disebut atribut.
Data kualitatif dapat dibagi
atas:
·
Data nominal
Ukuran
data nominal adalah kategori, misalnya jenis kelamin, laki-laki atau wanita,
tempat tinggal dan sebagainya. Dilihat dari tingkat pengukuran data, data
nominal mempunyai tingkatan yang paling rendah dari jenis data lainnya. Hal
tersebut karena walaupun dalam prakteknya data ini bisa diangkakan, tetapi
terhadapnya tidak bisa dilakukan operasi matematika. Contoh pemberian angka
tersebut di atas misalnya, angka ’1’ untuk yang tinggal di Jakarta, ’2’ untuk
yang tinggal di Bandung, ’3’ untuk Surabaya dan sebagainya.
·
Data
Ordinal
Data
ordinal hampir sama dengan data nominal, hanya saja data orrdinal mempunyai
tingkatan data atau urutan kelas, ada yang lebih tinggi ada yang lebih rendah.
Contoh data ini adalah data tentang kepuasan pelanggan, yang dibagi menjadi
sangat puas, tidak puas, antara puas dan tidak puas, tidak puas dan sangat
tidak puas. Data ordinal mempunyai tingkatan yang lebih tinggi dari data
nominal. Walaupun mempunyai tingkatan, terhadap jenis data ini kita tetap tidak
dapat melakukan operasi matematika.
Dilihat
dari tingkat data, urutan dari yang paling tinggi adalah data rasio, data
interval, data ordinal dan paling rendah data nominal.Untuk mengolah data
kualitatif (data nominal dan ordinal), biasanya digunakan statistik non
parametrik, sedangkan untuk data kuantitatif digunakan statistik parametrik.
2. DATA INTERNAL DAN DATA EKSTERNAL
·
DATA
INTERNAL
Data
yang berasal dari dalam organisasi atau perusahaan sendiri. Data jenis ini
biasanya berkaitan langsung dengan organisasi sendiri, misalnya data keuangan
(neraca, laporan laba-rugi dan sebagainya), data kepegawaian, data produksi dan
lain-lain.
·
DATA
EKSTERNAL
Data
yang berasal bukan dari dalam organisasi perusahaan sendiri. Data ini sering
tidak berkaitan langsung dengan organisasi sendiri, misalnya data tentang
jumlah kendaraan di Jakarta, jumlah penduduk di suatu desa dan lain-lain.
3. DATA PRIMER DAN DATA SEKUNDER
·
DATA
PRIMER
Data
yang dukumpulkan, diolah serta diterbitkan sendiri oleh organisasi yang
menggunakannya. Contoh jenis data ini adalah data kependudukan yang dibuat oleh
Biro Pusat Statistik, data tentang pertanian yang dibuat oleh Departemen
Pertanian dan sebagainya.
·
DATA
SEKUNDER
Data
yang tidak dibuat atau diterbitkan oleh penggunanya, misalnya data tentang
jumlah kendaraan dari Departemen Perhubungan merupakan data primer bagi
Departemen tersebut karena dibuat dan diterbitkannya, tapi merupakan data
sekunder bagi PT X sebagai pengguna, yang mendapatkannya dari sumber lain
(misalnya media massa) yang mengutipnya. Jadi, orang bisa mendapatkan data
sekunder dari harian, majalah, buletin dan media massa lainnya yang mengutip
data dari sumber-sumber lain yang menerbitkannya (misalnya data dikutip dari
departemen, Biro Pusat Statistik, Bank Indonesia dan lain-lain). Dengan
demikian, data eksternal bisa berupa data primer, bisa juga berupa data
sekunder.
4. DATA DISKRIT DAN DATA KONTINYU
Seperti telah dikatakan di muka, data kuantitatif disebut
variabel, karena nilainya atau besarnya bisa berubah-ubah, data ini dapat
mempunyai variabel diskrit sehingga disebut data diskrit, dapat juga mempunyai
variabel kontinyu atau indiskrit dan disebut dengan data kontinyu.
Data diskrit adalah data
yang sifatnya terputus-putus, nilainya bukan merupakan pecahan (angka
utuh). Sedangkan data kontinyu adalah data yang
sifatnya sinambung atau kontinyu, nilainya bisa berupa pecahan. Contoh data
diskrit adalah data tentang jumlah penduduk, kendaraan dan sebagainya,
sedangkan contoh data kontinyu adalah data tentang hasil panen padi, panjang
jalan, berat sapi dan sebagainya.
Gambar
I. Jenis Data
sumber:
Kuncoro, 2001:24
Statistik atau statistika adalah ilmu yang berhubungan
dengan cara pengumpulan, pengolahan atau analisis, penyajian data dan cara
pengambilan kesimpulannya. Fungsi utamanya adalah membantu dalam pengambilan
keputusan dan keputusan tentang parameter populasi dengan menggunakan data
sampel yang diambil dari populasi tersebut.
PENGGOLONGAN
STATISTIK
Statistik dapat digolongkan dengan berbagai cara.
STATISTIK
DESKRIPTIF DAN INDUKTIF (INFERENSI)
·
STATISTIK
DESKRIPTIF
Statistik
Deskriptif berusaha menjelaskan atau menggambarkan berbagai karakteristik data,
seperti berapa rata-ratanya, seberapa jauh data bervariasi dan sebagainya,
tanpa membuat interpretasi apa-apa terhadap data tersebut.
·
STATISTIK
INDUKTIF (INFERENSI)
Statistik
Induktif berusaha membuat berbagai inferensi terhadap sekumpulan data yang
berasal dari suatu sampel. Tindakan inferensi tersebut misalnya melakukan
perkiraan, peramalan, pengambilan keputusan dan sebagainya.
STATISTIK
PARAMETRIK DAN NON PARAMETRIK
·
STATISTIK
PARAMETRIK
Statistik
Parametrik adalah statistik induktif untuk populasi yang parameternya telah
memenuhi persyaratan-persyaratan tertentu (misalnya, sebaran data mengikuti
distribusi normal)
·
SATISTIK
NON PARAMETRIK
Statistik
non parametrik adalah statistik induktif yang berusaha mengambil kesimpulan
tentang keseluruhan populasi yang parameternya tidak memenuhi persyaratan,
yaitu tidak mengikuti suatu distribusi tertentu. Jadi, statistik non parametrik
digunakan untuk populasi yang tidak menetapkan persyaratan-persyaratan
parameter populasinya.
PENGERTIAN DALAM
STATISTIK PENTING YANG PERLU DIPAHAMI: POPULASI, ELEMEN, SAMPLING DAN SAMPEL
Populasi adalah kumpulan semua elemen yang ada yang akan
diobservasi atau diteliti, sedangkan sampling adalah pengambilan sebagian kecil
dari seluruh elemen populasi tersebut yang dijadikan sebagai contoh atau sampel
yang dianggap dapat mewakili seluruh elemen dalam populasi. Sedangkan sampling
adalah cara pengumpulan data dengan mengambil sampel atau contoh dari seluruh
anggota populasi.
Misalkan, ada 100 orang murid kelas 3 di SMU Garuda.
Pimpinan Sekolah ingin melihat prestasi ujian matematika mereka pada tahun 2001
yang lalu dan untuk itu diadakan pencatatan nilai ujian dari setiap murid yang
berjumlah 100 murid tersebut satu per satu tanpa kecuali. Setiap murid tersebut
disebut elemen. Kumpulan dari 100
orang murid tersebut (seluruh elemen) disebut populasi dan pekerjaan untuk meneliti seluruh elemen yang terdapat
dalam populasi disebut sensus. Jika
untuk maksud tersebut, hanya diambil 20 murid saja sebagai contoh, hal tersebut
disebut sampling, dan contoh yang
diambil dinamakan sampel.
Jika data yang didapat dari sensus dinamakan data sebenarnya (true value), data yang
terdapat dari sampling merupakan data dugaan sehingga nilainya dinamakan nilai perkiraan (estimate value). Nilai
perkiraan tentunya tidak akan sama betul dengan nilai sebenarnya, tentu ada
selisih. Selisih ini disebut kesalahan
perkiraan (error estimate) atau kesalahan
sampling (sampling error) dan jika nilainya kecil, cara pengumpulan data
dengan sampling masih dapat dipertanggung-jawabkan.
Agar data yang diperoleh dari sampling mempunyai nilai
kepercayaan yang tinggi (valid) atau
nilai kesalahan perkiraannya sekecil mungkin, dalam pengambilan sampel kita
harus mengikuti metode pengambilan sampel yang baik (termasuk jumlah sampel
yang harus diambil), sesuai dengan keadaan populasinya. Ada berbagai macam
teknik sampling namun tidak akan dibahas di sini.(Silakan lihat Modul Metode
Penelitian)
Alasan-alasan mengapa kita menggunakan sampling:
·
Menghemat waktu, tenaga dan biaya.
·
Secara teknis, tidak mungkin mengamati seluruh anggota
populasi. Misalnya, meneliti seluruh jumlah ikan yang terdapat di suatu sungai,
meneliti seluruh jumlah kelelawar di suatu hutan, jumlah seluruh kendaraan di
suatu negara dan sebagainya.
·
Pengamatan terhadap seluruh anggota populasi dapat
bersifat merusak. Misalnya, pengaruh pemakaian narkoba terhadap kerusakan otak.
·
Contoh lain-lain yang bergantung pada pertimbangan
peneliti atau pengguna data.
Secara teoritis atau logika, hasil analisa atau
pengolahan data yang dihasilkan oleh sensus (harusnya) memberikan data yang sebenarnya (true value).
Sebaliknya, karena sampling hanya mengambil sebagian elemen saja yang ada dalam
populasi, hasil analisa datanya hanya merupakan perkiraan (estimate value). Mengingat alasan-alasan dan
pertimbangan-pertimbangan tersebut, khususnya oleh karena sensus biasanya
memerlukan biaya, tenaga dan waktu yang lebih banyak dibandingkan dengan
sampling, maka pada umumnya penelitian dilakukan hanya dengan cara sampling
saja, dengan catatan pelaksanaan sampling tersebut dilakukan dengan baik. Baik
dalam hal ini artinya, baik metode sampling maupun pelaksanaan pengumpulan
datanya dilakukan dengan benar dan cermat, sehingga perkiraan yang diperoleh
tidak banyak berbeda dari keadaan populasi yang sebenarnya.
Sampling yang baik pun tidak akan sempurna betul, selalu
ada ketidaksempurnaan atau kesalahan (sampling error). Untuk dapat mewakili
seluruh elemen dalam populasi harus diusahakan agar sampling dilaksanakan
dengan sebaik-baiknya sehingga kesalahan yang terjadi dapat sekecil mungkin.
Jadi, seperti halnya dalam sensus, dalam melakukan sampling pun, kesalahan selalu
dapat terjadi. Jika nilai sampling ternyata sama betul dengan nilai yang
sebenarnya seperti yang dilakukan pada sensus, hal tersebut hanya bersifat
kebetulan.
Berapa besarnya sampel agar didapat data yang baik
sehingga dapat mewakili suatu populasi? Untuk mengetahui berapa jumlah sampel,
biasanya digunakan rumus-rumus sebagai berikut :
|
E = Kesalahan atau error yang diizinkan
menyangkut ketelitian pendugaan.
Z = Nilai Z yang sesuai dengan interval keyakinan yang
digunakan, yaitu 1,96 untuk I.K = 95% dan 2,58 untuk I.K = 99%.
S = Deviasi standar dari pra-survey yang dilakukan dengan
sampel yang kecil untuk menduga deviasi standar populasi.
Untuk proporsi
|
P =
Estimasi atau perkiraan proporsi populasi
Z =
Nilai Z yang sesuai dengan interval keyakinan yang ditentukan
E =
Kesalahan (error) maksimum yang diizinkan
Kesalahan (error) yang diizinkan misalnya sebesar 5%,
berarti ketelitian yang diinginkan dalam pendugaan parameter populasi (interval
keyakinan) adalah sebesar 95% (100%-5%), dan jika error yang diizinkan sebesar
1%, berarti tingkat ketelitian (interval keyakinan) yang ingin dicapai sebesar
99% (100%-1%). Dengan demikian, besarnya sampel bergantung pada interval
keyakinan yang digunakan (error maksimum yang diizinkan) dan deviasi standar
atau estimasi proporsi populasi (ukuran sampel untuk proporsi). Jika deviasi
standar atau proporsi populasi belum diketahui, kita perlu mengadakan survey
pendahuluan dengan ukuran sampel yang kecil untuk menduga deviasi standar
populasi. Deviasi standar populasi dapat juga dilakukan berdasarkan pengetahuan
tentang populasi.
Perhitungan deviasi standar distribusi sampling harus
dikoreksi dengan faktor koreksi sebesar
Jika ukuran sampel (n) dibagi ukuran populasi (N) relatif
cukup besar, akan tetapi jika ukuran populasi besar sekali apalagi tak
terhingga atau ukuran populasi terbatas tapi relatif kecil,
faktor koreksi tidak diperlukan.
Dari rumus tersebut di atas, semakin tinggi interval
keyakinan maka semakin besar ukuran sampel yang dibutuhkan. Untuk lebih
jelasnya, jika kita ingin yakin 100% interval duga akan sama dengan parameter
populasi jumlah sampel yang harus diambil adalah seluruh populasi, ini berarti
sama dengan sensus.
PARAMETER DAN
SAMPLING ERROR
Seperti telah diterangkan dimuka, baik dalam melaksanakan
sensus maupun cara pengambilan sampel (sampling), kesalahan dapat saja terjadi
(error sampling) baik disengaja maupun yang tidak disengaja. Jenis kesalahan
yang mungkin terjadi dimaksud adalah:
·
Kesalahan secara umum (baik sensus maupun sampling):
·
Kesalahan mencatat (recording’s
error),
·
Kesalahan mengukur (measurement’s
error),
·
Kesalahan menjawab (response’s
error),
·
Kesalahan mengingat (recal’s
error),
·
Kesalahan mengamati (observation’s
error) dan sebagainya.
·
Kesalahan lainnya khusus dalam sampling :
·
Kesalahan
penentuan responden (misspecification of
sample subject).
·
Kesalahan variasi acak (random variation error).
·
Kesalahan penarikan sampel (sampling error).
·
Kesalahan spesifikasi (specification error).
·
Kesalahan karena tidak lengkapnya respon (non response error).
·
Kesalahan karena tidak lengkapnya cakupan elemen populasi
(coverage error) dan sebagainya.
Sumber Bahan Bacaan disarankan
Kachigan, Sam
Kash (1986), Statistical Analyisis: An Interdisiplinary Introduction to Univariate
& Multivariate Methods, Radius Press, New York.
Kuncoro. Mudrajat (2003), Metode Riset Untuk Bisnis dan
Ekonomi: Bagaimana Meneliti dan Menulis Tesis ?, Erlangga, Jakarta
Mutiara, Kurwadi Erna (2004), Statistik Berbasis Komputer untuk
Orang-Orang Non Statistik, Elek Media Komputindo, Jakarta
Santoso, Purbayu Budi dan Ashari (2005), Analisis
Statistik dengan Microsoft Excel dan SPSS, Andi, Yogyakarta.
Santoso, Singgih (2003), Statistik Deskriptif Konsep dan
Aplikasi Dengan Microsoft Excel dan SPSS, Andi, Yogyakarta.
Santoso, Singgih dan Fandy Tjiptono (2001), Riset
Pemasaran: Konsep dan Aplikasi dengan SPSS, Elek Media Komputindo, Jakarta
Santoso, Singgih, Mengatasi Berbagai Masalah Statistik dengan
SPSS ver. 11.5, Elek Media Komputindo, Jakarta
Trihendradi, Cornelius (2004), Memecahkan Statistik: Deskriptif,
Parametrik dan Non Parametrik dengan SPSS 12, Andi, Yogyakarta
Tidak ada komentar:
Posting Komentar