UKURAN PENYEBARAN DATA
BAB V
UKURAN PENYEBARAN DATA
Saya percaya dengan kekuatan dari kerja keras, apakah itu menggunakan
kepala atau tangan, dunia ini tidak berutang kepada siapa pun tetapi ia
berutang kepada setiap orang untuk memberikan kesempatan untuk hidup.
John D. Rockefeller
Pembahasan Materi
Bab ini membahas tentang pengertian penyebaran data, jenis-jenis ukuran penyebaran data: jangkauan, jangkauan data tunggal, jangkauan data kelompok, jangkauan semi interkuartil. Deviasi rata-rata data tunggal dan data berkelompok, variansi data tunggal dan data berkelompok, variansi gabungan. Simpangan baku data tunggal dan data berkelompok, simpangan baku gabungan, ukuran penyebaran relatif: koefisien variasi, variasi jangkauan, variasi simpangan rata-rata, variasi kuartil, kemencengan atau kemiringan data (skewness), keruncingan distribusi data (kurtosis).
- Pengertian Penyebaran Data
Dalam kehidupan sehari-hari kita sering mendengar orang menyebutkan data statistik. Rata-rata upah karyawan perusahaan Rp.3.500.0000 per bulan, rata-rata jumlah mahasiswa baru Universitas A 1000 mahasiswa per tahun ajaran baru. Setiap kali kita mendengar rata-rata, maka secara otomatis kita membayangkan sekelompok nilai di sekitar rata-rata tersebut. Ada yang sama dengan rata-rata, ada yang lebih kecil, dan ada yang lebih besar dari rata-rata tersebut. Dengan kata lain, ada variasi atau dispersi dari nilai-nilai tersebut, baik terhadap nilai lainnya maupun terhadap rata-ratanya. Ukuran dispersi atau ukuran variasi atau ukuran penyimpangan adalah ukuran yang menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai-nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yang berbeda dengan nilai-nilai pusatnya.
Ukuran variabilitas adalah sebuah ukuran derajat penyebaran nilai-nilai variabel dari suatu ukuran pemusatan data dalam sebuah distribusi. Dua kelompok distribusi data dapat memiliki nilai ukuran pemusatan yang sama, akan tetapi derajat penyebarannya bisa jadi sangat berbeda. Misalnya kita memiliki data yang berasal dari dua kelompok individu yang berbeda. Data kelompok individu A : 24, 24, 25, 25, 25, 26, 26, diperoleh mean sebesar 25. Dan data dari kelompok individu B : 16, 19, 22, 25, 28, 30, 35, diperoleh mean sebesar 25.
Nilai tendensi sentral dalam dua distribusi A dan B tersebut di atas adalah sama yaitu keduanya memiliki harga rata-rata = 25. Namun demikian apabila dilihat dari keragaman dan penyebaran nilai dari kedua distribussi tersebut tampak sangat berbeda. Dimana penyebaran nilai-nilai dalam distribusi A terlihat lebih homogen dibanding distribusi B. Sebaliknya penyebaran nilai dalam distribusi B lebih beragam atau heterogen dibanding penyebaran nilai dalam distribusi A. Hal ini diperlukan suatu indeks yang tidak saja dapat memberikan gambaran ringkas mengenai suatu distribusi (melalui suatu ukuran pemusatan data atau ukuran tendensi sentral), melainkan juga diperlukan suatu ukuran yang dapat memberikan gambaran berdasarkan keragaman nilai-nilai dalam suatu distribusi.
Ukuran dispersi pada dasarnya adalah pelengkap dari ukuran nilai pusat dalam menggambarkan sekumpulan data. Jadi, dengan adanya ukuran dispersi maka penggambaran sekumpulan data akan menjadi lebih jelas dan tepat. Ada beberapa macam ukuran variasi atau dispersi, misalnya nilai jarak (range), rata-rata simpangan (mean deviation), simpangan baku (standard deviation), koefisien variasi (coefficient of variation), ukuran kemencengan kurva (skewness), dan ukuran keruncingan kurva (kurtosis). Di antara ukuran variasi atau disperse data tersebut simpangan baku yang sering dipergunakan, khususnya untuk keperluan analisis data (Sugiyono, 2003).
- Jenis-Jenis Ukuran Penyebaran Data
Ukuran penyebaran data atau ukuran variasi adalah tingkatan di mana distribusi data memiliki kecenderungan untuk menyebar di sekitar nilai reratanya. Terdapat beberapa alasan mengapa perlu dilakukan analisis penyebaran data, yaitu (Edi Riadi, 2015: 59):
- Rerata dan median hanya menggambarkan sentral dari sekelompok data, tetapi tidak menggambarkan bagaimana penyebarannya.
- Dua kelompok data dengan rerata sama, belum tentu memiliki penyebaran yang sama. Oleh karena itu, hanya dengan rerata kita tidak dapat melihat gambaran yang jelas dari kelompok data tersebut.
- Ukuran dispersi yang kecil menunjukkan nilai data saling berdekatan (perbedaan kecil), sedangkan nilai penyebaran (dispersi) yang besar menunjukkan bahwa nilai data menyebar (perbedaan nilai masing-masing data besar).
- Ukuran penyebaran (disperse) data digunakan untuk melengkapi perhitungan nilai sentral.
- Jangkauan (Range, R)
Jangkauan atau ukuran jarak adalah selisih nilai terbesar data dengan nilai terkecil data. Dengan kata lain range atau disebut juga rentangan atau jarak pengukuran dapat didefinisikan sebagai jarak antara nilai tertinggi dengan nilai terendah. Besar kecilnya range dapat digunakan sebagai petunjuk untuk mengetahui taraf keragaman dan variabilitas suatu distribusi. Semakin tinggi range berarti distribusinya semakin beragam, bervariasi atau heterogen. Sebaliknya semakin kecil harga range maka distribusinya semakin tidak bervariasi, tidak beragam, sejenis atau homogen.
Walaupun prosedur yang dilalui sangat sederhana, namun penggunaan range sebagai ukuran variabilitas harus dilakukan dengan hati-hati. Karena range sangat bergantung pada data yang ekstrim (yaitu data yang kemunculan dan ketidak munculannya sangat berpengaruh pada tinggi rendahnya nilai range). Oleh karena hanya didasarkan pada dua nilai yang tertinggi dan terendah inilah, maka range merupakan indeks variabilitas yang tidak dapat diandalkan, tidak stabil atau tidak mantap (reliable) sebagai pendekatan metodologi ilmiah. Cara mencari jangkauan dibedakan antara data tunggal dan data berkelompok.
- Jangkauan Data Tunggal
Bila ada sekumpulan data tunggal X1, X2, …, Xn maka jangkauannya adalah
Jangkauan
Contoh :
Tentukan jangkauan data: 1, 4, 7, 8, 9, 11 !
Jawab:
X6 = 11 dan X1 = 1
Jangkauan =
- Jangkauan Data Berkelompok
Untuk data berkelompok, jangkauan dapat ditentukan dengan dua cara, yaitu menggunakan titik atau nilai tengah dan menggunakan tepi kelas. Jangkauan adalah selisih titik tengah kelas tertinggi dengan titik tengah kelas terendah. Jangkauan adalah selisih tepi atas kelas tertinggi dengan tepi bawah kelas terendah.
Contoh : Tentukan jangkauan dari distribusi frekuensi berikut!
Tabel 5.1. Hasil Pengukuran Tinggi Badan 50 Mahasiswa Universitas A
Tinggi Badan (cm) | Frekuensi |
140 – 144 145 – 149 150 – 154 155 – 159 160 – 164 165 – 169 170 – 174 | 2 4 10 14 12 5 3 |
Jumlah | 50 |
Jawab:
Dari Tabel 5.1. terlihat bahwa:
Titik tengah kelas terendah = 142
Titik tengah kelas tertinggi = 172
Tepi bawah kelas terendah = 139,5
Tepi atas kelas tertinggi = 174,5
- Jangkauan = 172 – 142 = 30
- Jangkauan = 174,5 – 139,5 = 35
- Jangkauan Semi Interkuartil
Jangkauan antarkuartil adalah selisih antara nilai kuartil atas dan kuartil bawah Dirumuskan:
Jangkauan semi interkuartil atau simpangan kuartil (deviasi kuartil) dari suatu himpunan data, disimbolkan dengan Q didefinisikan sebagai setengah dari selisih kuartil dengan kuartil bawah . Dirumuskan:
Di mana Q1 dan Q2 adalah kuartil pertama dan kuartil ketiga dari kelompok data. Jangkauan interkuartil kadang-kadang digunakan juga meskipun jangkauan semi interkuartil lebih umum dan sering digunakan sebagai ukuran untuk disperse data. Rumus-rumus di atas berlaku baik untuk data tunggal dan data yang telah dikelompokan dalam distribusi frekuensi. Perhatikan contoh berikut:
- Tentukan jangkauan antarkuartil dan jangkauan semi interkuartil dari data berikut!
2, 4, 6, 8, 10, 12, 14
Jawab:
dan
- Tentukan jangkauan antarkuartil dan jangkauan semi interkuartil berikut!
Tabel 5.2. Nilai Statistik 80 Mahasiswa Semester II Universitas A.
Nilai | Frekuensi |
30 – 39 40 – 49 50 – 59 60 – 69 70 – 79 80 – 89 90 – 99 | 2 3 5 14 24 20 12 |
Jumlah | 80 |
Jawab:
Nilai jangkauan antarkuartil sangat bergantung pada nilai kuartil. Semakin jauh jarak antarkuartil, maka semakin jauh jangkauan antarkuartil dalam sebuah distribusi. Jangkauan antarkuartil (JK) dapat digunakan untuk menemukan adanya data pencilan, yaitu data yang dianggap salah catat atau salah ukur atau berasal dari kasus yang menyimpang, karena itu perlu diteliti ulang. Data pencilan adalah data yang kurang dari pagar dalam atau lebih dari pagar luar.
Keterangan:
Satu langkah
pagar dalam
pagar luar
Contoh : Selidiki apakah terdapat data pencilan dari data di bawah ini!
15, 33, 42, 50, 51, 51, 53, 55, 62, 64, 65, 68, 79, 85, 97
Jawab: dan
Pada data di atas terdapat nilai 15 dan 97 yang berarti kurang dari pagar dalam (23) atau lebih dari pagar luar (95). Dengan demikian, nilai 15 dan 97 termasuk data pencilan, karena itu perlu diteliti ulang. Adanya nilai 15 dan 97 mungkin disebabkan salah dalam mencatat, salah dalam mengukur, atau data dari kasus yang menyimpang.
- Deviasi Rata-Rata (Simpangan Rata-Rata)
Deviasi rata-rata atau deviasi mean disingkat MD (mean deviation) dari himpunan data didefinisikan sebagai nilai rata-rata hitung dari harga mutlak simpangan-simpangannya. Dengan kata lain, untuk melakukan penghitungan MD digunakan harga yang mutlak saja, yaitu dengan hanya menggunakan nilai-nilai yang bertanda positif saja sedangkan nilai-nilai yang memiliki tanda negatif tidak diperhitungkan atau diabaikan. Cara mencari deviasi rata-rata, dibedakan antara data tunggal dan data berkelompok (Ronald Walpole, 2005).
- Deviasi Rata-Rata Data Tunggal
Untuk data tunggal, deviasi rata-ratanya dapat dihitung dengan menggunakan rumus:
Contoh : Tentukan deviasi rata-rata dari 2, 3, 6, 8, 11!
Jawab:
Rata-rata hitung
- Deviasi Rata-Rata untuk Data Berkelompok
Untuk data berkelompok (distribusi frekuensi), deviasi rata-ratanya dapat dihitung dengan rumus:
Contoh:
Tentukan deviasi rata-rata dari distribusi frekuensi pada Tabel 5.1.!
Jawab:
Dari Tabel 5.1. didapat Dengan nilai itu, dapat dibuat tabel deviasinya.
Tinggi Badan (cm) | ||||
140 – 144 145 – 149 150 – 154 155 – 159 160 – 164 165 – 169 170 – 174 | 142 147 152 157 162 167 172 | 2 4 10 14 12 5 3 | 15,7 10,7 5,7 0,7 4,3 9,3 14,3 | 31,4 42,8 57 9,8 51,6 46,5 42,9 |
Jumlah | – | 50 | – | 282 |
Oleh karena MD ini mengabaikan tanda-tanda plus minus maka tidak dapat diteruskan kepada perhitungan-perhitungan matematik lebih lanjut, terutama pada rumus-rumus yang mencantumkan tanda plus minus itu. Untuk mengatasi kelemahan ini, digunakan cara perhitungan ukuran variabilitas yang lain, yaitu yang dikenal dengan simpangan baku atau standar deviasi atau deviasi standar. Namun sebelum masuk ke pembahasan standar deviasi akan diuraikan terlebih dahulu tentang varians.
- Variansi (Variance)
Seperti pada perhitungan simpangan rata-rata, variasi juga menggunakan selisih atau simpangan antara semua nilai data dengan rata-rata hitung. Bedanya pada rumus simpangan rata-rata yang digunakan adalah nilai mutlak dari selisih nilai, sedangkan pada variansi yang digunakan adalah kuadrat selisih nilai. Walaupun nilai mutlak dan kuadrat sama-sama bertujuan untuk membuat nilai negatif menjadi positif, tetapi maknanya sangat berbeda dan mempunyai pengaruh yang berbeda terhadap ukuran dispersi data. Varians adalah nilai tengah kuadrat simpangan dari nilai tengah atau simpangan rata-rata kuadrat. Untuk sampel, variansnya (varians sampel) disimbolkan dengan Untuk populasi, variansnya (varians populasi) disimbolkan dengan (baca: sigma).
- Varians Data Tunggal
Untuk seperangkat data X1, X2, X3,…, Xn (data tunggal), variansnya dapat ditentukan dengan dua metode, yaitu metode biasa dan metode angka kasar.
Metode biasa
- Untuk sampel besar
- Untuk sampel kecil
Metode angka kasar
- Untuk sampel besar
- Untuk sampel kecil
Contoh: Tentukan varians dari data 2, 3, 6, 8, 11!
Jawab: maka diperoleh
2 3 6 8 11 | -4 -3 0 2 5 | 16 9 0 4 25 | 4 9 36 64 121 |
30 |
| 54 | 234 |
- Varians Data Berkelompok
Untuk data berkelompok (data yang telah dikelompokan dalam distribusi frekuensi), variansnya dapat ditemukan dengan menggunakan tiga metode, yaitu metode biasa, metode angka kasar, dan metode coding.
Metode biasa
- Untuk sampel besar
- Untuk sampel kecil
Metode angka kasar
- Untuk sampel besar
- Untuk sampel kecil
Metode coding
- Untuk sampel besar
- Untuk sampel kecil
Keterangan:
panjang interval kelas
rata-rata hitung sementara.
Contoh : Tentukan varians dari distribusi frekuensi berikut!
Tabel 5.3. Hasil Pengukuran Diameter Pipa Paralon
Diameter | Frekuensi |
65 – 67 68 – 70 71 – 73 74 – 76 77 – 79 80 – 82 | 2 5 13 14 4 2 |
Jumlah | 40 |
Jawab:
Dengan menggunakan metode biasa:
Diameter | |||||
65 – 67 68 – 70 71 – 73 74 – 76 77 – 79 80 – 82 | 66 69 72 75 78 81 | 2 5 13 14 4 2 | -7,425 -4,425 -1,425 1,575 4,575 7,575 | 55,131 19,581 2,031 2,481 20,931 57,381 | 110,262 97,905 26,403 34,734 83,724 114,762 |
Jumlah | – | 40 | – | – | 467,790 |
Dengan metode angka kasar:
Diameter | |||||
65 – 67 68 – 70 71 – 73 74 – 76 77 – 79 80 – 82 | 66 69 72 75 78 81 | 2 5 13 14 4 2 | 4.356 4.761 5.184 5.625 6.084 6.561 | 132 345 936 1.050 312 162 | 8.712 23.805 67.392 78.750 24.336 13.122 |
Jumlah | – | 40 | – | 2.937 | 216.117 |
Dengan metode coding:
Diameter | ||||||
65 – 67 68 – 70 71 – 73 74 – 76 77 – 79 80 – 82 | 66 69 72 75 78 81 | 2 5 13 14 4 2 | -3 -2 -1 0 1 2 | 9 4 1 0 1 4 | -6 -10 -13 0 4 4 | 18 20 13 0 4 8 |
Jumlah | – | 40 |
| – | -21 | 63 |
Hasil perhitungan dengan menggunakan ketiga rumus adalah sama, namun dengan menggunakan rumus ke-3, perhitungannya jauh lebih sederhana dan cepat. Perhatikan bahwa dengan menggunakan varians, disperse data tersebut jauh lebih besar jika dibandingkan dengan menggunakan simpangan rata-rata. Hal ini diakibatkan oleh variansi yang menggunakan kuadrat selisih nilai-nilai data terhadap rata-rata hitung, sehingga simpangannya membesar secara drastis. Ini berarti varians bukan merupakan ukuran dispersi yang baik untuk menggambarkan penyebaran data. Kelemahan varians disebabkan oleh bentuk kuadrat yang dipakai dalam rumus, sementara dispersi data sesungguhnya merupakan ukuran yang bentuknya linier. Oleh karena itu varians juga jarang digunakan dalam analisis data. Namun demikian, variansi masih mempunyai kelebihan karena melibatkan selisih dari semua nilai data.
- Varians Gabungan
Misalkan, terdapat buah subsample sebagai berikut:
- Sub-sampel 1, berukuran dengan varians
- Sub-sampel 2, berukuran dengan varians
- ……………., ………… ……… ……
- Sub-sampel berukuran dengan varians
Jika subsampel-subsampel tersebut digabungkan menjadi sebuah sampel berukuran , maka varians gabungannya adalah:
atau
Contoh: Hasil pengamatan terhadap 20 objek mendapatkan s = 4. Pengamatan
terhadap 30 objek mendapatkan s = 5. Berapakah varians gabungannya?
Jawab:
- Simpangan Baku (Standar Deviasi)
Simpangan baku (standard deviation) berhubungan langsung dengan varians, akar simpangan rata-rata kuadrat. Untuk sampel, simpangan bakunya (simpangan baku sampel) disimbolkan dengan s. Untuk populasi, simpangan bakunya (simpangan baku populasi) disimbolkan . Untuk menentukan nilai simpangan baku, caranya ialah dengan menarik akar dari varians. Jadi,
- Simpangan Baku Data Tunggal
Untuk seperangkat data X1, X2, X3,…, Xn (data tunggal) simpangan bakunya dapat ditentukan dengan dua metode, yaitu metode biasa dan metode angka kasar.
Metode biasa
- Untuk sampel besar
- Untuk sampel kecil
Metode angka kasar
- Untuk sampel besar
- Untuk sampel kecil
Contoh 1: Tentukan simpangan baku (standar deviasi) dari data 2, 3, 6, 8, 11!
Jawab: Dari perhitungan, diperoleh varias
Dengan demikian, simpangan bakunya adalah
Contoh 2: Berikut ini adalah sampel nilai statistik di sebuah universitas.
30 | 35 | 42 | 50 | 58 | 66 | 74 | 82 | 90 | 89 |
Tentukan simpangan bakunya! (Gunakan kedua rumus).
Jawab:
30 35 42 50 58 66 74 82 90 98 | -32,5 -27,5 -20,5 -12,5 -4,5 3,5 11,5 19,5 27,5 35,5 | 1.056,25 756,25 420,25 156,25 20,25 12,25 132,25 380,25 756,25 1.260,25 | 900 1.225 1.764 2.500 3.364 4.356 5.476 6.724 8.100 9.604 |
625 | 4.950,5 | 44.013 |
Dengan menggunakan metode biasa:
Dengam menggunakan angka kasar:
- Simpangan Baku Data Berkelompok
Untuk data berkelompok (data yang telah dikelompokan dalam distribusi frekuensi), simpangan bakunya dapat ditentukan dengan tiga metode, yaitu metode biasa, metode angka kasar, dan metode coding (Lungan, 2006).
Metode biasa
- Untuk sampel besar
- Untuk sampel kecil
Metode angka kasar
- Untuk sampel besar
- Untuk sampel kecil
Metode coding
- Untuk sampel besar
- Untuk sampel kecil
Keterangan:
panjang interval kelas
rata-rata hitung sementara
Contoh 1: Tentukan simpangan baku dari distribusi frekuensi pada contoh Tabel 4.3! Dari simpangan, didapatkan varias Dengan demikian, simpangan bakunya adalah:
Contoh 2: Tentukan simpangan baku dari data berikut (gunakan ketiga rumus)!
Tabel 5.4. Berat Badan 100 Mahasiswa Universitas A tahun 2017.
Berat Badan (Kg) | Frekuensi |
40 – 44 45 – 49 50 – 54 55 – 59 60 – 64 65 – 69 70 – 74 | 8 12 19 31 20 6 4 |
Jumlah | 100 |
Dengan metode biasa:
Berat Badan | ||||||
40 – 44 45 – 49 50 – 54 55 – 59 60 – 64 65 – 69 70 – 74 | 42 47 52 57 62 67 72 | 8 12 19 31 20 6 4 | 336 564 988 1.767 1.240 402 288 | -13,85 -8,85 -3,85 1,15 6,15 11,15 16,15 | 191,8225 78,3225 14,8225 1,3225 37,8225 124,3225 260,8225 | 1.534,58 939,87 281,63 40,99 756,45 745,94 1.043,29 |
Jumlah |
| 100 | 5.585 |
|
| 5.342,75 |
Dengan metode angka kasar
Berat Badan | |||||
40 – 44 45 – 49 50 – 54 55 – 59 60 – 64 65 – 69 70 – 74 | 8 12 19 31 20 6 4 | 42 47 52 57 62 67 72 | 1.764 2.209 2.704 3.249 3.844 4.489 5.184 | 336 564 988 1.767 1.240 402 288 | 14.112 26.508 51.376 100.719 76.880 26.934 20.736 |
Jumlah | 100 |
|
| 5.585 | 317.265 |
Dengan metode coding:
Berat Badan | ||||||
40 – 44 45 – 49 50 – 54 55 – 59 60 – 64 65 – 69 70 – 74 | 42 47 52 57 62 67 72 | 8 12 19 31 20 6 4 | -3 -2 -1 0 1 2 3 | 9 4 1 0 1 4 9 | -24 -24 -19 0 20 12 12 | 72 48 19 0 20 24 36 |
Jumlah |
| 100 |
|
| -23 | 219 |
- Simpangan Baku Gabungan
Untuk mencari simpangan baku gabungan, caranya adalah dengan menarik akar dari varians gabungan.
Dalam bentuk rumus, simpangan baku gabungan dituliskan:
Contoh : Jika diketahui:
dan
dan
Tentukan
Oleh karena standar deviasi merupakan akar dari varians, maka standar deviasi mempunyai bentuk linier dari kuadrat selisih antara semua nilai data dengan rata-rata hitungnya. Seperti juga variasi, standar deviasi selalu bertanda positif. Oleh karena standar deviasi melibatkan semua nilai data serta merupakan bentuk linier dan selalu positif, sementara ukuran dispersi data merupakan jarak yang bentuknya linier dan positif, maka standar deviasi merupakan ukuran dispersi yang dianggap paling baik sehingga paling banyak digunakan dalam analisis data daripada ukuran dispersi yang lain. Berdasarkan perhitungan yang telah dilakukan apabila terjadi perbedaan hasil sifatnya tidak terlalu signifikan untuk diperdebatkan. Hal ini disebabkan oleh kesalahan pengelompokan (grouping error), yaitu dari data kasar ke distribusi bergolong atau kelompok.
- Dispersi Relatif
Ukuran-ukuran dispersi atau variasi yang telah dibahas sebelumnya merupakan dispersi absolut, seperti jangkauan, simpangan rata-rata, simpangan kuartil, dan simpangan baku. Ukuran dispersi absolut hanya dapat digunakan untuk melihat penyimpangan-penyimpangan nilai yang terdapat pada suatu kumpulan data, bukan untuk beberapa kumpulan data. Untuk membandingkan dispersi atau variasi dari beberapa kumpulan data digunakan istilah dispersi relatif, yaitu perbandingan antara dispersi absolut dan rata-ratanya. Dispersi relatif dirumuskan (Spiegel, 2007):
Berikut ini adalah empat macam dispersi relatif, yaitu koefisien variasi, variasi jangkauan, variasi simpangan rata-rata, dan variasi kuartil.
- Koefisien Variasi (KV)
Jika dispersi absolut digantikan dengan simpangan bakunya maka dispersi relatifnya disebut koefisien variasi (KV). Koefisien variasi dirumuskan:
Keterangan:
koefisien variasi simpangan baku rata-rata
Contoh: Dari hasil penelitian terhadap besi beton di toko A dan toko B, diperoleh data sebagai berikut.
= 55.590 psi,
psi,
Tentukan koefisien variasi masing-masing! Di toko mana sebaiknya kita membeli besi beton!
Jawab:
Jadi, variasi kekuatan besi beton di toko A lebih besar daripada variasi kekuatan besi beton di toko B. Jadi sebaiknya membeli besi beton di toko A.
- Variasi Jangkauan (VR)
Variasi jangkauan adalah dispersi relatif yang dispersi absolutnya digantikan dengan jangkauan. Variasi jangkauan dirumuskan:
- Variasi Simpangan Rata-Rata (VSR)
Variasi simpangan rata-rata adalah dispersi relatif yang dispersi absolutnya digantikan dengan simpangan rata-rata. Variasi simpangan rata-rata dirumuskan:
- Variasi Kuartil (VQ)
Variasi kuartil adalah dispersi relatif yang dispersi absolutnya digantikan dengan kuartil. Variasi kuartil dirumuskan:
Contoh :
Dua perusahaan, yaitu TIDAK RUGI dan UNTUNG memiliki karyawan sebanyak 50 orang. Untuk keperluan penelitian mengenai variasi gaji karyawan, diambil sampel sebanyak 7 orang setiap perusahaan dengan gaji masing-masing (dalam ribuan rupiah): 300, 250, 350, 400, 600, 500, 550, dan 200, 450, 250, 300, 350, 750, 500. Tentukan dispersi relatif perusahaan tersebut (gunakan ke-4 macam dispersi relatif) dan di perusahaan mana yang memiliki variasi gaji yang lebih baik?
Misalkan perusahaan TIDAK RUGI = A dan perusahaan UNTUNG = B.
Perhitungan koefisien variasi
Perhitungan variasi jangkauan
Perhitungan variasi simpangan rata-rata
Perhitungan variasi kuartil
Urutkan data: 250, 300, 350, 400, 500, 550, 600
200, 250, 300, 350, 450, 500, 750
Dari perhitungan dispersi relatif di atas, terlihat bahwa dispersi relatif gaji perusahaan B lebih baik daripada dispersi relatif gaji perusahaan A. Jadi variasi gaji di perusahaan B lebih baik dibandingkan variasi gaji di perusahaan A.
- Kemencengan atau Kemiringan (Skewness)
Kemencengan atau kemiringan (skewness) adalah tingkat ketidaksimetrisan atau kejauhan simetri dari sebuah distribusi. Sebuah distribusi yang tidak simetris akan memiliki rata-rata, median, dan modus yang tidak sama besarnya sehingga distribusi akan terkonsentrasi pada salah satu sisi dan kurvanya akan menceng (Supranto, 2005).
Jika distribusi memiliki ekor yang lebih panjang ke kanan daripada yang ke kiri maka distribusi disebut menceng ke kanan atau memiliki kemencengan positif. Sebaliknya, jika distribusi memiliki ekor yang lebih panjang ke kiri daripada yang ke kanan maka distribusi disebut menceng ke kiri atau memiliki kemencengan negatif.
Berikut ini gambar kurva dari disribusi yang menceng ke kanan (menceng positif) dan menceng ke kiri (menceng negatif).
Gambar 5.1. Kemencengan Distribusi (a) Menceng ke Kanan (b) Menceng ke Kiri
Untuk mengetahui bahwa konsentrasi distribusi menceng ke kanan atau menceng ke kiri, dapat digunakan metode-metode berikut:
Cara Pertama : Dengan Koefisien Kemiringan Pearson
Koefisien kemiringan Pearson merupakan nilai selisih rata-rata dengan modus dibagi simpangan baku. Koefisien kemiringan Pearson dirumuskan:
Keterangan:
koefisien kemenangan Pearson
Apabila secara empiris didapatkan hubungan antarnilai pusat sebagai:
Maka rumus kemencengan di atas dapat diubah menjadi
Jika nilai dihubungkan dengan keadaan kurva maka diperoleh:
- à kurva memiliki bentuk simetris
- à nilai-niai terkonsentrasi pada sisi sebelah kanan ( terletak di sebelah kanan , sehingga kurva memiliki ekor memanjang ke kanan, kurva menceng ke kanan atau menceng positif;
- à nilai-niai terkonsentrasi pada sisi sebelah kiri ( terletak di sebelah kiri , sehingga kurva memiliki ekor memanjang ke kiri, kurva menceng ke kiri atau menceng negatif.
Contoh: Tabel 5.5. Nilai Ujian Statistik Semester II Universitas A tahun 2017
Nilai Ujian | Frekuensi |
31 – 40 41 – 50 51 – 60 61 – 70 71 – 80 81 – 90 91 – 100 | 4 3 5 8 11 7 2 |
Jumlah | 40 |
Tentukan nilai sk dan ujilah arah kemiringannya serta gambar grafiknya!
Nilai | ||||||
31 – 40 41 – 50 51 – 60 61 – 70 71 – 80 81 – 90 91 – 100 | 35,5 45,5 55,5 65,5 75,5 85,5 95,5 | 4 3 5 8 11 7 2 | -4 -3 -2 -1 0 1 2 | 16 9 4 1 0 1 4 | -16 -9 -10 -8 0 7 4 | 64 27 20 8 0 7 8 |
Jumlah |
| 40 |
|
| -32 | 134 |
= L + C
Oleh karena nilai sk-nya negatif (-0,46 atau -0,56) maka kurvanya menceng ke kiri atau menceng negatif.
1 |
10 |
34,5 44,5 55,5 65,5 75,5 85,5 95,5 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
11 |
Y
Y |
X |
Gambar 5.2. Kurva Miring ke Kiri untuk Nilai Ujian Statistik 40 Mahasiswa.
Cara Kedua: Dengan Koefisien Kemiringan Bowley
Bowley juga telah mengembangkan rumus yang cukup sederhana untuk menghitung derajat kemiringan distribusi data, dengan menggunakan nilai kuartil bawah, kuartil tengah, dan kuartil atas. Dengan kata lain perhitungan koefisien kemiringan Bowley didasarkan pada hubungan kuartil-kuartil dari sebuah distribusi. Koefisien kemiringan Bowley dirumuskan:
Dimana:
koefisien kemencengan Bowley
kuartil
Koefisien kemencengan Bowley sering juga disebut Kuartil Koefisien Kemencengan. Apabila nilai dihubungkan dengan keadaan kurva, didapatkan:
- Jika maka distrtibusi akan menceng ke kanan atau menceng secara positif.
- Jika maka distribusi akan menceng ke kiri atau menceng secara negatif.
- positif, berarti distribusi menceng ke kanan.
- negatif, berarti distribusi menceng ke kiri.
- menggambarkan distribusi yang menceng tidak berarti dan menggambarkan kurva yang menceng berarti.
Contoh : Tentukan kemiringan kurva dari distribusi frekuensi berikut!
Tabel 5. 6. Nilai Ujian Aljabar Linear I Dari 111 Mahasiswa Universitas A.
Nilai Ujian | Frekuensi |
20.00 – 29,99 30,00 – 39,99 40,00 – 49,99 50,00 – 59,99 60,00 – 69,99 70,00 – 79,99 | 4 9 25 40 28 5 |
Jumlah | 111 |
Jawab:
Kelas kelas ke-3
Kelas kelas ke-4
Kelas kelas ke-5
Karena negatif (=-0,06), kurva miring ke kiri dengan kemencengan yang berarti.
Cara Ketiga : Dengan Koefisien Kemiringan Persentil
Koefisien kemencengan persentil didasarkan atas hubungan antarpersentil dari sebuah distribusi. Koefisien kemencengan persentil dirumuskan (Dermawan, 2003):
Keterangan:
koefisien kemencengan persentil
persentil
Contoh :Tentukan nilai dari distribusi frekuensi berikut!
Tabel 5.7. Besarnya Gaji 65 Karyawan Perusahaan Argo Pantes
Gaji (ratusan ribu / minggu) | Frekuensi |
250,00 – 259,99 260,00 – 269,99 270,00 – 279,99 280,00 – 289,99 290,00 – 299,99 300,00 – 309,99 310,00 – 319,99 | 8 10 16 14 10 5 2 |
Jumlah | 65 |
Jawab:
Kelas kelas ke-6
Kelas kelas ke-3
Kelas kelas ke-1
Cara Keempat: Dengan Koefisien Kemencengan Momen
Cara lain yang digunakan untuk menghitung derajat kemiringan distribusi data adalah dengan menggunakan rumus koefisien kemiringan momen atau rumus momen berderajat tiga. Koefisien kemencengan momen didasarkan pada perbandingan momen ke-3 dengan pangkat tiga simpangan baku. Koefisien kemencengan momen dilambangkan dengan Koefisien kemencengan momen disebut juga kemencengan relatif.
Apabila nilai dihubungkan dengan keadaan kurva, didapatkan:
- Untuk distribusi simetris (normal), nilai
- Untuk distribusi menceng ke kanan, nilai
- Untuk distribusi menceng ke kiri, nilai
- Menurut Karl Pearson, distribusi yang memiliki adalah distribusi yang sangat menceng.
- Menurut Kenney dan Keeping, nilai bervariasi antara bagi distribusi yang menceng.
Untuk mencari nilai , dibedakan antara data tunggal dan data berkelompok.
- Koefisien Kemiringan untuk Data Tunggal
Koefisien kemencengan momen untuk data tunggal dirumuskan:
Keterangan: koefisien kemencengan momen
Contoh : Tentukan nilai dari data: 2, 3, 5, 9, 11!
Jawab:
2 3 5 9 11 | -4 -3 -1 3 5 | 16 9 1 9 25 | 64 27 1 27 125 |
Jumlah | – | 60 | 244 |
- Koefisien Kemiringan untuk Data Berkelompok
Koefisien kemiringan momen untuk data berkelompok dirumuskan:
atau
Dalam pemakaiannya, rumus kedua lebih praktif dan lebih mudah perhitungannya.
Contoh: Tentukan tingkat kemiringan dari distribusi frekuensi di bawah ini!
Tabel 5.8. Data Usia Peserta Keluarga Berencana Di 10 Klinik.
Usia Peserta | Frekuensi |
15 – 19 20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 | 1 29 43 41 24 12 |
Jumlah | 150 |
Jawab:
Usia | ||||||
15 – 19 20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 | 17 22 27 32 37 42 | 1 29 43 41 24 12 | -2 -1 0 1 2 3 | -2 -29 0 41 48 36 | 4 29 0 41 96 108 | -8 -29 0 41 192 324 |
Jumlah | – | 150 | – | 94 | 278 | 520 |
Jika digunakan rumus pertama maka mencari maka hasilnya akan sama. Dari perhitungan-perhitungan didapat:
- Keruncingan Distribusi Data (Kurtosis)
Satu lagi yang perlu kita pelajari dari statistika deskriptif, yaitu keruncingan distribusi data. Ukuran keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu distribusi data terhadap distribusi normalnya data. Dengan kata lain, keruncingan atau kurtosis adalah tingkat kepuncakan dari sebuah distribusi yang biasanya diambil secara relatif terhadap suatu distribusi normal. Berdasarkan keruncingan, kurva distribusi dapat dibedakan atas tiga macam, yaitu sebagai berikut (Supranto, 2005):
- Leptokurtik. Leptokurtik merupakan distribusi yang memiliki puncak relatif tinggi.
- Platikurtik. Platikurtik merupakan distribusi yang memiliki puncak hamper mendatar.
- Mesokurtik merupakan distribusi yang memiliki puncak tidak tinggi dan tidak mendatar.
Bila distrilbusinya merupakan distribusi simetris maka distribusi mesokurtik dianggap sebagai distribusi normal.
Leptokurtik |
Mesokurtik |
Platikurtik |
Gambar 5.3. Keruncingan Kurva
Untuk mengetahui keruncingan suatu distribusi, ukuran yang sering digunakan adalah koefisien keruncingan dan koefisien kurtosis persentil.
- Koefisien Keruncingan
Koefisien keruncingan atau koefisien kurtosis dilambangkan dengan . Jika hasil perhitungan koefisien keruncingan diperoleh:
- Nilai lebih kecil dari 3, maka distribusinya adalah distribusi platikurtik;
- Nilai lebih besar dari 3, maka distribusinya adalah distribusi leptokurtik;
- Nilai yang sama dengan 3, maka distribusinya adalah distribusi mesokurtik.
Nilai koefisien keruncingan, dibedakan antara data tunggal dan data berkelompok.
- Koefisien Keruncingan untuk Data Tunggal
Rumus umum untuk menentukan koefisien keruncingan untuk data tunggal adalah sebagai berikut:
Contoh :Tentukan keruncingan kurva dari data: 2, 3, 6, 8, 11!
Jawab:
2 3 6 8 11 | -4 -3 0 2 5 | 256 81 0 16 625 |
Jumlah | 0 | 978 |
Karena nilainya < 3 = (1,08) maka distribusinya adalah distribusi platikurtik.
- Koefisien Keruncingan untuk Data Berkelompok
Rumus umum untuk menentukan koefisien keruncingan untuk data berkelompok adalah sebagai berikut:
Contoh : Berikut ini distrbusi frekuensi dari nilai statistik mahasiswa Universitas A.
Nilai Statistik | Frekuensi |
65 – 67 68 – 70 71 – 73 74 – 76 77 – 79 80 – 82 | 2 5 13 14 4 2 |
Jumlah | 40 |
Tentukan nilai koefisien keruncingannya dan bentuknya serta gambarkan grafiknya!
Jawab: Dari perhitungan diperoleh nilai
66 69 72 75 78 81 | 2 5 13 14 4 2 | -7,425 – 4,425 -1,425 1,575 4,575 7,575 | 3.039,3858 383,4009 4,1234 6,1535 438,0911 3.292,5361 | 6.078,7716 1.917,0044 53,6047 86,1490 1.752,3642 6.585,0722 |
Jumlah | 40 | – | – | 16.472,9661 |
Dengan rumus kedua, perhitungan adalah sebagai berikut.
Nilai | ||||||||||
65 – 67 68 – 70 71 – 73 74 – 76 77 – 79 80 – 82 | 66 69 72 75 78 81 | 2 5 13 14 4 2 | -3 -2 -1 0 1 2 | 9 4 1 0 1 4 | -27 -8 -1 0 1 8 | 81 16 1 0 1 16 | -6 -10 -13 0 4 4 | 18 20 13 0 4 8 | -54 -40 -13 0 4 16 | 162 80 13 0 4 32 |
Jumlah |
| 40 |
|
|
|
| -21 | 63 | -87 | 291 |
Karena nilainya hampir sama atau sama dengan 3 maka bentuk kurvanya adalah mesokurtik. Gambar grafiknya adalah:
2 |
4 |
5 |
13 |
66 69 72 75 78 81 |
14 |
X |
Y |
Gambar 5.4. Keruncingan Kurva bagi Nilai Statistik Mahasiswa Universitas A
- Koefisien Kurtosis Persentil
Koefisien kurtosis Persentil dilambangkan dengan (kappa). Untuk distribusi normal, nilai Koefisien kurtosis Persentil, dirumuskan:
Contoh :
Berikut tabel distribusi frekuensi tinggi 100 mahasiswa Universitas A. Tentukan koefisien kurtosis persentil dan tentukan pula apakah distribusinya termasuk distribusi normal?
Tabel 5.9. Tinggi Mahasiswa Universitas A
Tinggi (inci) | Frekuensi |
60 – 62 63 – 65 66 – 68 69 – 71 72 – 74 | 5 18 42 27 8 |
Jumlah | 100 |
Jawab:
Kelas kelas ke-3
Kelas kelas ke-4
Kelas kelas ke-2
Kelas kelas ke-4
Karena nilai maka distribusinya bukan distribusi normal.
Rangkuman
Ukuran dispersi atau ukuran variasi atau ukuran penyimpangan adalah ukuran yang menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai-nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yang berbeda dengan nilai-nilai pusatnya. Jenis-jenis ukuran penyebaran data: jangkauan, jangkauan data tunggal, jangkauan data kelompok, jangkauan semi interkuartil. Jangkauan atau ukuran jarak adalah selisih nilai terbesar data dengan nilai terkecil data. Untuk data berkelompok, jangkauan dapat ditentukan dengan dua cara, yaitu menggunakan titik atau nilai tengah dan menggunakan tepi kelas. Jangkauan adalah selisih titik tengah kelas tertinggi dengan titik tengah kelas terendah. Jangkauan antarkuartil adalah selisih antara nilai kuartil atas dan kuartil bawah.
Deviasi rata-rata atau deviasi mean disingkat MD (mean deviation) dari himpunan data didefinisikan sebagai nilai rata-rata hitung dari harga mutlak simpangan-simpangannya. Seperti pada perhitungan simpangan rata-rata, variasi juga menggunakan selisih atau simpangan antara semua nilai data dengan rata-rata hitung. Bedanya pada rumus simpangan rata-rata yang digunakan adalah nilai mutlak dari selisih nilai, sedangkan pada variansi yang digunakan adalah kuadrat selisih nilai. Simpangan baku (standard deviation) berhubungan langsung dengan varians, akar simpangan rata-rata kuadrat. Untuk sampel, simpangan bakunya (simpangan baku sampel) disimbolkan dengan s. Untuk populasi, simpangan bakunya (simpangan baku populasi) disimbolkan .
Untuk membandingkan dispersi atau variasi dari beberapa kumpulan data digunakan istilah dispersi relatif, yaitu perbandingan antara dispersi absolut dan rata-ratanya. Jika dispersi absolut digantikan dengan simpangan bakunya maka dispersi relatifnya disebut Koefisien Variasi (KV). Variasi simpangan rata-rata adalah dispersi relatif yang dispersi absolutnya digantikan dengan simpangan rata-rata. Kemencengan atau kemiringan (skewness) adalah tingkat ketidaksimetrisan atau kejauhan simetri dari sebuah distribusi. Ukuran keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu distribusi data terhadap distribusi normalnya data. Dengan kata lain, keruncingan atau kurtosis adalah tingkat kepuncakan dari sebuah distribusi normal.
Evaluasi Mandiri
- Diketahui dua kelompok data berikut:
Kelompok data 1 : 7, 4, 10, 9, 15, 12, 12, 7, 9, 7
Kelompok data 2 : 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7
Untuk masing-masing kelompok data tersebut:
- Tentukanlah:
- Simpangan rata-rata;
- Variansi;
- Standar deviasi;
- Koefisien variasi!
- Tentukanlah derajat kemiringan distribusi data tersebut dan jenis kemiringan dengan cara berikut:
- Koefisien kemiringan Pearson
- Koefisien kemiringan momen berderajat tiga
- Koefisien kemiringan Bowley
- Jumlah kecelakaan pada pabrik ditunjukkan pada tabel berikut.
Rata-Rata Kecelakaan | Jumlah Pabrik |
1,5 – 1,7 1,8 – 2,0 2,1 – 2,3 2,4 – 2,6 2,7 – 2,9 3,0 – 3,2 | 3 12 14 9 7 5 |
Jumlah | 50 |
- Tentukan koefisien variasinya!
- Tentukan kemencengan dan jenis kurvanya!
- Tentukan keruncingan dan jenis kurvanya!
- Tentukan jarak, simpangan kuartil, deviasi rata-rata, varians, dan simpangan baku dari data-data berikut!
- 7, 4, 5, 3, 8, 6, 7
- 8,772; 6,453; 10,163; 8,542; 9,635; 6,325
- -3, -2, -5, -6, -8, -1, -3, -7
- Seorang pengamat ekonomi ingin meneliti dampak krisis ekonomi terhadap pendapatan masyarakat di Kabupaten Pasuruan. Untuk itu diambil sampel secara acak masing-masing sebanyak 16 rumah tangga di dua desa dan ditanya berapa pendapatan per minggunya. Data hasil penelitian di dua desa tersebut (dalam ribuan rupiah) adalah sebagai berikut:
Penduduk desa I : 19 18 18 19 18 19 19 18
18 19 17 20 16 17 22 18
Penduduk desa II: 18 17 17 18 18 17 18 17
17 18 18 19 20 21 20 17
Berdasarkan data tersebut, tentukanlah:
- Rata-rata dan standar deviasi pendapatan rumah tangga di desa tersebut.
- Koefisien variasi dua kelompok data tersebut.
- Penduduk desa mana yang mempunyai pendapatan lebih merata.
- Sebuah lampu pijar memiliki rata-rata pemakaian 3.500 jam dengan simpangan baku 1.050 jam. Lampu pijar lain memiliki rata-rata pemakaian 9.000 jam dengan simpangan baku 2.000 jam.
- Tentukan koefisien variasi kedua lampu tersebut!
- Yang manakah dari kedua lampu itu yang memiliki variasi ketahanan lebih baik?
- Seorang mahasiswa mendapat nilai 85 pada ujian akhir statistik dengan rata-rata dan simpangan baku kelompok 78 dan 10. Ujian akhir matematika dengan rata-rata dan simpangan baku kelompok masing-masing 82 dan 16, ia mendapat nilai 90. Pada mata ujian manakah, mahasiswa tersebut mencapai kedudukan lebih baik?
- Apabila:
Tentukan
- Dengan menggunakan distribusi frekuensi berikut:
Kelas | Frekuensi |
0 – 4 5 – 9 10 – 14 15 – 19 20 – 24 | 2 7 12 6 3 |
- Tentukan jaraknya.
- Hitung deviasi standard dan variansnya.
- Persentase penduduk berumur 10 tahun ke atas yang bekerja menurut jam kerja selama seminggu.
Jam Kerja | Persentase |
0 – 9 10 – 19 20 – 29 30 – 39 40 – 49 50 – 59 60 – 69 | 2 6 22 27 23 15 5 |
- Carilah rata-rata, median, dan modus jam kerja.
- Hitung tingkat kemiringan dan keruncingan.
- Tentukan kemencengan dan keruncingan distribusi frekuensi berikut, gunakan rumus koefisien kemencengan momen!
Berat Badan | Frekuensi |
35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 64 65 – 69 | 4 9 12 10 9 8 3 |
Janganlah menunggu, tidak ada waktu yang tepat untuk memulai. Mulailah
dari titik di mana Anda berdiri dan kemampuan yang Anda punyai, dan
kemampuan yang lebih baik akan muncul di dalam perjalanan Anda.
Napoleon Hill
You may also like
Belajar Mandiri, Berkarya Pasti
Di kampus Universita Raharja, saya sedang menjalani mata kuliah Digital Marketing melalui sistem ILP (Integrated Learning Program). Berbeda dengan metode belajar biasa, ILP menuntut mahasiswa untuk lebih mandiri dalam memahami materi. Pada awalnya, saya merasa kesulitan. Tidak ada penjelasan panjang …
Serunya Kuliah Business Intelligence di Era iLearning
Salam Raharja! Halo semuanya, perkenalkan saya Yulianah. Pada kesempatan kali ini, saya ingin berbagi cerita (Cermi) mengenai pengalaman seru saya dalam menjalani perkuliahan Business Intelligence (BI) dengan metode iLearning. 1. Mengapa Business Intelligence? Di era digital ini, data adalah “tambang …
Mengusung semangat “Empowering Digital Generation for Innovative Impact”, Universitas Raharja kembali menghadirkan ajang penuh inspirasi dalam Festival Dies Natalis ke-27 yang digelar pada 12 April 2026. Lebih dari sekadar perayaan, festival ini menjadi panggung bagi generasi kreatif dari seluruh Indonesia—mulai …
