UKURAN PENYEBARAN DATA

BAB V

Saya percaya dengan kekuatan dari kerja keras, apakah itu menggunakan
kepala atau tangan, dunia ini tidak berutang kepada siapa pun tetapi ia
berutang kepada setiap orang untuk memberikan kesempatan untuk hidup.

John D. Rockefeller

Pembahasan Materi

Bab ini membahas tentang pengertian penyebaran data, jenis-jenis ukuran penyebaran data: jangkauan, jangkauan data tunggal, jangkauan data kelompok, jangkauan semi interkuartil. Deviasi rata-rata data tunggal dan data berkelompok, variansi data tunggal dan data berkelompok, variansi gabungan. Simpangan baku data tunggal dan data berkelompok, simpangan baku gabungan, ukuran penyebaran relatif: koefisien variasi, variasi jangkauan, variasi simpangan rata-rata, variasi kuartil, kemencengan atau kemiringan data (skewness), keruncingan distribusi data (kurtosis).

Pengertian Penyebaran Data

Dalam kehidupan sehari-hari kita sering mendengar orang menyebutkan data statistik. Rata-rata upah karyawan perusahaan Rp.3.500.0000 per bulan, rata-rata jumlah mahasiswa baru Universitas A 1000 mahasiswa per tahun ajaran baru. Setiap kali kita mendengar rata-rata, maka secara otomatis kita membayangkan sekelompok nilai di sekitar rata-rata tersebut. Ada yang sama dengan rata-rata, ada yang lebih kecil, dan ada yang lebih besar dari rata-rata tersebut. Dengan kata lain, ada variasi atau dispersi dari nilai-nilai tersebut, baik terhadap nilai lainnya maupun terhadap rata-ratanya. Ukuran dispersi atau ukuran variasi atau ukuran penyimpangan adalah ukuran yang menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai-nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yang berbeda dengan nilai-nilai pusatnya.

Ukuran variabilitas adalah sebuah ukuran derajat penyebaran nilai-nilai variabel dari suatu ukuran pemusatan data dalam sebuah distribusi. Dua kelompok distribusi data dapat memiliki nilai ukuran pemusatan yang sama, akan tetapi derajat penyebarannya bisa jadi sangat berbeda. Misalnya kita memiliki data yang berasal dari dua kelompok individu yang berbeda. Data kelompok individu A : 24, 24, 25, 25, 25, 26, 26, diperoleh mean sebesar 25. Dan data dari kelompok individu B : 16, 19, 22, 25, 28, 30, 35, diperoleh mean sebesar 25.

Nilai tendensi sentral dalam dua distribusi A dan B tersebut di atas adalah sama yaitu keduanya memiliki harga rata-rata = 25. Namun demikian apabila dilihat dari keragaman dan penyebaran nilai dari kedua distribussi tersebut tampak sangat berbeda. Dimana penyebaran nilai-nilai dalam distribusi A terlihat lebih homogen dibanding distribusi B. Sebaliknya penyebaran nilai dalam distribusi B lebih beragam atau heterogen dibanding penyebaran nilai dalam distribusi A. Hal ini diperlukan suatu indeks yang tidak saja dapat memberikan gambaran ringkas mengenai suatu distribusi (melalui suatu ukuran pemusatan data atau ukuran tendensi sentral), melainkan juga diperlukan suatu ukuran yang dapat memberikan gambaran berdasarkan keragaman nilai-nilai dalam suatu distribusi.

Ukuran dispersi pada dasarnya adalah pelengkap dari ukuran nilai pusat dalam menggambarkan sekumpulan data. Jadi, dengan adanya ukuran dispersi maka penggambaran sekumpulan data akan menjadi lebih jelas dan tepat. Ada beberapa macam ukuran variasi atau dispersi, misalnya nilai jarak (range), rata-rata simpangan (mean deviation), simpangan baku (standard deviation), koefisien variasi (coefficient of variation), ukuran kemencengan kurva (skewness), dan ukuran keruncingan kurva (kurtosis). Di antara ukuran variasi atau disperse data tersebut simpangan baku yang sering dipergunakan, khususnya untuk keperluan analisis data (Sugiyono, 2003).

Jenis-Jenis Ukuran Penyebaran Data

Ukuran penyebaran data atau ukuran variasi adalah tingkatan di mana distribusi data memiliki kecenderungan untuk menyebar di sekitar nilai reratanya. Terdapat beberapa alasan mengapa perlu dilakukan analisis penyebaran data, yaitu (Edi Riadi, 2015: 59):

Rerata dan median hanya menggambarkan sentral dari sekelompok data, tetapi tidak menggambarkan bagaimana penyebarannya.
Dua kelompok data dengan rerata sama, belum tentu memiliki penyebaran yang sama. Oleh karena itu, hanya dengan rerata kita tidak dapat melihat gambaran yang jelas dari kelompok data tersebut.
Ukuran dispersi yang kecil menunjukkan nilai data saling berdekatan (perbedaan kecil), sedangkan nilai penyebaran (dispersi) yang besar menunjukkan bahwa nilai data menyebar (perbedaan nilai masing-masing data besar).
Ukuran penyebaran (disperse) data digunakan untuk melengkapi perhitungan nilai sentral.
- Jangkauan (Range, R)

Jangkauan atau ukuran jarak adalah selisih nilai terbesar data dengan nilai terkecil data. Dengan kata lain range atau disebut juga rentangan atau jarak pengukuran dapat didefinisikan sebagai jarak antara nilai tertinggi dengan nilai terendah. Besar kecilnya range dapat digunakan sebagai petunjuk untuk mengetahui taraf keragaman dan variabilitas suatu distribusi. Semakin tinggi range berarti distribusinya semakin beragam, bervariasi atau heterogen. Sebaliknya semakin kecil harga range maka distribusinya semakin tidak bervariasi, tidak beragam, sejenis atau homogen.

Walaupun prosedur yang dilalui sangat sederhana, namun penggunaan range sebagai ukuran variabilitas harus dilakukan dengan hati-hati. Karena range sangat bergantung pada data yang ekstrim (yaitu data yang kemunculan dan ketidak munculannya sangat berpengaruh pada tinggi rendahnya nilai range). Oleh karena hanya didasarkan pada dua nilai yang tertinggi dan terendah inilah, maka range merupakan indeks variabilitas yang tidak dapat diandalkan, tidak stabil atau tidak mantap (reliable) sebagai pendekatan metodologi ilmiah. Cara mencari jangkauan dibedakan antara data tunggal dan data berkelompok.

Jangkauan Data Tunggal

Bila ada sekumpulan data tunggal X₁, X₂, …, X_n maka jangkauannya adalah

Jangkauan

Contoh :

Tentukan jangkauan data: 1, 4, 7, 8, 9, 11 !

Jawab:

X₆ = 11 dan X₁ = 1

Jangkauan =

Jangkauan Data Berkelompok

Untuk data berkelompok, jangkauan dapat ditentukan dengan dua cara, yaitu menggunakan titik atau nilai tengah dan menggunakan tepi kelas. Jangkauan adalah selisih titik tengah kelas tertinggi dengan titik tengah kelas terendah. Jangkauan adalah selisih tepi atas kelas tertinggi dengan tepi bawah kelas terendah.

Contoh : Tentukan jangkauan dari distribusi frekuensi berikut!

Tabel 5.1. Hasil Pengukuran Tinggi Badan 50 Mahasiswa Universitas A

Tinggi Badan (cm)

Frekuensi

140 – 144

145 – 149

150 – 154

155 – 159

160 – 164

165 – 169

170 – 174

Jumlah

Jawab:

Dari Tabel 5.1. terlihat bahwa:

Titik tengah kelas terendah = 142

Titik tengah kelas tertinggi = 172

Tepi bawah kelas terendah = 139,5

Tepi atas kelas tertinggi = 174,5

Jangkauan = 172 – 142 = 30
Jangkauan = 174,5 – 139,5 = 35
- Jangkauan Semi Interkuartil

Jangkauan antarkuartil adalah selisih antara nilai kuartil atas dan kuartil bawah Dirumuskan:

Jangkauan semi interkuartil atau simpangan kuartil (deviasi kuartil) dari suatu himpunan data, disimbolkan dengan Q didefinisikan sebagai setengah dari selisih kuartil dengan kuartil bawah . Dirumuskan:

Di mana Q₁ dan Q₂ adalah kuartil pertama dan kuartil ketiga dari kelompok data. Jangkauan interkuartil kadang-kadang digunakan juga meskipun jangkauan semi interkuartil lebih umum dan sering digunakan sebagai ukuran untuk disperse data. Rumus-rumus di atas berlaku baik untuk data tunggal dan data yang telah dikelompokan dalam distribusi frekuensi. Perhatikan contoh berikut:

Tentukan jangkauan antarkuartil dan jangkauan semi interkuartil dari data berikut!

2, 4, 6, 8, 10, 12, 14

Jawab:

dan

Tentukan jangkauan antarkuartil dan jangkauan semi interkuartil berikut!

Tabel 5.2. Nilai Statistik 80 Mahasiswa Semester II Universitas A.

Nilai

Frekuensi

30 – 39

40 – 49

50 – 59

60 – 69

70 – 79

80 – 89

90 – 99

Jumlah

Jawab:

Nilai jangkauan antarkuartil sangat bergantung pada nilai kuartil. Semakin jauh jarak antarkuartil, maka semakin jauh jangkauan antarkuartil dalam sebuah distribusi. Jangkauan antarkuartil (JK) dapat digunakan untuk menemukan adanya data pencilan, yaitu data yang dianggap salah catat atau salah ukur atau berasal dari kasus yang menyimpang, karena itu perlu diteliti ulang. Data pencilan adalah data yang kurang dari pagar dalam atau lebih dari pagar luar.

Keterangan:

Satu langkah

pagar dalam

pagar luar

Contoh : Selidiki apakah terdapat data pencilan dari data di bawah ini!

15, 33, 42, 50, 51, 51, 53, 55, 62, 64, 65, 68, 79, 85, 97

Jawab: dan

Pada data di atas terdapat nilai 15 dan 97 yang berarti kurang dari pagar dalam (23) atau lebih dari pagar luar (95). Dengan demikian, nilai 15 dan 97 termasuk data pencilan, karena itu perlu diteliti ulang. Adanya nilai 15 dan 97 mungkin disebabkan salah dalam mencatat, salah dalam mengukur, atau data dari kasus yang menyimpang.

Deviasi Rata-Rata (Simpangan Rata-Rata)

Deviasi rata-rata atau deviasi mean disingkat MD (mean deviation) dari himpunan data didefinisikan sebagai nilai rata-rata hitung dari harga mutlak simpangan-simpangannya. Dengan kata lain, untuk melakukan penghitungan MD digunakan harga yang mutlak saja, yaitu dengan hanya menggunakan nilai-nilai yang bertanda positif saja sedangkan nilai-nilai yang memiliki tanda negatif tidak diperhitungkan atau diabaikan. Cara mencari deviasi rata-rata, dibedakan antara data tunggal dan data berkelompok (Ronald Walpole, 2005).

Deviasi Rata-Rata Data Tunggal

Untuk data tunggal, deviasi rata-ratanya dapat dihitung dengan menggunakan rumus:

Contoh : Tentukan deviasi rata-rata dari 2, 3, 6, 8, 11!

Jawab:

Rata-rata hitung

Deviasi Rata-Rata untuk Data Berkelompok

Untuk data berkelompok (distribusi frekuensi), deviasi rata-ratanya dapat dihitung dengan rumus:

Contoh:

Tentukan deviasi rata-rata dari distribusi frekuensi pada Tabel 5.1.!

Jawab:

Dari Tabel 5.1. didapat Dengan nilai itu, dapat dibuat tabel deviasinya.

Tinggi Badan (cm)

140 – 144

145 – 149

150 – 154

155 – 159

160 – 164

165 – 169

170 – 174

142

147

152

157

162

167

172

15,7

10,7

5,7

0,7

4,3

9,3

14,3

31,4

42,8

9,8

51,6

46,5

42,9

Jumlah

–

282

Oleh karena MD ini mengabaikan tanda-tanda plus minus maka tidak dapat diteruskan kepada perhitungan-perhitungan matematik lebih lanjut, terutama pada rumus-rumus yang mencantumkan tanda plus minus itu. Untuk mengatasi kelemahan ini, digunakan cara perhitungan ukuran variabilitas yang lain, yaitu yang dikenal dengan simpangan baku atau standar deviasi atau deviasi standar. Namun sebelum masuk ke pembahasan standar deviasi akan diuraikan terlebih dahulu tentang varians.

Variansi (Variance)

Seperti pada perhitungan simpangan rata-rata, variasi juga menggunakan selisih atau simpangan antara semua nilai data dengan rata-rata hitung. Bedanya pada rumus simpangan rata-rata yang digunakan adalah nilai mutlak dari selisih nilai, sedangkan pada variansi yang digunakan adalah kuadrat selisih nilai. Walaupun nilai mutlak dan kuadrat sama-sama bertujuan untuk membuat nilai negatif menjadi positif, tetapi maknanya sangat berbeda dan mempunyai pengaruh yang berbeda terhadap ukuran dispersi data. Varians adalah nilai tengah kuadrat simpangan dari nilai tengah atau simpangan rata-rata kuadrat. Untuk sampel, variansnya (varians sampel) disimbolkan dengan Untuk populasi, variansnya (varians populasi) disimbolkan dengan (baca: sigma).

Varians Data Tunggal

Untuk seperangkat data X₁, X₂, X₃,…, X_n (data tunggal), variansnya dapat ditentukan dengan dua metode, yaitu metode biasa dan metode angka kasar.

Metode biasa

Untuk sampel besar
Untuk sampel kecil

Metode angka kasar

Untuk sampel besar

Untuk sampel kecil

Contoh: Tentukan varians dari data 2, 3, 6, 8, 11!

Jawab: maka diperoleh

-4

-3

121

234

Varians Data Berkelompok

Untuk data berkelompok (data yang telah dikelompokan dalam distribusi frekuensi), variansnya dapat ditemukan dengan menggunakan tiga metode, yaitu metode biasa, metode angka kasar, dan metode coding.

Metode biasa

Untuk sampel besar
Untuk sampel kecil

Metode angka kasar

Untuk sampel besar
Untuk sampel kecil

Metode coding

Untuk sampel besar
Untuk sampel kecil

Keterangan:

panjang interval kelas

rata-rata hitung sementara.

Contoh : Tentukan varians dari distribusi frekuensi berikut!

Tabel 5.3. Hasil Pengukuran Diameter Pipa Paralon

Diameter

Frekuensi

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

Jumlah

Jawab:

Dengan menggunakan metode biasa:

Diameter

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

-7,425

-4,425

-1,425

1,575

4,575

7,575

55,131

19,581

2,031

2,481

20,931

57,381

110,262

97,905

26,403

34,734

83,724

114,762

Jumlah

–

467,790

Dengan metode angka kasar:

Diameter

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

4.356

4.761

5.184

5.625

6.084

6.561

132

345

936

1.050

312

162

8.712

23.805

67.392

78.750

24.336

13.122

Jumlah

–

2.937

216.117

Dengan metode coding:

Diameter

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

-3

-2

-1

-6

-10

-13

Jumlah

–

-21

Hasil perhitungan dengan menggunakan ketiga rumus adalah sama, namun dengan menggunakan rumus ke-3, perhitungannya jauh lebih sederhana dan cepat. Perhatikan bahwa dengan menggunakan varians, disperse data tersebut jauh lebih besar jika dibandingkan dengan menggunakan simpangan rata-rata. Hal ini diakibatkan oleh variansi yang menggunakan kuadrat selisih nilai-nilai data terhadap rata-rata hitung, sehingga simpangannya membesar secara drastis. Ini berarti varians bukan merupakan ukuran dispersi yang baik untuk menggambarkan penyebaran data. Kelemahan varians disebabkan oleh bentuk kuadrat yang dipakai dalam rumus, sementara dispersi data sesungguhnya merupakan ukuran yang bentuknya linier. Oleh karena itu varians juga jarang digunakan dalam analisis data. Namun demikian, variansi masih mempunyai kelebihan karena melibatkan selisih dari semua nilai data.

Varians Gabungan

Misalkan, terdapat buah subsample sebagai berikut:

Sub-sampel 1, berukuran dengan varians
Sub-sampel 2, berukuran dengan varians
……………., ………… ……… ……
Sub-sampel berukuran dengan varians

Jika subsampel-subsampel tersebut digabungkan menjadi sebuah sampel berukuran , maka varians gabungannya adalah:

atau

Contoh: Hasil pengamatan terhadap 20 objek mendapatkan s = 4. Pengamatan

terhadap 30 objek mendapatkan s = 5. Berapakah varians gabungannya?

Jawab:

Simpangan Baku (Standar Deviasi)

Simpangan baku (standard deviation) berhubungan langsung dengan varians, akar simpangan rata-rata kuadrat. Untuk sampel, simpangan bakunya (simpangan baku sampel) disimbolkan dengan s. Untuk populasi, simpangan bakunya (simpangan baku populasi) disimbolkan . Untuk menentukan nilai simpangan baku, caranya ialah dengan menarik akar dari varians. Jadi,

Simpangan Baku Data Tunggal

Untuk seperangkat data X₁, X₂, X₃,…, X_n(data tunggal) simpangan bakunya dapat ditentukan dengan dua metode, yaitu metode biasa dan metode angka kasar.

Metode biasa

Untuk sampel besar
Untuk sampel kecil

Metode angka kasar

Untuk sampel besar
Untuk sampel kecil

Contoh 1: Tentukan simpangan baku (standar deviasi) dari data 2, 3, 6, 8, 11!

Jawab: Dari perhitungan, diperoleh varias

Dengan demikian, simpangan bakunya adalah

Contoh 2: Berikut ini adalah sampel nilai statistik di sebuah universitas.

Tentukan simpangan bakunya! (Gunakan kedua rumus).

Jawab:

-32,5

-27,5

-20,5

-12,5

-4,5

3,5

11,5

19,5

27,5

35,5

1.056,25

756,25

420,25

156,25

20,25

12,25

132,25

380,25

756,25

1.260,25

900

1.225

1.764

2.500

3.364

4.356

5.476

6.724

8.100

9.604

625

4.950,5

44.013

Dengan menggunakan metode biasa:

Dengam menggunakan angka kasar:

Simpangan Baku Data Berkelompok

Untuk data berkelompok (data yang telah dikelompokan dalam distribusi frekuensi), simpangan bakunya dapat ditentukan dengan tiga metode, yaitu metode biasa, metode angka kasar, dan metode coding (Lungan, 2006).

Metode biasa

Untuk sampel besar
Untuk sampel kecil

Metode angka kasar

Untuk sampel besar
Untuk sampel kecil

Metode coding

Untuk sampel besar
Untuk sampel kecil

Keterangan:

panjang interval kelas

rata-rata hitung sementara

Contoh 1: Tentukan simpangan baku dari distribusi frekuensi pada contoh Tabel 4.3! Dari simpangan, didapatkan varias Dengan demikian, simpangan bakunya adalah:

Contoh 2: Tentukan simpangan baku dari data berikut (gunakan ketiga rumus)!

Tabel 5.4. Berat Badan 100 Mahasiswa Universitas A tahun 2017.

Berat Badan (Kg)

Frekuensi

40 – 44

45 – 49

50 – 54

55 – 59

60 – 64

65 – 69

70 – 74

Jumlah

100

Dengan metode biasa:

Berat Badan

40 – 44

45 – 49

50 – 54

55 – 59

60 – 64

65 – 69

70 – 74

336

564

988

1.767

1.240

402

288

-13,85

-8,85

-3,85

1,15

6,15

11,15

16,15

191,8225

78,3225

14,8225

1,3225

37,8225

124,3225

260,8225

1.534,58

939,87

281,63

40,99

756,45

745,94

1.043,29

Jumlah

100

5.585

5.342,75

Dengan metode angka kasar

Berat Badan

40 – 44

45 – 49

50 – 54

55 – 59

60 – 64

65 – 69

70 – 74

1.764

2.209

2.704

3.249

3.844

4.489

5.184

336

564

988

1.767

1.240

402

288

14.112

26.508

51.376

100.719

76.880

26.934

20.736

Jumlah

100

5.585

317.265

Dengan metode coding:

Berat Badan

40 – 44

45 – 49

50 – 54

55 – 59

60 – 64

65 – 69

70 – 74

-3

-2

-1

-24

-19

Jumlah

100

-23

219

Simpangan Baku Gabungan

Untuk mencari simpangan baku gabungan, caranya adalah dengan menarik akar dari varians gabungan.

Dalam bentuk rumus, simpangan baku gabungan dituliskan:

Contoh : Jika diketahui:

dan

Tentukan

Oleh karena standar deviasi merupakan akar dari varians, maka standar deviasi mempunyai bentuk linier dari kuadrat selisih antara semua nilai data dengan rata-rata hitungnya. Seperti juga variasi, standar deviasi selalu bertanda positif. Oleh karena standar deviasi melibatkan semua nilai data serta merupakan bentuk linier dan selalu positif, sementara ukuran dispersi data merupakan jarak yang bentuknya linier dan positif, maka standar deviasi merupakan ukuran dispersi yang dianggap paling baik sehingga paling banyak digunakan dalam analisis data daripada ukuran dispersi yang lain. Berdasarkan perhitungan yang telah dilakukan apabila terjadi perbedaan hasil sifatnya tidak terlalu signifikan untuk diperdebatkan. Hal ini disebabkan oleh kesalahan pengelompokan (grouping error), yaitu dari data kasar ke distribusi bergolong atau kelompok.

Dispersi Relatif

Ukuran-ukuran dispersi atau variasi yang telah dibahas sebelumnya merupakan dispersi absolut, seperti jangkauan, simpangan rata-rata, simpangan kuartil, dan simpangan baku. Ukuran dispersi absolut hanya dapat digunakan untuk melihat penyimpangan-penyimpangan nilai yang terdapat pada suatu kumpulan data, bukan untuk beberapa kumpulan data. Untuk membandingkan dispersi atau variasi dari beberapa kumpulan data digunakan istilah dispersi relatif, yaitu perbandingan antara dispersi absolut dan rata-ratanya. Dispersi relatif dirumuskan (Spiegel, 2007):

Berikut ini adalah empat macam dispersi relatif, yaitu koefisien variasi, variasi jangkauan, variasi simpangan rata-rata, dan variasi kuartil.

Koefisien Variasi (KV)

Jika dispersi absolut digantikan dengan simpangan bakunya maka dispersi relatifnya disebut koefisien variasi (KV). Koefisien variasi dirumuskan:

Keterangan:

koefisien variasi simpangan baku rata-rata

Contoh: Dari hasil penelitian terhadap besi beton di toko A dan toko B, diperoleh data sebagai berikut.

= 55.590 psi,

psi,

Tentukan koefisien variasi masing-masing! Di toko mana sebaiknya kita membeli besi beton!

Jawab:

Jadi, variasi kekuatan besi beton di toko A lebih besar daripada variasi kekuatan besi beton di toko B. Jadi sebaiknya membeli besi beton di toko A.

Variasi Jangkauan (VR)

Variasi jangkauan adalah dispersi relatif yang dispersi absolutnya digantikan dengan jangkauan. Variasi jangkauan dirumuskan:

Variasi Simpangan Rata-Rata (VSR)

Variasi simpangan rata-rata adalah dispersi relatif yang dispersi absolutnya digantikan dengan simpangan rata-rata. Variasi simpangan rata-rata dirumuskan:

Variasi Kuartil (VQ)

Variasi kuartil adalah dispersi relatif yang dispersi absolutnya digantikan dengan kuartil. Variasi kuartil dirumuskan:

Contoh :

Dua perusahaan, yaitu TIDAK RUGI dan UNTUNG memiliki karyawan sebanyak 50 orang. Untuk keperluan penelitian mengenai variasi gaji karyawan, diambil sampel sebanyak 7 orang setiap perusahaan dengan gaji masing-masing (dalam ribuan rupiah): 300, 250, 350, 400, 600, 500, 550, dan 200, 450, 250, 300, 350, 750, 500. Tentukan dispersi relatif perusahaan tersebut (gunakan ke-4 macam dispersi relatif) dan di perusahaan mana yang memiliki variasi gaji yang lebih baik?

Misalkan perusahaan TIDAK RUGI = A dan perusahaan UNTUNG = B.

Perhitungan koefisien variasi

Perhitungan variasi jangkauan

Perhitungan variasi simpangan rata-rata

Perhitungan variasi kuartil

Urutkan data: 250, 300, 350, 400, 500, 550, 600

200, 250, 300, 350, 450, 500, 750

Dari perhitungan dispersi relatif di atas, terlihat bahwa dispersi relatif gaji perusahaan B lebih baik daripada dispersi relatif gaji perusahaan A. Jadi variasi gaji di perusahaan B lebih baik dibandingkan variasi gaji di perusahaan A.

Kemencengan atau Kemiringan (Skewness)

Kemencengan atau kemiringan (skewness) adalah tingkat ketidaksimetrisan atau kejauhan simetri dari sebuah distribusi. Sebuah distribusi yang tidak simetris akan memiliki rata-rata, median, dan modus yang tidak sama besarnya sehingga distribusi akan terkonsentrasi pada salah satu sisi dan kurvanya akan menceng (Supranto, 2005).

Jika distribusi memiliki ekor yang lebih panjang ke kanan daripada yang ke kiri maka distribusi disebut menceng ke kanan atau memiliki kemencengan positif. Sebaliknya, jika distribusi memiliki ekor yang lebih panjang ke kiri daripada yang ke kanan maka distribusi disebut menceng ke kiri atau memiliki kemencengan negatif.

Berikut ini gambar kurva dari disribusi yang menceng ke kanan (menceng positif) dan menceng ke kiri (menceng negatif).

Gambar 5.1. Kemencengan Distribusi (a) Menceng ke Kanan (b) Menceng ke Kiri

Untuk mengetahui bahwa konsentrasi distribusi menceng ke kanan atau menceng ke kiri, dapat digunakan metode-metode berikut:

Cara Pertama : Dengan Koefisien Kemiringan Pearson

Koefisien kemiringan Pearson merupakan nilai selisih rata-rata dengan modus dibagi simpangan baku. Koefisien kemiringan Pearson dirumuskan:

Keterangan:

koefisien kemenangan Pearson

Apabila secara empiris didapatkan hubungan antarnilai pusat sebagai:

Maka rumus kemencengan di atas dapat diubah menjadi

Jika nilai dihubungkan dengan keadaan kurva maka diperoleh:

à kurva memiliki bentuk simetris
à nilai-niai terkonsentrasi pada sisi sebelah kanan ( terletak di sebelah kanan , sehingga kurva memiliki ekor memanjang ke kanan, kurva menceng ke kanan atau menceng positif;
à nilai-niai terkonsentrasi pada sisi sebelah kiri ( terletak di sebelah kiri , sehingga kurva memiliki ekor memanjang ke kiri, kurva menceng ke kiri atau menceng negatif.

Contoh: Tabel 5.5. Nilai Ujian Statistik Semester II Universitas A tahun 2017

Nilai Ujian

Frekuensi

31 – 40

41 – 50

51 – 60

61 – 70

71 – 80

81 – 90

91 – 100

Jumlah

Tentukan nilai sk dan ujilah arah kemiringannya serta gambar grafiknya!

Nilai

31 – 40

41 – 50

51 – 60

61 – 70

71 – 80

81 – 90

91 – 100

35,5

45,5

55,5

65,5

75,5

85,5

95,5

-4

-3

-2

-1

-16

-9

-10

-8

Jumlah

-32

134

= L + C

Oleh karena nilai sk-nya negatif (-0,46 atau -0,56) maka kurvanya menceng ke kiri atau menceng negatif.

34,5 44,5 55,5 65,5 75,5 85,5 95,5

Gambar 5.2. Kurva Miring ke Kiri untuk Nilai Ujian Statistik 40 Mahasiswa.

Cara Kedua: Dengan Koefisien Kemiringan Bowley

Bowley juga telah mengembangkan rumus yang cukup sederhana untuk menghitung derajat kemiringan distribusi data, dengan menggunakan nilai kuartil bawah, kuartil tengah, dan kuartil atas. Dengan kata lain perhitungan koefisien kemiringan Bowley didasarkan pada hubungan kuartil-kuartil dari sebuah distribusi. Koefisien kemiringan Bowley dirumuskan:

Dimana:

koefisien kemencengan Bowley

kuartil

Koefisien kemencengan Bowley sering juga disebut Kuartil Koefisien Kemencengan. Apabila nilai dihubungkan dengan keadaan kurva, didapatkan:

Jika maka distrtibusi akan menceng ke kanan atau menceng secara positif.
Jika maka distribusi akan menceng ke kiri atau menceng secara negatif.
positif, berarti distribusi menceng ke kanan.
negatif, berarti distribusi menceng ke kiri.
menggambarkan distribusi yang menceng tidak berarti dan menggambarkan kurva yang menceng berarti.

Contoh : Tentukan kemiringan kurva dari distribusi frekuensi berikut!

Tabel 5. 6. Nilai Ujian Aljabar Linear I Dari 111 Mahasiswa Universitas A.

Nilai Ujian

Frekuensi

20.00 – 29,99

30,00 – 39,99

40,00 – 49,99

50,00 – 59,99

60,00 – 69,99

70,00 – 79,99

Jumlah

111

Jawab:

Kelas kelas ke-3

Kelas kelas ke-4

Kelas kelas ke-5

Karena negatif (=-0,06), kurva miring ke kiri dengan kemencengan yang berarti.

Cara Ketiga : Dengan Koefisien Kemiringan Persentil

Koefisien kemencengan persentil didasarkan atas hubungan antarpersentil dari sebuah distribusi. Koefisien kemencengan persentil dirumuskan (Dermawan, 2003):

Keterangan:

koefisien kemencengan persentil

persentil

Contoh :Tentukan nilai dari distribusi frekuensi berikut!

Tabel 5.7. Besarnya Gaji 65 Karyawan Perusahaan Argo Pantes

Gaji (ratusan ribu / minggu)

Frekuensi

250,00 – 259,99

260,00 – 269,99

270,00 – 279,99

280,00 – 289,99

290,00 – 299,99

300,00 – 309,99

310,00 – 319,99

Jumlah

Jawab:

Kelas kelas ke-6

Kelas kelas ke-3

Kelas kelas ke-1

Cara Keempat: Dengan Koefisien Kemencengan Momen

Cara lain yang digunakan untuk menghitung derajat kemiringan distribusi data adalah dengan menggunakan rumus koefisien kemiringan momen atau rumus momen berderajat tiga. Koefisien kemencengan momen didasarkan pada perbandingan momen ke-3 dengan pangkat tiga simpangan baku. Koefisien kemencengan momen dilambangkan dengan Koefisien kemencengan momen disebut juga kemencengan relatif.

Apabila nilai dihubungkan dengan keadaan kurva, didapatkan:

Untuk distribusi simetris (normal), nilai
Untuk distribusi menceng ke kanan, nilai
Untuk distribusi menceng ke kiri, nilai
Menurut Karl Pearson, distribusi yang memiliki adalah distribusi yang sangat menceng.
Menurut Kenney dan Keeping, nilai bervariasi antara bagi distribusi yang menceng.

Untuk mencari nilai , dibedakan antara data tunggal dan data berkelompok.

Koefisien Kemiringan untuk Data Tunggal

Koefisien kemencengan momen untuk data tunggal dirumuskan:

Keterangan: koefisien kemencengan momen

Contoh : Tentukan nilai dari data: 2, 3, 5, 9, 11!

Jawab:

-4

-3

-1

125

Jumlah

–

244

Koefisien Kemiringan untuk Data Berkelompok

Koefisien kemiringan momen untuk data berkelompok dirumuskan:

atau

Dalam pemakaiannya, rumus kedua lebih praktif dan lebih mudah perhitungannya.

Contoh: Tentukan tingkat kemiringan dari distribusi frekuensi di bawah ini!

Tabel 5.8. Data Usia Peserta Keluarga Berencana Di 10 Klinik.

Usia Peserta

Frekuensi

15 – 19

20 – 24

25 – 29

30 – 34

35 – 39

40 – 44

Jumlah

150

Jawab:

Usia

15 – 19

20 – 24

25 – 29

30 – 34

35 – 39

40 – 44

-2

-1

-2

-29

108

-8

-29

192

324

Jumlah

–

150

–

278

520

Jika digunakan rumus pertama maka mencari maka hasilnya akan sama. Dari perhitungan-perhitungan didapat:

Keruncingan Distribusi Data (Kurtosis)

Satu lagi yang perlu kita pelajari dari statistika deskriptif, yaitu keruncingan distribusi data. Ukuran keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu distribusi data terhadap distribusi normalnya data. Dengan kata lain, keruncingan atau kurtosis adalah tingkat kepuncakan dari sebuah distribusi yang biasanya diambil secara relatif terhadap suatu distribusi normal. Berdasarkan keruncingan, kurva distribusi dapat dibedakan atas tiga macam, yaitu sebagai berikut (Supranto, 2005):

Leptokurtik. Leptokurtik merupakan distribusi yang memiliki puncak relatif tinggi.
Platikurtik. Platikurtik merupakan distribusi yang memiliki puncak hamper mendatar.
Mesokurtik merupakan distribusi yang memiliki puncak tidak tinggi dan tidak mendatar.

Bila distrilbusinya merupakan distribusi simetris maka distribusi mesokurtik dianggap sebagai distribusi normal.

Leptokurtik

Mesokurtik

Platikurtik

Gambar 5.3. Keruncingan Kurva

Untuk mengetahui keruncingan suatu distribusi, ukuran yang sering digunakan adalah koefisien keruncingan dan koefisien kurtosis persentil.

Koefisien Keruncingan

Koefisien keruncingan atau koefisien kurtosis dilambangkan dengan . Jika hasil perhitungan koefisien keruncingan diperoleh:

Nilai lebih kecil dari 3, maka distribusinya adalah distribusi platikurtik;
Nilai lebih besar dari 3, maka distribusinya adalah distribusi leptokurtik;
Nilai yang sama dengan 3, maka distribusinya adalah distribusi mesokurtik.

Nilai koefisien keruncingan, dibedakan antara data tunggal dan data berkelompok.

Koefisien Keruncingan untuk Data Tunggal

Rumus umum untuk menentukan koefisien keruncingan untuk data tunggal adalah sebagai berikut:

Contoh :Tentukan keruncingan kurva dari data: 2, 3, 6, 8, 11!

Jawab:

-4

-3

256

625

Jumlah

978

Karena nilainya < 3 = (1,08) maka distribusinya adalah distribusi platikurtik.

Koefisien Keruncingan untuk Data Berkelompok

Rumus umum untuk menentukan koefisien keruncingan untuk data berkelompok adalah sebagai berikut:

Contoh : Berikut ini distrbusi frekuensi dari nilai statistik mahasiswa Universitas A.

Nilai Statistik

Frekuensi

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

Jumlah

Tentukan nilai koefisien keruncingannya dan bentuknya serta gambarkan grafiknya!

Jawab: Dari perhitungan diperoleh nilai

-7,425

– 4,425

-1,425

1,575

4,575

7,575

3.039,3858

383,4009

4,1234

6,1535

438,0911

3.292,5361

6.078,7716

1.917,0044

53,6047

86,1490

1.752,3642

6.585,0722

Jumlah

–

16.472,9661

Dengan rumus kedua, perhitungan adalah sebagai berikut.

Nilai

65 – 67

68 – 70

71 – 73

74 – 76

77 – 79

80 – 82

-3

-2

-1

-27

-8

-1

-6

-10

-13

-54

-40

-13

162

Jumlah

-21

-87

291

Karena nilainya hampir sama atau sama dengan 3 maka bentuk kurvanya adalah mesokurtik. Gambar grafiknya adalah:

66 69 72 75 78 81

Gambar 5.4. Keruncingan Kurva bagi Nilai Statistik Mahasiswa Universitas A

Koefisien Kurtosis Persentil

Koefisien kurtosis Persentil dilambangkan dengan (kappa). Untuk distribusi normal, nilai Koefisien kurtosis Persentil, dirumuskan:

Contoh :

Berikut tabel distribusi frekuensi tinggi 100 mahasiswa Universitas A. Tentukan koefisien kurtosis persentil dan tentukan pula apakah distribusinya termasuk distribusi normal?

Tabel 5.9. Tinggi Mahasiswa Universitas A

Tinggi (inci)

Frekuensi

60 – 62

63 – 65

66 – 68

69 – 71

72 – 74

Jumlah

100

Jawab:

Kelas kelas ke-3

Kelas kelas ke-4

Kelas kelas ke-2

Kelas kelas ke-4

Karena nilai maka distribusinya bukan distribusi normal.

Rangkuman

Ukuran dispersi atau ukuran variasi atau ukuran penyimpangan adalah ukuran yang menyatakan seberapa jauh penyimpangan nilai-nilai data dari nilai-nilai pusatnya atau ukuran yang menyatakan seberapa banyak nilai-nilai data yang berbeda dengan nilai-nilai pusatnya. Jenis-jenis ukuran penyebaran data: jangkauan, jangkauan data tunggal, jangkauan data kelompok, jangkauan semi interkuartil. Jangkauan atau ukuran jarak adalah selisih nilai terbesar data dengan nilai terkecil data. Untuk data berkelompok, jangkauan dapat ditentukan dengan dua cara, yaitu menggunakan titik atau nilai tengah dan menggunakan tepi kelas. Jangkauan adalah selisih titik tengah kelas tertinggi dengan titik tengah kelas terendah. Jangkauan antarkuartil adalah selisih antara nilai kuartil atas dan kuartil bawah.

Deviasi rata-rata atau deviasi mean disingkat MD (mean deviation) dari himpunan data didefinisikan sebagai nilai rata-rata hitung dari harga mutlak simpangan-simpangannya. Seperti pada perhitungan simpangan rata-rata, variasi juga menggunakan selisih atau simpangan antara semua nilai data dengan rata-rata hitung. Bedanya pada rumus simpangan rata-rata yang digunakan adalah nilai mutlak dari selisih nilai, sedangkan pada variansi yang digunakan adalah kuadrat selisih nilai. Simpangan baku (standard deviation) berhubungan langsung dengan varians, akar simpangan rata-rata kuadrat. Untuk sampel, simpangan bakunya (simpangan baku sampel) disimbolkan dengan s. Untuk populasi, simpangan bakunya (simpangan baku populasi) disimbolkan .

Untuk membandingkan dispersi atau variasi dari beberapa kumpulan data digunakan istilah dispersi relatif, yaitu perbandingan antara dispersi absolut dan rata-ratanya. Jika dispersi absolut digantikan dengan simpangan bakunya maka dispersi relatifnya disebut Koefisien Variasi (KV). Variasi simpangan rata-rata adalah dispersi relatif yang dispersi absolutnya digantikan dengan simpangan rata-rata. Kemencengan atau kemiringan (skewness) adalah tingkat ketidaksimetrisan atau kejauhan simetri dari sebuah distribusi. Ukuran keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu distribusi data terhadap distribusi normalnya data. Dengan kata lain, keruncingan atau kurtosis adalah tingkat kepuncakan dari sebuah distribusi normal.

Evaluasi Mandiri

Diketahui dua kelompok data berikut:

Kelompok data 1 : 7, 4, 10, 9, 15, 12, 12, 7, 9, 7

Kelompok data 2 : 8, 11, 4, 3, 2, 5, 10, 6, 4, 1, 10, 8, 12, 6, 5, 7

Untuk masing-masing kelompok data tersebut:

Tentukanlah:

Simpangan rata-rata;
Variansi;
Standar deviasi;
Koefisien variasi!

Tentukanlah derajat kemiringan distribusi data tersebut dan jenis kemiringan dengan cara berikut:

Koefisien kemiringan Pearson
Koefisien kemiringan momen berderajat tiga
Koefisien kemiringan Bowley

Jumlah kecelakaan pada pabrik ditunjukkan pada tabel berikut.

Rata-Rata Kecelakaan

Jumlah Pabrik

1,5 – 1,7

1,8 – 2,0

2,1 – 2,3

2,4 – 2,6

2,7 – 2,9

3,0 – 3,2

Jumlah

Tentukan koefisien variasinya!
Tentukan kemencengan dan jenis kurvanya!
Tentukan keruncingan dan jenis kurvanya!
Tentukan jarak, simpangan kuartil, deviasi rata-rata, varians, dan simpangan baku dari data-data berikut!
7, 4, 5, 3, 8, 6, 7
8,772; 6,453; 10,163; 8,542; 9,635; 6,325
-3, -2, -5, -6, -8, -1, -3, -7

Seorang pengamat ekonomi ingin meneliti dampak krisis ekonomi terhadap pendapatan masyarakat di Kabupaten Pasuruan. Untuk itu diambil sampel secara acak masing-masing sebanyak 16 rumah tangga di dua desa dan ditanya berapa pendapatan per minggunya. Data hasil penelitian di dua desa tersebut (dalam ribuan rupiah) adalah sebagai berikut:

Penduduk desa I : 19 18 18 19 18 19 19 18

18 19 17 20 16 17 22 18

Penduduk desa II: 18 17 17 18 18 17 18 17

17 18 18 19 20 21 20 17

Berdasarkan data tersebut, tentukanlah:

Rata-rata dan standar deviasi pendapatan rumah tangga di desa tersebut.
Koefisien variasi dua kelompok data tersebut.
Penduduk desa mana yang mempunyai pendapatan lebih merata.
Sebuah lampu pijar memiliki rata-rata pemakaian 3.500 jam dengan simpangan baku 1.050 jam. Lampu pijar lain memiliki rata-rata pemakaian 9.000 jam dengan simpangan baku 2.000 jam.
Tentukan koefisien variasi kedua lampu tersebut!
Yang manakah dari kedua lampu itu yang memiliki variasi ketahanan lebih baik?
Seorang mahasiswa mendapat nilai 85 pada ujian akhir statistik dengan rata-rata dan simpangan baku kelompok 78 dan 10. Ujian akhir matematika dengan rata-rata dan simpangan baku kelompok masing-masing 82 dan 16, ia mendapat nilai 90. Pada mata ujian manakah, mahasiswa tersebut mencapai kedudukan lebih baik?
Apabila:

Tentukan

Dengan menggunakan distribusi frekuensi berikut:

Kelas

Frekuensi

0 – 4

5 – 9

10 – 14

15 – 19

20 – 24

Tentukan jaraknya.
Hitung deviasi standard dan variansnya.
Persentase penduduk berumur 10 tahun ke atas yang bekerja menurut jam kerja selama seminggu.

Jam Kerja

Persentase

0 – 9

10 – 19

20 – 29

30 – 39

40 – 49

50 – 59

60 – 69

Carilah rata-rata, median, dan modus jam kerja.
Hitung tingkat kemiringan dan keruncingan.
Tentukan kemencengan dan keruncingan distribusi frekuensi berikut, gunakan rumus koefisien kemencengan momen!

Berat Badan

Frekuensi

35 – 39

40 – 44

45 – 49

50 – 54

55 – 59

60 – 64

65 – 69

UKURAN PENYEBARAN DATA

BAB V