A. VALIDITAS DAN RELIABILITAS
Reliabilitas adalah ukuran yang menujukkan bahwa alat ukur yang digunakan dalam penelitian keperilakukan mempunyai keandalan sebagai alat ukur, diantaranya di ukur melalui konsistensi hasil pengukuran dari waktu ke waktu jika fenomena yang diukur tidak berubah (Harrison, dalam Zulganef, 2006). Sementara validitas adalah suatu ukuran yang menunjukkan bahwa variabel yang diukur memang benar-benar variabel yang hendak diteliti oleh peneliti (Cooper dan Schindler, dalam Zulganef, 2006)
Penelitian memerlukan data yang betul valid dan reliabel. Dalam rangka urgensi ini, maka kuesioner sebelum digunakan sebagai data penelitian primer, terlebih dahulu diujicobakan ke sampel uji coba penelitian. Uji coba ini dilakukan untuk memperoleh bukti sejauh mana ketepatan dan kecermatan alat ukur dalam melakukan fungsi ukurnya
Definisi validitas dan reliabilitas dapat dilihat di sini
B. CONTOH KASUS
Akan di uji validitas dan reliabilitas variabel motivasi kerja. Variabel ini berjumlah 5 indikator yang diadaptasi dari Intrinsic factor dari teori dua factor Herzberg meliputi pekerjaan itu sendiri, keberhasilan yang diraih, kesempatan bertumbuh, kemajuan dalam karier dan pengakuan orang lain.
Skala yang digunakan adalah skala Likert 1 – 5 dengan jumlah sampel sebanyak 30. Setelah angket ditabulasi maka diperoleh data sbb (Data Reliabilitas)
C. PENYELESAIAN
Pilih Analyze > Scale > Reliability Analysis
Masukkan semua variabel (item 1 s/d 5) ke kotak items
Klik Kotak Statistics, lalu tandai ITEM, SCALE, dan SCALE IF ITEM DELETED pada kotak DESCRIPTIVES FOR > Continue
Klik OK
Maka akan tampil output sebagai berikut :
D. INTERPRETASI
Reliabilitas
Sekaran (dalam Zulganef, 2006) yang menyatakan bahwa suatu instrumen penelitian mengindikasikan memiliki reliabilitas yang memadai jika koefisien alpha Cronbach lebih besar atau sama dengan 0,70. Sementara hasil uji menunjukkan koef cronbach alpha sebesar 0.900, dengan demikian dapat disimpulkan bahwa variabel ini adalah reliabel.
Validitas Item
Model pengujian menggunakan pendekatan korelasi item-total dikoreksi (corrected item-total correlation) untuk menguji validitas internal setiap item pernyataan kuesioner yang disusun dalam bentuk skala. Untuk menentukan apakah sebuah item dinyatakan valid atau tidak maka para ahli menetapkan patokan besaran koefisien korelasi item total dikoreksi sebesar 0,25 atau 0,30 sebagai batas minimal valid tidaknya sebuah ítem. Artinya, sama atau lebih besar dari 0,25 atau 0,30 mengindikasikan item tersebut memiliki validitas yang memadai.
Kriteria penafsiran validitas instrument setelah didapatkan hasil perhitungan adalah jika r hitung > r table. r table didapatkan dari Tabel Nilai Product Moment didapatkan dari derajat kebebasan (dk) = n – 2, n adalah jumlah responden dan signifikansi (taraf kesalahan) yang dipergunakan yaitu 5%, sehingga diperoleh r tabel = 0.374
Berdasarkan hasil uji yang diperlihatkan seluruh item pernyataan yang diberikan memiliki nilai koefisien korelasi lebih besar dari 0,30 maupun dengan cara membandingkannya dengan r tabel. Dengan demikian, item-item pernyataan yang diberikan dalam kuesioner telah memenuhi syarat valid dan dapat diikutsertakan dalam analisis data selanjutnya.
Referensi :
Zulganef. 2006. Pemodelan Persamaan Struktur dan Aplikasinya menggunakan AMOS 5. Bandung : Pustaka
A. Pendahuluan
Analisis korelasi digunakan untuk menjelaskan kekuatan dan arah hubungan antara dua variabel. Korelasi bersifat undirectional yang artinya tidak ada yang ditempatkan sebagai predictor dan respon (IV dan DV).
Angka korelasi berkisar antara -1 s/d +1. Semakin mendekati 1 maka korelasi semakin mendekati sempurna. Sementara nilai negative dan positif mengindikasikan arah hubungan. Arah hubungan yang positif menandakan bahwa pola hubungan searah atau semakin tinggi A menyebabkan kenaikan pula B (A dan B ditempatkan sebagai variabel)
Interprestasi angka korelasi menurut Prof. Sugiyono (2007)
0 - 0,199 : Sangat lemah
0,20 - 0,399 : Lemah
0,40 - 0,599 : Sedang
0,60 - 0,799 : Kuat
0,80 - 1,0 : Sangat kuat
Dalam Bivariate model, korelasi yang umum digunakan adalah Pearson, Kendall, dan Rank Spearman, namun yang dibahas kali ini adalah Pearson r Correlation aja..
Pearson r correlation:
Pearson r correlation biasa digunakan untuk mengetahui hubungan pada dua variabel. Korelasi dengan Pearson ini mensyaratkan data berdistribusi normal.
Rumus yang digunakan adalah sebagai berikut :
B. Contoh Kasus
Pak Ali ingin mengetahui apakah ada hubungan antara pengawasan (Control), kepuasan kerja (Job Satisfaction), Disiplin kerja (discipline), dan kinerja (Performance). data dapat diambil CONTOH DATA KORELASI
Jumlah data 37.
Instrumen : angket
C. Penyelesaian Kasus dengan SPSS:
Langkah 1. Pada menu Analyze pilih “correlate bivariate” . Setelah itu akan ada tampilan sbb:
Langkah 2.
Masukkan variabel yang akan dikorelasikan ke dalam variable list.
Click on “option” and select “descriptive statistics”, abaikan yang lain lalu klik “OK”
Interprestasi
Arti angka Korelasi
1. Control – Performance. Nilai korelasi adalah positif 0.668. Besaran angka korelasi menunjukkan bahwa korelasi antara Control dan Performance berada dalam kategori “Kuat”, sementara nilai positif mengindikasikan pola hubungan antara Control dengan Performance adalah searah (semakin tinggi Control maka semakin tinggi pula Performance). Perolehan p hitung = 0.000 < 0.05 yang menandakan bahwa hubungan yang terjadi adalah signifikan.
2. Job Satisfaction – Performance. Nilai korelasi adalah positif 0.772. Besaran angka korelasi menunjukkan bahwa korelasi antara Job satisfaction dan Performance berada dalam kategori “Kuat”, sementara nilai positif mengindikasikan pola hubungan antara adalah searah (semakin tinggi Job Sat maka semakin tinggi pula Performance). Perolehan p hitung = 0.000 < 0.05 yang menandakan bahwa hubungan yang terjadi adalah signifikan.
3. Dicipline – Performance. Nilai korelasi adalah positif 0.749. Besaran angka korelasi menunjukkan bahwa korelasi antara Dicipline dan Performance berada dalam kategori “Kuat”, sementara nilai positif mengindikasikan pola hubungan antara dicipline dengan Performance adalah searah (semakin tinggi Control maka semakin tinggi pula Performance). Perolehan p hitung = 0.000 < 0.05 yang menandakan bahwa hubungan yang terjadi adalah signifikan.
Buku Rujukan : Prof. Dr. Sugiyono. Metode Penelitian Administasi. Bandung : Alfabeta
Aplikasi Regresi Liner Sederhana dengan SPSS
REGRESI SEDERHANAAnalisis ini menurut Sugiyono (200) digunakan oleh peneliti bila peneliti bermaksud meramalkan bagaimana keadaan (naik turunnya) variabel dependen (kriterium), bila ada satu variabel independen sebagai prediktor dimanipulasi (dinaik turunkan nilanya). Persamaan yang diperoleh dari regresi sederhana adalah Y = a + b X
y = adalah subjek nilai dalam variabel terikat yang diprediksikan
a = harga Y bila X = 0 (harga konstan)
b = angka arah koefisien regresi
X = subjek pada variabel bebas yang mempunyai nilai tertentu.
Untuk memperoleh hasil perhitungan Regresi, dapat dilakukan dengan tiga cari yaitu perhitungan manual, menggunakan fungsi pada MS. Excel, atau menggunakan Software Statistik (dalam contoh ini digunakan SPSS)
Asumsi yang diperlukan untuk analisis ini adalah uji normalitas. Uji normalitas diperlukan untuk mengetahui apakah data yang terkumpul dari setiap variabel dependen dan independen atau keduanya mempunyai distribusi normal atau tidak. Model regresi yang baik adalah yang mendekati normal (Imam Ghozali,2009).
Untuk melihat model regresi normal atau tidak, dilakukan analisis grafik dengan melihat “normal probability report plot” yang membandingkan antara distribusi kumulatif dari data sesungguhnya dengan distribusi normal. Distribusi normal akan membentuk satu garis lurus diagonal dan ploting data akan dibandingkan dengan garis diagonal. Jika distribusi data normal, maka garis yang menggantikan data sesungguhnya akan mengikuti garis diagonalnya (Imam Ghozali, 2009).
Contoh Kasus :
Pak Hasan ingin mengetahui pengaruh kepuasan kerja (X) terhadap kinerja (Y) karyawannya. Kuesioner kepuasan kerja di adaptasi dari Job Description Index (JDI)) yang dikembangkan oleh Hulin meliputi lima dimensi kepuasan kerja yang dirasakan karyawan yaitu kepuasan terhadap jenis pekerjaan, kesempatan promosi, supervisi, gaji atau upah, dan rekan kerja dengan jumlah total pertanyaan sebanyak 20 item. Sementara kinerja diukur berdasarkan
Ukuran-ukuran dari kinerja pegawai menggunakan lembar evaluasi kinerja yang disusun dikembangkan dari panduan evaluasi kinerja dari James E. Neal Jr (2003) antara lain terdiri dari 7 dimensi yang kemudian dikembangkan menjadi 26 indikator (item pernyataan).
Jumlah sampel penelitian adalah seluruh karyawan yang berjumlah 37 orang. Berdasarkan hasil penyebaran angket diperoleh skor yang dapat dilihat di sini..datareg1
Setelah data dimasukkan ke dalam SPSS, maka analisis dilakukan :
Klik Analyze Regression Linier
masukkan Variabel kinerja (Y) ke dalam dependent box, dan kepuasan kerja (X) ke dalam independent box.
Klik Plot, lalu beri tanda pada Histogram dan Normal Probability Plot (ini untuk uji normalitas), lalu Klik Continue, lalu OK
Output
Interpretasi
A. KORELASI
Berdasarkan hasil analisis seperti yang ditampilkan Tabel di atas (Tabel Model Summary) diketahui bahwa korelasi parsial antara kepuasan kerja dan kinerja pegawai dengan korelasi product moment by Pearson. Hasil korelasi parsial didapat nilai r hitung sebesar 0,772.
Nilai korelasi ini tergolong kuat (> 0,600) dan memiliki nilai positif sehingga dapat dikatakan pola hubungan antara kepuasan kerja dan kinerja adalah searah. Artinya, semakin tinggi kepuasan maka kinerja pun akan semakin tinggi, begitu pula sebaliknya, semakin rendah kepuasan kerja maka kinerja-pun akan semakin rendah. Koefisien determinasinya (KD) menunjukkan nilai sebesar 0,597 atau sebesar 59,70% (dibulatkan 60%) dari hasil (r2 x 100%). Artinya variasi perubahan kinerja dipengaruhi oleh kepuasan kerja sebesar 60% dan sisanya 40% dipengaruhi faktor lain selain kepuasan kerja.
B. REGRESI
Dari Tabel Coefficients diperoleh persamaan : Y = 20.268 Å 1,035 X
Konstanta sebesar 20.268 menyatakan bahwa jika variabel kepuasan kerja bernilai nol, maka kinerja pegawai adalah sebesar 20.268 satuan
Koefisien regresi sebesar 1,035 pada variabel kepemimpinan, maka akan menyebabkan kenaikan kinerja menjadi sebesar 32,251.
Selanjutnya, apakah model yang terjadi tersebut telah memenuhi asumsi normalitas?
Berdasarkan hasil uji terlihat bahwa Grafik Histogram memperlihatkan sebaran data menyebar ke seluruh daerah kurva normal, sehingga dapat dinyatakan bahwa data mempunya distribusi normal. Sementara hasil uji menggunakan P-P Plot menunjukkan bahwa data mengikuti garis diagonal sehingga dinyatakan bahwa data berdistribusi normal.
C. Uji Hipotesis
Dari hasil perhitungan didapat kesimpulan bahwa kepuasan kerja (X) memiliki hubungan yang siginifikan dengan kinerja. Hasil uji t (Tabel Coefficients) diperoleh nilai t hitung sebesar 7.194.
Sedangkan statistik tabel (t tabel) diperoleh dari Tabel t (terlampir) sebesar 2.028 artinya t hitung > t tabel (7,194 > 2.028). Sehingga dapat ditarik kesimpulan bahwa, variabel bebas kepuasan kerja (X) secara parsial memiliki hubungan positif dan signifikan terhadap kinerja (Y). hasil uji t ini sejalan dengan sig 0.000 yang jauh lebih kecil dari alpha 0.05 sehingga disimpulkan bahwa X memiliki pengaruh signifikan terhadap Y
Referensi :
Ghozali, Imam. 2009. Aplikasi Analisis Multivariate dengan Program SPSS. Semarang : BP-UNDIP
Sugiyono. 2007. Metode Penelitian Administasi. Bandung : Alfabeta
Uji Asumsi 1 : Uji Normalitas dalam SPSS
Dua post saya terdahulu tentang Uji Asumsi 1 berbicara hal-hal teoritis mengenai uji normalitas. Sekarang bagaimana prakteknya? Maksud saya dengan praktek tentu saja bagaimana cara menghitungnya.
Dalam kesempatan ini saya akan banyak berbicara mengenai bagaimana cara melakukan uji normalitas menggunakan SPSS. Saya memilih SPSS dengan alasan program ini paling banyak dipakai oleh mahasiswa psikologi sehingga bisa dikatakan paling familiar. Selain itu SPSS termasuk program yang cukup user friendly sehingga cukup mudah digunakan meskipun oleh orang yang tidak mempelajari statistik sangat dalam.
Langkah Awal
Saya berasumsi paling tidak pembaca artikel ini adalah orang yang sudah pernah berurusan dengan SPSS. Paling tidak tahu bagaimana memulai SPSS dan membuka file. Jadi saya akan langsung berkisah mengenai cara melakukan analisis datanya.
Cara Pertama
Ada satu kebiasaan yang saya amati ketika teman-teman hendak melakukan uji normalitas dengan SPSS. Biasanya mereka memilih menu :
Analyze - Non Parametrik Test - 1 Sample KS
Setelah diklik pada menu ini, akan muncul dialog box seperti ini:
Sekarang yang kita lakukan hanya memasukkan variabel yang ingin kita uji normalitasnya ke dalam kotak Test Variable List. Kemudian klik OK. Hasil yang akan didapat kurang lebih seperti ini:
Lalu bagaimana cara membacanya? Untuk kepentingan uji asumsi, yang perlu dibaca hanyalah 2 item paling akhir, nilai dari Kolmogorov-Smirnov Z dan Asymp. Sig (2-tailed).
Dalam kesempatan ini saya akan banyak berbicara mengenai bagaimana cara melakukan uji normalitas menggunakan SPSS. Saya memilih SPSS dengan alasan program ini paling banyak dipakai oleh mahasiswa psikologi sehingga bisa dikatakan paling familiar. Selain itu SPSS termasuk program yang cukup user friendly sehingga cukup mudah digunakan meskipun oleh orang yang tidak mempelajari statistik sangat dalam.
Langkah Awal
Saya berasumsi paling tidak pembaca artikel ini adalah orang yang sudah pernah berurusan dengan SPSS. Paling tidak tahu bagaimana memulai SPSS dan membuka file. Jadi saya akan langsung berkisah mengenai cara melakukan analisis datanya.
Cara Pertama
Ada satu kebiasaan yang saya amati ketika teman-teman hendak melakukan uji normalitas dengan SPSS. Biasanya mereka memilih menu :
Analyze - Non Parametrik Test - 1 Sample KS
Setelah diklik pada menu ini, akan muncul dialog box seperti ini:
Sekarang yang kita lakukan hanya memasukkan variabel yang ingin kita uji normalitasnya ke dalam kotak Test Variable List. Kemudian klik OK. Hasil yang akan didapat kurang lebih seperti ini:
Lalu bagaimana cara membacanya? Untuk kepentingan uji asumsi, yang perlu dibaca hanyalah 2 item paling akhir, nilai dari Kolmogorov-Smirnov Z dan Asymp. Sig (2-tailed).
- Kolmogorov-Smirnov Z merupakan angka Z yang dihasilkan dari teknik Kolmogorov Smirnov untuk menguji kesesuaian distribusi data kita dengan suatu distribusi tertentu,dalam hal ini distribusi normal. Angka ini biasanya juga dituliskan dalam laporan penelitian ketika membahas mengenai uji normalitas.
- Asymp. Sig. (2-tailed). merupakan nilai p yang dihasilkan dari uji hipotesis nol yang berbunyi tidak ada perbedaan antara distribusi data yang diuji dengan distribusi data normal. Jika nilai p lebih besar dari 0.1 (baca posting sebelumnya) maka kesimpulan yang diambil adalah hipotesis nol gagal ditolak, atau dengan kata lain sebaran data yang kita uji mengikuti distribusi normal.
- Jangan terkecoh dengan catatan di bawah tabel yang berbunyi Test distribution is Normal. Catatan ini tidak bertujuan untuk memberitahu bahwa data kita normal, tetapi menunjukkan bahwa hasil analisis yang sedang kita lihat adalah hasil analisis untuk uji normalitas.
Cara Kedua
Cara yang pertama biasanya menghasilkan hasil analisis yang kurang akurat dalam menguji apakah sebuah distribusi mengikuti kurve normal atau tidak. Ini disebabkan uji Kolmogorov Smirnov Z dirancang tidak secara khusus untuk menguji distribusi normal, tetapi distribusi apapun dari satu set data. Selain normalitas, analisis ini juga digunakan untuk menguji apakah suatu data mengikuti distribusi poisson, dsb.
Cara kedua merupakan koreksi atau modifikasi dari cara pertama yang dikhususkan untuk menguji normalitas sebaran data.
Kita memilih menu
Analyze - Descriptive Statistics - Explore...
Sehingga akan muncul dialog box seperti ini:
Yang perlu kita lakukan hanyalah memasukkan variabel yang akan diuji sebarannya ke dalam kotak Dependent List. Setelah itu kita klik tombol Plots... yang akan memunculkan dialog box kedua seperti ini:
Dalam dialog ini kita memilih opsi Normality plots with tests, kemudian klik Continue dan OK. SPSS akan menampilkan beberapa hasil analisis seperti ini:
SPSS menyajikan dua tabel sekaligus di sini. SPSS akan melakukan analisis Shapiro-Wilk jika kita hanya memiliki kurang dari 50 subjek atau kasus. Uji Shapiro-Wilk dianggap lebih akurat ketika jumlah subjek yang kita miliki kurang dari 50.
Jadi bagaimana membacanya? Kurang lebih sama seperti cara pertama. Untuk memastikan apakah data yang kita miliki mengikuti distribusi normal, kita dapat melihat kolom Sig. untuk kedua uji (tergantung jumlah subjek yang kita miliki). Jika sig. atau p lebih dari 0.1 maka kita simpulkan hipotesis nol gagal ditolak, yang berarti data yang diuji memiliki distribusi yang tidak berbeda dari data yang normal. Atau dengan kata lain data yang diuji memiliki distribusi normal.
Cara Ketiga
Jika diperhatikan, hasil analisis yang kita lakukan tadi juga menghasilkan beberapa grafik. Nah cara ketiga ini terkait dengan cara membaca grafik ini.
Ada empat grafik yang dihasilkan dari analisis tadi yang penting juga untuk dilihat sebelum melakukan analisis yang sebenarnya, yaitu:
Cara yang pertama biasanya menghasilkan hasil analisis yang kurang akurat dalam menguji apakah sebuah distribusi mengikuti kurve normal atau tidak. Ini disebabkan uji Kolmogorov Smirnov Z dirancang tidak secara khusus untuk menguji distribusi normal, tetapi distribusi apapun dari satu set data. Selain normalitas, analisis ini juga digunakan untuk menguji apakah suatu data mengikuti distribusi poisson, dsb.
Cara kedua merupakan koreksi atau modifikasi dari cara pertama yang dikhususkan untuk menguji normalitas sebaran data.
Kita memilih menu
Analyze - Descriptive Statistics - Explore...
Sehingga akan muncul dialog box seperti ini:
Yang perlu kita lakukan hanyalah memasukkan variabel yang akan diuji sebarannya ke dalam kotak Dependent List. Setelah itu kita klik tombol Plots... yang akan memunculkan dialog box kedua seperti ini:
Dalam dialog ini kita memilih opsi Normality plots with tests, kemudian klik Continue dan OK. SPSS akan menampilkan beberapa hasil analisis seperti ini:
SPSS menyajikan dua tabel sekaligus di sini. SPSS akan melakukan analisis Shapiro-Wilk jika kita hanya memiliki kurang dari 50 subjek atau kasus. Uji Shapiro-Wilk dianggap lebih akurat ketika jumlah subjek yang kita miliki kurang dari 50.
Jadi bagaimana membacanya? Kurang lebih sama seperti cara pertama. Untuk memastikan apakah data yang kita miliki mengikuti distribusi normal, kita dapat melihat kolom Sig. untuk kedua uji (tergantung jumlah subjek yang kita miliki). Jika sig. atau p lebih dari 0.1 maka kita simpulkan hipotesis nol gagal ditolak, yang berarti data yang diuji memiliki distribusi yang tidak berbeda dari data yang normal. Atau dengan kata lain data yang diuji memiliki distribusi normal.
Cara Ketiga
Jika diperhatikan, hasil analisis yang kita lakukan tadi juga menghasilkan beberapa grafik. Nah cara ketiga ini terkait dengan cara membaca grafik ini.
Ada empat grafik yang dihasilkan dari analisis tadi yang penting juga untuk dilihat sebelum melakukan analisis yang sebenarnya, yaitu:
- Stem and Leaf Plot. Grafik ini akan terlihat seperti ini:
Grafik ini akan terlihat mengikuti distribusi normal jika data yang kita miliki memiliki distribusi normal. Di sini kita lihat sebenarnya data kita tidak dapat dikatakan terlihat normal, tapi bentuk seperti ini ternyata masih dapat ditoleransi oleh analisis statistik sehingga p yang dimiliki masih lebih besar dari 0.1.
Dari grafik ini kita juga dapat melihat ada satu data ekstrim yang nilainya kurang dari 80 (data paling atas). Melihat situasi ini kita perlu berhati-hati dalam melakukan analisis berikutnya.
Dari grafik ini kita juga dapat melihat ada satu data ekstrim yang nilainya kurang dari 80 (data paling atas). Melihat situasi ini kita perlu berhati-hati dalam melakukan analisis berikutnya.
- Normal Q-Q Plots. Grafik Q-Q plots akan terlihat seperti ini:
Garis diagonal dalam grafik ini menggambarkan keadaan ideal dari data yang mengikuti distribusi normal. Titik-titik di sekitar garis adalah keadaan data yang kita uji. Jika kebanyakan titik-titik berada sangat dekat dengan garis atau bahkan menempel pada garis, maka dapat kita simpulkan jika data kita mengikuti distribusi normal.
Dalam grafik ini kita lihat juga satu titik yang berada sangat jauh dari garis. Ini adalah titik yang sama yang kita lihat dalam stem and leaf plots. Keberadaan titik ini menjadi peringatan bagi kita untuk berhati-hati melakukan analisis berikutnya.
- Detrended Normal Q-Q Plots. Grafik ini terlihat seperti di bawah ini:
Grafik ini menggambarkan selisih antara titik-titik dengan garis diagonal pada grafik sebelumnya. Jika data yang kita miliki mengikuti distribusi normal dengan sempurna, maka semua titik akan jatuh pada garis 0,0. Semakin banyak titik-titik yang tersebar jauh dari garis ini menunjukkan bahwa data kita semakin tidak normal. Kita masih bisa melihat satu titik 'nyeleneh' dalam grafik ini (sebelah kiri bawah).
Sekilas Mengenai Outlier
Dari tadi kita membahas satu titik nyeleneh di bawah sana, tapi itu sebenarnya apa? Dan bagaimana kita tahu itu subjek yang mana?
Titik 'nyeleneh' ini sering juga disebut Outlier. Titik yang berada nun jauh dari keadaan subjek lainnya. Ada beberapa hal yang dapat menyebabkan munculnya outlier ini:
Sekilas Mengenai Outlier
Dari tadi kita membahas satu titik nyeleneh di bawah sana, tapi itu sebenarnya apa? Dan bagaimana kita tahu itu subjek yang mana?
Titik 'nyeleneh' ini sering juga disebut Outlier. Titik yang berada nun jauh dari keadaan subjek lainnya. Ada beberapa hal yang dapat menyebabkan munculnya outlier ini:
- Kesalahan entry data.
- Keadaan tertentu yang mengakibatkan error pengukuran yang cukup besar (misal ada subjek yang tidak kooperatif dalam penelitian sehingga mengisi tes tidak dengan sungguh-sungguh)
- Keadaan istimewa dari subjek yang menjadi outlier.
Jika outlier disebabkan oleh penyebab no 1 dan 2, maka outlier dapat dihapuskan dari data. Tetapi jika penyebabnya adalah no 3, maka outlier tidak dapat dihapuskan begitu saja. Kita perlu melihat dan mengkajinya lebih dalam subjek ini.
Lalu bagaimana tahu subjek yang mana yang menjadi outlier? Kita bisa melihat pada grafik berikutnya yang dihasilkan dari analisis yang sama, grafik boxplot seperti berikut ini:
Sebelum terjadi kesalahpahaman saya mau meluruskan dulu bahwa tulisan C10,Q1, Median, Q3 dan C90 itu hasil rekaan saya sendiri. SPSS tidak memberikan catatan seperti itu dalam hasil analisisnya. Grafik ini memberi gambaran mengenai situasi data kita dengan menyajikan 5 angka penting dalam data kita yaitu: C10 (percentile ke 10), Q1 (kuartil pertama atau percentil ke 25), Median (yang merupakan kuartil kedua atau percentile 50), Q3 (atau kuartil ketiga atau percentile 75) dan C90 (percentile ke 90).
Selain itu dalam data ini kita juga dapat melihat subjek yang menjadi outlier, dan SPSS memberitahu nomor kasus dari subjek kita ini; yaitu no 3. Jadi jika kita telusuri data kita dalam file SPSS, kita akan menemukan subjek no 3 ini yang menjadi outlier dalam data kita.
Catatan akhir: Sangat penting bagi kita untuk tidak sepenuhnya bergantung pada hasil analisis statistik dalam bentuk angka. Kita juga perlu untuk 'melihat' (dalam arti yang sebenarnya) data kita dalam bentuk grafik bahkan keadaan data kita dalam worksheet SPSS untuk memeriksa kejanggalan-kejanggalan yang mungkin terjadi.
Lalu bagaimana tahu subjek yang mana yang menjadi outlier? Kita bisa melihat pada grafik berikutnya yang dihasilkan dari analisis yang sama, grafik boxplot seperti berikut ini:
Sebelum terjadi kesalahpahaman saya mau meluruskan dulu bahwa tulisan C10,Q1, Median, Q3 dan C90 itu hasil rekaan saya sendiri. SPSS tidak memberikan catatan seperti itu dalam hasil analisisnya. Grafik ini memberi gambaran mengenai situasi data kita dengan menyajikan 5 angka penting dalam data kita yaitu: C10 (percentile ke 10), Q1 (kuartil pertama atau percentil ke 25), Median (yang merupakan kuartil kedua atau percentile 50), Q3 (atau kuartil ketiga atau percentile 75) dan C90 (percentile ke 90).
Selain itu dalam data ini kita juga dapat melihat subjek yang menjadi outlier, dan SPSS memberitahu nomor kasus dari subjek kita ini; yaitu no 3. Jadi jika kita telusuri data kita dalam file SPSS, kita akan menemukan subjek no 3 ini yang menjadi outlier dalam data kita.
Catatan akhir: Sangat penting bagi kita untuk tidak sepenuhnya bergantung pada hasil analisis statistik dalam bentuk angka. Kita juga perlu untuk 'melihat' (dalam arti yang sebenarnya) data kita dalam bentuk grafik bahkan keadaan data kita dalam worksheet SPSS untuk memeriksa kejanggalan-kejanggalan yang mungkin terjadi.