Home  |  Pustaka  |  Statistik  |  Analisis  |  Tutorial  |  Kontak

Jenis data

Dalam ranah statistik, data dibedakan menjadi dua jenis (Santoso, 2010; Ismail, 2018) yaitu sebagai berikut:
  • Data kualitatif, adalah data yang dinyatakan dalam bentuk bukan angka. Jenis data ini meliputi data nominal dan ordinal.
  • Data kuantitatif, adalah data yang dinyatakan dalam bentuk angka. Jenis data ini meliputi data interval dan rasio.
Data kualitatif tidak berupa angka, sementara statistik hanya bisa memproses data yang berupa angka. Oleh karena itu data kualitatif harus dikuantitatifkan atau diubah menjadi data kuantitatif. Caranya bisa dengan memberi skor tertentu atau memberi rangking (Santoso, 2010 : hal. 3).

Data nominal

Data nominal, diperoleh dengan cara kategorisasi atau klasifikasi dalam bentuk kodifikasi. Misalnya jenis kelamin, diberi kode atau simbol 1 untuk pria, dan 0 (nol) untuk wanita.

Ciri-ciri jenis data nominal :
  1. Posisi data setara, dalam contoh jenis kelamin walaupun pria diberi simbol 1 (satu) tapi bukan berarti lebih tinggi dibandingkan dengan wanita yang diberi simbol 0 (nol).
  2. Tidak bisa dilakukan operasi aritmetika, misalnya 1 > 0.
  3. Jenis data numerik paling rendah karena hanya merupakan simbol.

Data ordinal

Data ordinal diperoleh dengan cara kategorisasi atau klasifikasi dan disusun berdasarkan peringkat. Misalnya pendidikan seseorang diberi simbol 1 (SD), 2 (SMP) dan 3 (SMA).

Ciri-ciri jenis data ordinal :
  1. Posisi data tidak setara, dalam contoh SMA (3) lebih tinggi dibanding SMP (2) dan SD (1).
  2. Tidak bisa dilakukan operasi aritmetika. Walaupun terdapat rank (tingkatan) tapi bukan berarti SMA (3) = SMP (2) + SD (1).
  3. Jarak antar data tidak ditentukan dan tidak diketahui. Misalnya pada skala Likert kepuasan, antara puas (3) dengan cukup puas (2) dan kurang puas (1) tidak mempunyai jarak tertentu.

Data interval

Data interval diperoleh dari pengukuran dengan memperhitungkan jarak antar dua titik data. Misalnya angka dalam bilangan kalender, antara tanggal 1 September dengan 26 September mempunyai interval 25 hari.

Ciri-ciri jenis data interval :
  1. Tidak ada kategorisasi
  2. Dapat dilakukan operasi aritmetika seperti +, - dan x.
  3. Tidak mempunyai nilai nol absolut

Data rasio

Merupakan jenis data kasta tertinggi dalam statistik, dan mempunyai satuan pengukuran. Contoh data berat badan dan suhu tubuh.

Ciri-ciri jenis data rasio :
  1. Dapat dilakukan operasi aritmetika seperti +, - dan x.
  2. Mempunyai nilai nol absolut
  3. Mempunyai satuan pengukuran

Method of Successive Interval

Dalam riset sosial yang bersifat kualitatif terdapat banyak angka tapi bukan merupakan value. Jenis data tersebut merupakan jenis data nominal dan data ordinal.
Data kualitatif tidak berupa angka, sementara statistik hanya bisa memproses data yang berupa angka. Oleh karena itu data kualitatif harus dikuantitatifkan atau diubah menjadi data kuantitatif. Caranya bisa dengan memberi skor tertentu atau memberi rangking (Santoso, 2010 : hal. 3).
Method of Successive Interval (MSI) merupakan methode untuk menaikkan skala ordinal menjadi skala interval.
Penaikan skala ordinal menjadi interval biasanya digunakan pada riset sosial yang menggunakan kuesioner. Hal ini dikarenakan jawaban kuesioner walaupun berupa angka dalam skala Likert, tetapi sejatinya bukan bilangan ( value ).

Implementasi MSI pada analisis parametrik

Hasil konversi atau penaikkan skala ordinal menjadi skala interval dengan metode MSI dapat digunakan untuk analisis parametrik seperti regresi. Caranya sama dengan regresi dari skor jawaban, hanya saja inputnya diganti dengan hasil perhitungan MSI.
Dalam prakteknya tidak ada perubahan output analisis parametriksecara signifikan antara input ordinal dengan input yang sudah dinaikkan menjadi skala interval sehingga metode MSI kurang efektif (Ismail, 2018 p 74). Oleh karena itu perhitungan MSI sudah lama ditinggalkan dan muncul beberapa metode terbaru seperti regresi ordinal. Belakangan mencuat analisis model stuktural seperti SEM dan PLS.

Tahapan/langkah menghitung MSI

  1. Menghitung frekuensi setiap skor jawaban
  2. Menghitung proporsi (P) setiap skor jawaban
  3. Menghitung proprosi kumulatif (PK)
  4. Mencari nilai Z dari PK
  5. Menghitung densitas F(z)
  6. Menghitung scale value SV(z)
  7. Merubah skale value terkecil (FK) setara satu
  8. Menghitung SVi(z) + FK

Simulasi

Hasil jawaban kuesioner disajikan dalam tabel berikut :

Tabel 1. Tabulasi jawaban responden dalam skala ordinal Sumber : Adifta (2018)

Berdasarkan data di atas dapat disusun tabel konversi penaikan skala ordinal menjadi skala interval, sebagai berikut :

Tabel 2. Perhitungan MSI Dari perhitungan MSI di atas maka tabel konversi ordinal ke interval sebagai berikut :

Tabel 3. Tabulasi jawaban responden dalam skala interval Penjelasan setiap kolom pada tabel 2 :
  1. Kolom Ordinal, digunakan untuk menulis skor jawaban dalam skala Likert
  2. Kolom F, frekuensi setiap skor jawaban (Langkah 1).
    Contoh ordinal 2 diperoleh F = 6. Artinya jumlah responden yang menjawab skor 2 (tidak setuju) ada 6 responden.
  3. Kolom Pi, proporsi (P) setiap skor jawaban (Langkah 2).
    Contoh ordinal 2 diperoleh Pi = 0.1714, dihitung dari 6/35 (jumlah responden). Artinya sebanyak 17,14% responden menjawab skor 2.
  4. Kolom PKi, proporsi (P) kumulatif setiap skor jawaban (Langkah 3).
    Contoh ordinal 2 diperoleh PKi = 0.2000, dihitung dari P(1)=0.0286 + P(2)=0.1714. Artinya sebanyak 20,00% responden menjawab sampai dengan skor 2.
  5. Kolom Zvi, nilai Z untuk PK (Langkah 4).
    Contoh ordinal 2 diperoleh Z = 0.8400, artinya PK 20,00% dalam distribusi normal Z berada pada titik 0.84.
    Lihat cara membaca tabel Z. Jika memakai Excel gunakan fungsi ROUND(NORMSINV(cell))
  6. Kolom Oi, nilai densitas/ordinat Z (Langkah 5).
    Contoh ordinal 2 diperoleh Oi = 0.2803, artinya luas kurva normal pada titik 0.8400 sebesar 28.03%.
    Lihat cara membaca Tabel Densitas. Jika memakai Excel gunakan fungsi ROUND(NORMDIST(cell))
  7. Kolom Svi, nilai skala dari densitas (Langkah 6).
    Untuk masing-masing densitas disajikan perhitungannya sebagai berikut :
  8. Menghitung FK (faktor pengali) yaitu konersi nilai Svi terkecil menjadi satu (Langkah 7).
    Nilai Svi terkecil = -2.2937 (pada ordinal 1)
    FK - 2.2937 = 1
    FK = 1 + 2.2937
    FK = 3.2937 (dibulatkan menjadi 3.29)
  9. Kolom interval = Svi + FK
    Contoh ordinal 2 menjadi interval = -1.25 + 3.29 = 2.04
    Artinya skor 2 pada skala ordinal dinaikan dalam skala interval menjadi 2.04

Hipotesis

Hipotesis merupakan dugaan kesimpulan sementara dalam sebuah riset. Konsep hipotesis sampling dalam ranah statistik pertama kali diperkenalkan William Sealy Gosset (Hanley, 2008). Hipotesis Gosset saat itu bahwa semua bir yang diproduksi Guines Bir Irlandia mempunyai kadar alokohol yang sama.

Pengembangan hipotesis

Hipotesis disusun berdasarkan (Gujarati, 2009) :
  1. Teori yang sudah baku
    Contoh : jika harga barang meningkat maka permintaan akan menurun (dasar : teori suplay and demmand
  2. Rujukan jurnal/riset terdahulu
    Contoh : perubahan harga saham tidak mempengaruhi niat investasi ( dasar : temuan Famma tentang efisiensi pasar modal, tapi belum menjadi sebuah teori)
  3. Keyakinan peneliti
    Contoh : A dan B berumur sama, jika A terbang ke angkasa mendekati kecepatan cahaya maka ketika kembali ke bumi akan mendapati B berusia lanjut sementara A hanya bertambah beberapa hari ( dasar : keyakinan Albert Eisntein, tapi belum ada eksperimen yang membuktikan ).

Rumusan hipotesis

  1. Hipotesis dua arah, karena rujukan teori yang kurang kuat dan dukungan jurnal tidak memadai. Ciri utama hipotesis dua arah tidak menyebutkan arah pengaruh atau perbedaan. Hipotesis semacam ini banyak ditemukan pada penelitian explanatory.
    Contoh : Religiusitas berpengaruh terhadap partisipasi Keluarga Berencana
    Dalam hal ini peneliti tidak merasa yakin apakah religiusitas seseorang akan mendorongnya untuk ikut KB atau bahkan menolak sama sekali, terutama kaum muslim yang merasa yakin bahwa mempunyai banyak anak adalah sunah Rasulullah Saw.
  2. Hipotesis satu arah, rujukan teori yang kurang kuat dan dukungan jurnal memadai. Ciri utama hipotesis dua arah tidak menyebutkan arah pengaruh atau perbedaan. Hipotesis satu arah terdiri dari dua jenis :
    1. Hipotesis sisi kiri, untuk menyatakan X berpengaruh negatif terhadap Y
      Contoh : locus of control berpengaruh negatif terhadap tindakan anarkis
    2. Hipotesis sisi kanan untuk menyatakan X berpengaruh positif terhadap Y
      Contoh : Pemupukan berpengaruh positif terhadap pertumbuhan tanaman

Pengujian hipotesis

Ketentuan pengujian hipotesis didasarkan pada uji partial t-test(Gujarati, 2013):

Pengujian one tail (right tail)
  1. Ha ditolak jika th ≤ tα
  2. Ha diterima jika th > tα
Pengujian one tail (left tail)
  1. Ha ditolak jika th ≥ tα
  2. Ha diterima jika -th < -tα
Pengujian two tail
  1. Ha ditolak jika -tα/2 ≤ th ≤ tα/2
  2. Ha diterima jika -th < -tα/2 atau th > tα/2

Tabel F

Unduh halaman lainnya : df 10 - 20     df 22 - ∞

Distribusi F pertama kali dipublikasikan tahun 1912 (Pearson, 1938). Simbol huruf F sebagai penghormatan atas penemunya Fisher. Mengabadikan temuannya distribusi F biasanya disebut F Distribusi.

Membaca Tabel F

Nilai probability tabel F terletak pada perpotongan kolom (degree of freedom (k)) dengan baris (degree of freedom (n-k)).
Sebagai contoh, nilai F tabel dengan level of signifikan 5% dan derajat bebas k = 3 dan n-k = 9 adalah 3,86.

Pengecualian

Terdapat beberapa pengecualian membaca tabel F apabila nilai df (n-k) tidak tercantum dalam tabel, maka pembacaan tabel t sebagai berikut :
  1. Jika df > 200 ≅ df = ∞
  2. Diambil nilai df yang memberikan nilai F paling besar (Graveter, 2009 : 265
    Misal nilai F untuk dfk = 3 dan dfn-k = 56 pada α 5%

    Dalam tabel distribusi F, diketahui df=56 terletak antara :
    df = 40 : 2.84
    df = 60 : 2.76
    Karena df=43 lebih dekat ke df=40 maka nilai F (3, 43) pada α 5% ≅ 2,84
  3. Jika tidak tercantum nilai df pada tabel maka dfn diambil yang memberikan nilai F paling besar
    Misal nilai F untuk dfk = 3 dan dfn-k = 43 pada α 5%

    Dalam tabel distribusi F, diketahui df=43 terletak antara :
    df = 40 : 2.84
    df = 60 : 2.76
    Karena df=43 lebih dekat ke df=40 maka nilai F (3, 43) pada α 5% ≅ 2,84
  4. Pendekatan yang lebih akurat dengan menggunakan metode interpolasi.
    Pelajari lebih lengkap (klik) polarisasi

Uji multikolinearitas

Multikolinearitas pada sebuah model menggambarkan terjadinya saling mempengaruhi antar variabel bebas. Sebuah model yang fit ditunjukkan dengan pengaruh variabel bebas hanya terhadap variabel tak bebas Y.

Metode pengujian multikolinearitas

Banyak metode untuk menguji Multikolinearitas, salah satunya adalah uji VIF.
Pada aplikasi eViews hanya mengklik View pada output regresi.

Dengan SPSS langkahnya sebagai berikut :
  1. Lakukan regresi seperti biasa
  2. Pilih option Statistics
  3. Pada popup window pilih Collinearity diagnostics.
Video tutorial Instagram akun MikroStat

Kriteria bebas multikolinearitas

  • Korelasi (r) semua variabel bebas Xi < R2, atau
  • VIF semua variabel bebas Xi < 10
Figure 1. Contoh output uji multikolinearitas dengan aplikasi eViews. Figure 2. Contoh output uji multikolinearitas dengan aplikasi SPSS. Figure 3. Contoh output uji multikolinearitas dengan kriteria korelasi r.

Nilai yang harus diperhatikan pada angka-angka yang dilingkari merah (jika VIF < 10 berarti bebas gejala multikolinearitas). Beberapa literatur ada yang memilih dengan kriteria korelasi r (Figure 3) dengan ketentuan nilai r < 70% (Gujarti, 2009) atau r < R2.

nVivo

Nvivo merupakan aplikasi untuk analisis kualitatif.

Interpolasi

Tidak semua nilai critical value tercantum dalam tabel statistik. Untuk mengetahui nilai critical value pada df (degree of freedom) yang ditentukan dapat dicari dengan penaksiran nilai pada df terdekat. Tehnik ini dikenal dengan istilah interpolasi (Mulyono, 2009) atau polarisasi (Yamane, 1967).

Sebenarnya interpolasi adalah suatu metode untuk menentukan data yang hilang. Gujarati (2009) memperkenalkan perhitungan interpolasi untuk memprediksi sebuah titik data pada time series (Bab 21). Dengan demikian, interpolasi didefinisikan sebagai teknik untuk mendapatkan fungsi (taksiran suatu titik) yang melewati semua titik dari sebuah set data diskrit (Lamabelawa, 2018).

Formulasi interpolasi

Formulasi interpolasi didasarkan pada interpolasi linier (Lamabelawa, 2018) yang dikembangkan Abbott (dalam Mulyono, 2009) dengan perubahan notasi syntax untuk memudahkan aplikasi dalam pencarian nilai critical value tertentu.

Keterangan:
Vn:Nilai critical value yang dicari
Vn-1:Nilai critical value pada df sebelumnya
Vn+1 : Nilai critical value pada df sesudahnya
dfn : Nilai df untuk critical value yang dicari
dfn-1: Nilai df sebelumnya
dfn+1:Nilai df sesudahnya

Ilustrasi interpolasi

Critical value untuk df=34 dengan α 5% pada tabel t dalam Gujarati (2009 : 879 Appendix D) tidak tercantum. Figure 1. Penggalan tabel t

Dengan interpolasi linier dapat dicari besarnya nilai t untuk df=34 pada α 5%. Dari hasil perhitungan diperoleh nilai t pada df=34 dengan α adalah 1,692.
Untuk perbandingan, jika dihitung menggunakan Excel dengan fungsi =t.inv(5%,34) diperoleh nilai 1,691.

Menghitung interpolasi

Untuk mencari critical value, klik di sini.
Aplikasi Google Spreadsheet harus sudah terinstal di Android.

The First Difference Method

Introduction

Since ρ lies between 0 and ± 1, one could start from two extreme positions. At one extreme, one could assume that ρ = 0, that is, no (first-order) serial correlation, and at the other extreme we could let ρ = ± 1, that is, perfect positive or negative correlation. As a matter of fact, when a regression is run, one generally assumes that there is no autocorrelation and then lets the Durbin–Watson or other test show whether this assumption is justified.
If, however, ρ = + 1, the generalized difference equation reduces to the first difference equation (Gujarati, 2013 : 443):
Yt − Yt−1 = β2(Xt − Xt−1) + (ut − ut−1)

Tabel d

Tabel Statistik d

Cara penulisan nilai d tabel

p (d) = d (k, df, α)

Keterangan :
d : statistik d
p(d) : Nilai (probabilitas) statistik d
k : jumlah variabel bebas (Xi)
df : derajat bebas = n
α : level of significant, umumnya 5%
Nilai probability tabel d dibagi menjadi dua titik, yaitu dl dan du. Oleh karena itu penulisan d mengandung dua kemungkinan antara dl dengan du, kecuali bila disebut khusus.
Sebagai contoh :
Nilai statistik du untuk mengetahui pengaruh bulanan inflasi dan kurs rupiah terhadap volume ekspor pada level of signifikan 5% selama satu tahun, dapat ditulis nilai du (2, 12, 5% ).

Membaca Tabel d

Nilai probability tabel d terletak pada perpotongan kolom (level of significant) dengan baris (degree of freedom).
Sebagai contoh, nilai du ( 3, 30, 5% ) adalah 1,65.

Pengecualian

Terdapat beberapa pengecualian membaca tabel d dalam hal (Gujarati, 2013):
  1. Jika df > 200 ≅ df = ∞ df=200
  2. Jika tidak tercantum nilai df pada tabel maka dfn ≅ dfn-1
    Misal nilai du (3, 63, 5% ) ekuivalen dengan du (3, 60, 5% ) sebesar 1,689.
    Konsep : nilai df yang tercantum sebelum df = 63 adalah df=60.
  3. atau, dicari ke df terdekat
    Misal nilai du (3, 63, 5% ) ekuivalen dengan du (3, 65, 5% ) sebesar 1,696.
    Konsep : nilai df = 63 lebih dekat ke df = 65 dibandingkan dengan df = 60.
  4. Pendekatan yang lebih akurat dengan menggunakan metode interpolasi.
    Pelajari lebih lengkap (klik) polarisasi