Kamis, 29 Desember 2016

DISTRBUSI STATISTIK DAN TABEL KONTIGENSI MENGGUNAKAN SOFTWARE R



BAB I
PENDAHULUAN

1.1    Statistik Deskriptif
               Statistika deskriptif adalah bagian dari ilmu statistika yang hanya mengolah, menyajikan data tanpa mengambil keputusan untuk populasi. Dengan kata lain hanya melihat gambaran secara umum dari data yang didapatkan.
1.2    Distribusi Binomial
               Distribusi binomial adalah distribusi probabilitas diskrit jumlah keberhasilan dalam n percobaan berhasil/gagal  yang saling bebas, dimana setiap hasil percobaan memiliki probabilitas p. Eksperimen berhasil/gagal juga disebut percobaan bernoulli. Ketika n = 1, distribusi binomial adalah distribusi bernoulli. Distribusi binomial merupakan dasar dari uji binomial dalam uji signifikansi statistik.
1.3    Distribusi Multinomial
               Perluasan dan distribusi binomial adalah distribusi multinomial.Misalkan sebuah eksperimen menghasilkan peristiwa-peristiwa E,E,…….,E dengan peluang P(E),),…..).
1.4    Histogram
               Histogram adalah tampilan grafis dari tabulasi frekuensi yang digambarkan dengan grafis batangan sebagai manifestasi data binning. Tiap tampilan batang menunjukkan proporsi frekuensi pada masing-masing deret kategori yang berdampingan  dengan interval yang tidak tumpang tindih. 
1.5    Distribusi Normal
               Distribusi normal merupakan distribusi teoritis dari variabel random yang kontinu. Pengalaman telah membuktikan bahwa sebagian besar dari variabel random yang kontinu di berbagai bidang aplikasi yang beraneka ragam umumnya memiliki distribusi yang didekati dengan distribusi normal atau dapat menggunakan sebagai model teoritisnya. Distribusi normal yang demikian merupakan distribusi yang simetris, berbentuk genta dan kontinu serta memiliki fungsi frekuensi.
1.6    Tabel Kontigensi
               Tabel kontigensi atau tabulasi silang merupakan satu bentuk distribusi frekuensi untuk dua variabel atau lebih. Akan tetapi tidak semua pengolah data mengetahui dengan baik bagaimana menyajikan tabulasi yang cocok agar suatu laporan dapat berbobot. Pada pengumpulan data sering dijumpai bahwa informasi yang berasal dari sampel mempunyai struktur yang paling sederhana, yaitu data diklasifikasikan atau dikategorikan dalam kelas-kelas sehingga data berupa frekuensi dari kelas tertentu (Nugraha, 2003).
1.7    Odds Ratio (OR)
               Odds adalah cara penyajian probabilitas, yang menjelaskan probabilitas bahwa kejadian tersebut akan terjadi dibagi dengan probabilitas bahwa kejadian itu tidak akan terjadi. Odds adalah rasio probabilitas sukse () terhadap probabilitas gagal      (1-).
Ketika odds = 1, berarti probabilitas sukses sama dengan probabilitas gagal. Ketika odds bernilai < 1 maka probabilitas sukses lebih kecil daripada probabilitas gagal. Dan sebaliknya, jika nilai odds > 1 maka probabilitas sukses lebih besar daripada probabilitas gagal.
Rasio odds adalah salah satu dari berbagai statistic yang digunakan untuk menilai resiko kejadian tertentu seperti penyakit jika suatu faktor tertentu ada. Rasio odds digunakan untuk statistika deskriptif, dan memainkan peran penting dalam regresi logistic. Odds ratio (OR) merupakan rasio dari dua odds.


BAB II
DESKRIPSI KERJA

2.1 Studi Kasus
Pada praktikum kali ini praktikan diminta untuk menggunakan program R dengan membuat distribusi statistik dan plot data dari data yang telah disediakan serta membuat tabel kontigensi.
2.2 Langkah Kerja
Berikut adalah deskripsi dari langkah kerja yang dilakukan praktikan:
1.    Sebelum memulai menganalisis data menggunakan program R, langkah pertama yang praktikan lakukan adalah Klik Start à Pilih All Program à Pilih R, maka akan muncul tampilan seperti berikut :
Gambar 2.2.1 Tampilan awal lembar kerja Software R
2.    Setelah masuk lembar kerja, maka praktikan akan memulai menuliskan syntax untuk membuat histogram dari variabel kecepatan dengan datanya (4,7,9,10,12,13,16,17,18,19) seperti berikut.
Gambar 2.2.2 Tampilan Syntax
3.      Maka akan muncul output yang dihasilkan.
4.    Selanjutnya, memasukkan data variabel kecepatan dan variabel jarak untuk membuat plot gabungan dengan syntax seperti berikut.
Gambar 2.2.3 Tampilan Syntax
5.      Maka akan muncul output yang dihasilkan.
6.      Membuat grafik distribusi normal dari variabel dengan μ = 12 dan σ = 5. Lalu gabungkan dengan grafik distribusi normal dari variabel kecepatan dengan μ = 13 dan σ = 6. Lihat syntax berikut.
Gambar 2.2.4 Tampilan Syntax
7.      Praktikan mencari hasil distribusi binomial dengan nilai:

            i. P(X = 5 | n = 15, π = 0.8)
            ii. P(X ≤ 5 | n = 15, π = 0.8)
            iii. P(X = x | n = 15, π = 0.8) > 0.3
            Berikut syntax yang ditulis.
Gambar 2.2.5 Tampilan Syntax mencari nilai distribusi binomial
8.    Kemudian mencari hasil distribusi poisson dengan nilai:
i. P(X = 3 | λ = 5)
ii. P(X ≤ 3 | λ = 5)
iii. P(X = x | λ = 5) > 0.3
            Berikut syntax yang ditulis.
Gambar 2.2.6 Tampilan Syntax mencari nilai distribusi poisson
9.    Selanjutnya mencari hasil distribusi normal dengan nilai:
i. P(X = 10 | μ = 5, σ = 20)
ii. P(X ≤ 10 | μ = 5, σ = 20)
iii. P(X = x | μ = 5, σ = 20) > 0.5
Berikut syntax yang ditulis.
Gambar 2.2.7 Tampilan Syntax mencari nilai distribusi normal
10.         Praktikan mencari hasil nilai P-Value dari distribusi F pada x = 1.8 dengan df1 = 3 dan df2 = 10. Berikut syntax yang ditulis.
Gambar 2.2.8 Tampilan Syntax mencari nilai P-Value
11.  Perintah yang terakhir membuat tabel kontingensi data tanaman pangan tahun 2015 pada empat provinsi di Indonesia yaitu Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, dan Kalimantan Selatan. Lihat syntax berikut.
Gambar 2.2.9 Tampilan Syntax membuat matriks
12.  Maka akan muncul output yang dihasilkan.



BAB III
PEMBAHASAN

Praktikan akan membahas atau menerangkan tentang proses mengolah data dengan membuat distribusi statistik dan plot data dari data yang telah disediakan serta membuat tabel kontigensi dengan menggunakan program R.
Langkah pertama praktikan membuat histogram dari data kecepatan (4,7,9,10,12,13,16,17,18,19).  Berikut output dan penjelasannya.
Gambar 3.1 Tampilan Output histogram variabel kecepatan
Histogram diatas merupakan output dari data variabel kecepatan yang telah dibuat dengan 10 data dimana kecepatan 0-5 mempunyai frekuensi 1, pada kecepatan 6-10 mempunyai frekuensi 3, pada kecepatan 11-15 mempunyai frekuensi 2 dan pada kecepatan 16-20 mempunyai frekuensi 4.
Kemudian data variabel kecepatan ditambah dengan variabel lain yakni variabel jarak dan dibuat plot gabungan dari kedua variabel tersebut. Berikut output dan penjelasannya
Gambar 3.2 Tampilan Output plot gabungan
Plot dapat digunakan untuk menggambar kurva. Plot diatas dapat dijelaskan bahwa variabel kecepatan berada pada garis horizontal dan variabel jarak pada garis vertikal dimana dapat diartikan pada variabel kecepatan dengan data 4 maka jaraknya 2, variabel kecepatan dengan data 7 jaraknya begitu seterusnya sampai pada data kecepatan 19 maka jaraknya berada pada titik 46.
            Praktikan membuat grafik distribusi normal dari variabel kecepatan dengan μ = 12 dan σ = 5. Lalu gabungkan dengan grafik distribusi normal dari variabel kecepatan dengan μ = 13 dan σ = 6. Berikut output dan penjelasannya.
Gambar 3.3 Tampilan Output
Matriks diatas menggunakan ncol=4 yang artinya jumlah kolom yang dibuat berjumlah 4 karena ber ordo 4x4. Setelah itu fungsi >c befungsi untuk memanggil matriks yang telah dibuat.
Kemudian mencari nilai distribusi binomial dengan syntax yang telah dimasukkan pada bab deskripsi kerja. Berikut output dan penjelasannya:
Gambar 3.4 Tampilan Output distribusi binomial
Untuk mencari distribusi binomial dapat menggunakan syntax >dbinom(x,n,p), >pbinom(x,n,p) dan >qbinom(q,n,p). Arti dari masing-masing syntax tersebut adalah:
>dbinom(x,n,p)artinya untuk mencari angka yang pasti dari distribusi binomial dengan nilai x, n dan p yang sudah diketahui.
>pbinom(x,n,p) artinya untuk mencari nilai kumulatif dari distribusi binomial dengan nilai x, n dan p yang sudah diketahui.
>qbinom(q,n,p) artinya untuk mencari nilai x dari distribusi binomial dengan nilai q, n dan p yang sudah diketahui.
Kemudian mencari nilai distribusi poisson dengan syntax yang telah dimasukkan pada bab deskripsi kerja. Berikut output dan penjelasannya:
Gambar 3.5 Tampilan Output distribusi poisson
     Untuk mencari distribusi poisson dapat menggunakan syntax >dpois(x,lambda), >ppois(x,lambda) dan >qpois(q,lambda). Arti dari masing-masing syntax tersebut adalah:
>dpois(x,lambda) artinya untuk mencari angka yang pasti dari distribusi poisson dengan nilai x dan lambda yang sudah diketahui.
>ppois(x,lambda) artinya untuk mencari nilai kumulatif dari distribusi poisson dengan nilai x dan lambda yang sudah diketahui.
>qpois(q,lambda) artinya untuk mencari nilai x dari distribusi poisson dengan nilai x dan lambda yang sudah diketahui.
Kemudian mencari nilai distribusi normal dengan syntax yang telah dimasukkan pada bab deskripsi kerja. Berikut output dan penjelasannya:
Gambar 3.6 Tampilan Output distribusi normal
     Untuk mencari distribusi normal dapat menggunakan syntax >dnorm(x,µ,), >pnorm(x,µ,) dan >qnorm(q,µ,). Arti dari masing-masing syntax tersebut adalah:
>dnorm(x,µ,) artinya untuk mencari angka yang pasti dari distribusi normal dengan nilai x,µ dan  yang sudah diketahui.
>pnorm(x,µ,) artinya untuk mencari nilai kumulatif dari distribusi normal dengan nilai x,µ dan  yang sudah diketahui.
>qnorm(q,µ,) artinya untuk mencari nilai x dari distribusi normal dengan nilai x,µ dan  yang sudah diketahui.
Kemudian mencari nilai P-Value dengan syntax yang telah dimasukkan pada bab deskripsi kerja. Berikut output dan penjelasannya:
Gambar 3.7 Tampilan Output P-Value
Untuk mencari nilai P-Value dapat menggunakan syntax >1-pf(x,df1,df2),yang dapat diartikan mencari nilai dari distribusi F dengan diketahui nilai x dan derajat bebas kesatu dengan derajat bebas yang kedua. Jika nilai p lebih kecil dari nilai alpha artinya dapat ditolak pada tingkat 5% sedangkan akan gagal tolak pada tingkat 1%. Dari hasil output diatas bernilai sebesar 0,2107391 artinya tolak pada tingkat tetapi gagal tolak apabila menggunakan tingkat signifikansi 1%.
Selanjutnya membuat tabel kontingensi data tanaman pangan tahun 2015 pada empat provinsi di Indonesia yaitu Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, dan Kalimantan Selatan. Berikut output dan penjelasannya:
Gambar 3.8 Tampilan Output tabel kontigensi
Tabel kontigensi merupakan suatu bentuk distribusi frekuensi untuk dua variabel. Tabel kontigensi ini dapat diklasifikasikan atau dikategorikan dalam kelas-kelas sehingga data berupa frekuensi dari kelas tertentu dimana dalam hal ini dibuat produksi tanaman pangan yang dapat memudahkan untuk dibaca dan didapat informasinya. Output diatas terdapat 2 kategori yaitu provinsi yang didalamnya terdapat Kalimantan Barat, Kalimantan  Tengah, Kalimantan  Selatan dan Kalimantan  Timur dengan kategori produksi tanaman pangan yang didalamnya terdapat Padi, Jagung, Kedelai dan Kacang Tanah.
BAB IV
PENUTUP

Dari praktikum yang dilakukan oleh praktikan, maka praktikan dapat menyimpulkan beberapa hal yang program praktikan buat dengan dengan menggunakan program R seperti berikut:
1.      Telah dibuat histogram dari variabel kecepatan dengan 10 data dimana kecepatan 0-5 mempunyai frekuensi 1, pada kecepatan 6-10 mempunyai frekuensi 3, pada kecepatan 11-15 mempunyai frekuensi 2 dan pada kecepatan 16-20 mempunyai frekuensi 4.
2.      Plot dapat digunakan untuk menggambar kurva. Plot pada output dapat dijelaskan bahwa variabel kecepatan berada pada garis horizontal dan variabel jarak pada garis vertikal.
3.      Kjln
4.      Hasil dari distribusi binomial dengan dbinom, pbinom dan qbinom didapatkan hasil 0.000100764, 0.0001132257 dan 11.
5.      Hasil dari distribusi poisson dengan dpois, ppois dan qpos didapatkan hasil 0.1403739, 0.2650259 dan 4.
6.      Hasil dari distribusi normal dengan dnorm, pnorm dan qnorm didapatkan hasil 0.01933341, 0.5987063 dan 5.
7.      Nilai  p-value didapatkan hasil 0.2107391, yang artinya ditolak apabila  menggunakan tingkat signifikansi 5% sedangkan akan gagal tolak apabila  menggunakan tingkat signifikansi 1%
8.      Software R dapat digunakan untuk membuat matriks dimana terdapat 2 kategori yaitu provinsi yang didalamnya terdapat Kalimantan Barat, Kalimantan  Tengah, Kalimantan  Selatan dan Kalimantan  Timur dengan kategori produksi tanaman pangan yang didalamnya terdapat Padi, Jagung, Kedelai dan Kacang Tanah.
                                                                                    











DAFTAR PUSTAKA

Dr. Jaka Nugraha. M.Si. “Modul Praktikum Analisis Data Kategorik “ Universitas Islam Indonesia, Yogyakarta.

Ucup. “Statistik Deskriptif” (Online). http://ucupkelings.wordpress.com/sejarah-statistika/. Diakses tanggal 10 Oktober 2016).

Walpole Ronald E dan Raymond H Myes, 1995, “Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuan”, Institut Teknologi Bandung : Bandung.

___. 2012. “Distribusi Normal” (Online). http://mrfree793.blogspot.com/2012/06/distribusi-normal.html. Diakses tanggal 10 Oktober 2016).









Tidak ada komentar:

Posting Komentar