Uji-T dalam Pemrograman R: Uji-T Satu Sampel & Uji-T Berpasangan [Contoh]

Apa itu Inferensi Statistik?

Inferensi Statistik adalah seni menghasilkan kesimpulan tentang distribusi data. Seorang data scientist seringkali dihadapkan pada pertanyaan yang hanya bisa dijawab secara ilmiah. Oleh karena itu, inferensi statistik merupakan strategi untuk menguji apakah suatu hipotesis benar, yakni divalidasi oleh data.

Strategi umum untuk menilai hipotesis adalah dengan melakukan uji-t. Uji-t dapat mengetahui apakah dua kelompok mempunyai mean yang sama. Uji-t disebut juga a Tes Siswa. Uji-t dapat diperkirakan untuk:

  1. Sebuah vektor tunggal (yaitu, uji-t satu sampel)
  2. Dua vektor dari kelompok sampel yang sama (yaitu uji-t berpasangan).

Anda berasumsi bahwa kedua vektor tersebut diambil sampelnya secara acak, independen, dan berasal dari populasi yang terdistribusi normal dengan variansi yang tidak diketahui namun sama.

Apa itu T-Test dalam Pemrograman R?

Ide dasar di balik Uji-T adalah menggunakan statistik untuk mengevaluasi dua hipotesis yang berlawanan:

  • H0: Hipotesis NULL : Rata-rata sama dengan sampel yang digunakan
  • H3: Hipotesis yang benar: Rata-rata berbeda dengan sampel yang digunakan

Uji-T biasanya digunakan dengan ukuran sampel yang kecil. Untuk melakukan uji-t, Anda perlu mengasumsikan normalitas data.

Sintaks Uji-T di R

Sintaks dasar untuk t.test() di R adalah:

t.test(x, y = NULL,
       mu = 0, var.equal = FALSE)
arguments:
- x : A vector to compute the one-sample t-test
- y: A second vector to compute the two sample t-test
- mu: Mean of the population- var.equal: Specify if the variance of the two vectors are equal. By default, set to `FALSE`

Uji-T Satu Sampel di R

Uji t Satu Sampel, atau uji siswa, membandingkan rata-rata vektor terhadap rata-rata teoritis, Uji-T Satu Sampel di R. Rumus yang digunakan untuk menghitung uji-t adalah:

Uji-T Satu Sampel di R

Di sini,

  • Uji-T Satu Sampel di R mengacu pada mean
  • Uji-T Satu Sampel di R dengan arti teoritis
  • s adalah simpangan baku
  • n jumlah pengamatan.

Untuk mengevaluasi signifikansi statistik uji-t, Anda perlu menghitung p-value. itu p-value berkisar dari 0 hingga 1, dan ditafsirkan sebagai berikut:

  • Nilai p yang lebih rendah dari 0.05 berarti Anda sangat yakin untuk menolak hipotesis nol, dengan demikian H3 diterima.
  • Nilai p yang lebih tinggi dari 0.05 menunjukkan bahwa Anda tidak memiliki cukup bukti untuk menolak hipotesis nol.

Anda dapat membuat nilai p dengan melihat nilai absolut uji-t yang sesuai dalam distribusi Student dengan derajat kebebasan sama dengan Uji-T Satu Sampel di R

Misalnya, jika Anda memiliki 5 observasi, Anda perlu membandingkan nilai t kami dengan nilai t pada distribusi Student dengan 4 derajat kebebasan dan interval kepercayaan 95 persen. Untuk menolak hipotesis nol, nilai t harus lebih tinggi dari 2.77.

Lihat tabel di bawah ini:

Uji-T Satu Sampel di R

Satu Contoh Contoh Uji-T di R

Misalkan Anda adalah perusahaan yang memproduksi kue. Setiap kue seharusnya mengandung 10 gram gula. Kue-kue tersebut diproduksi oleh mesin yang menambahkan gula ke dalam mangkuk sebelum mencampurkan semuanya. Anda yakin mesin tidak menambahkan 10 gram gula untuk setiap kue. Jika asumsi Anda benar, mesin perlu diperbaiki. Anda menyimpan kadar gula dari tiga puluh kue.

Note: Anda dapat membuat vektor acak dengan fungsi rnorm(). Fungsi ini menghasilkan nilai yang terdistribusi normal. Sintaks dasarnya adalah:

rnorm(n, mean, sd)
arguments
- n: Number of observations to generate
- mean: The mean of the distribution. Optional
- sd: The standard deviation of the distribution. Optional

Anda dapat membuat distribusi dengan 30 observasi dengan mean 9.99 dan standar deviasi 0.04.

set.seed(123) sugar_cookie <- rnorm(30, mean = 9.99, sd = 0.04)
head(sugar_cookie)

Keluaran:

## [1]  9.967581  9.980793 10.052348  9.992820  9.995172 10.058603

Anda dapat menggunakan uji-t satu sampel untuk memeriksa apakah kadar gulanya berbeda dengan resep. Anda dapat menggambar uji hipotesis:

  • H0: Kadar gula rata-rata sama dengan 10
  • H3: Rata-rata kadar gulanya berbeda dari 10

Anda menggunakan tingkat signifikansi 0.05.

# H0 : mu = 10
t.test(sugar_cookie, mu = 10)

Berikut hasilnya:

Satu Contoh Contoh Uji-T di R

Nilai p dari uji one sample t-test adalah 0.1079 dan di atas 0.05. Anda dapat yakin 95% bahwa jumlah gula yang ditambahkan oleh mesin adalah antara 9.973 dan 10.002 gram. Anda tidak dapat menolak hipotesis nol (H0). Tidak ada cukup bukti bahwa jumlah gula yang ditambahkan oleh mesin tidak mengikuti resep.

Uji-T berpasangan di R

Uji-T Berpasangan, atau uji-t sampel dependen, digunakan ketika rata-rata kelompok yang diberi perlakuan dihitung dua kali. Penerapan dasar uji-t berpasangan adalah:

  • Pengujian A / B: Bandingkan dua varian
  • Studi Pengendalian Kasus: Sebelum/sesudah perawatan

Contoh Uji T Berpasangan di R

Sebuah perusahaan minuman tertarik untuk mengetahui kinerja program diskon terhadap penjualan. Perusahaan memutuskan untuk memantau penjualan harian salah satu tokonya yang sedang dipromosikan program tersebut. Di akhir program, perusahaan ingin mengetahui apakah ada perbedaan statistik antara penjualan rata-rata toko sebelum dan sesudah program.

  • Perusahaan melacak penjualan setiap hari sebelum program dimulai. Ini adalah vektor pertama kami.
  • Program ini dipromosikan selama satu minggu dan penjualannya dicatat setiap hari. Ini adalah vektor kedua kami.
  • Anda akan melakukan uji-t untuk menilai efektivitas program. Hal ini disebut uji-t berpasangan karena nilai kedua vektor berasal dari distribusi yang sama (yaitu toko yang sama).

Pengujian hipotesisnya adalah:

  • H0: Tidak ada perbedaan mean
  • H3: Kedua cara tersebut berbeda

Ingat, salah satu asumsi dalam uji-t adalah variansi yang tidak diketahui namun sama. Pada kenyataannya, data tersebut hampir tidak memiliki mean yang sama, dan hal ini menyebabkan hasil uji-t yang salah.

Salah satu solusi untuk melonggarkan asumsi variansi yang sama adalah dengan menggunakan uji Welch. R mengasumsikan kedua varian tidak sama secara default. Dalam dataset Anda, kedua vektor memiliki varian yang sama, Anda dapat mengatur var.equal= TRUE.

Anda membuat dua vektor acak dari distribusi Gaussian dengan mean lebih tinggi untuk penjualan setelah program.

set.seed(123)
# sales before the program
sales_before <- rnorm(7, mean = 50000, sd = 50)
# sales after the program.This has higher mean
sales_after <- rnorm(7, mean = 50075, sd = 50)
# draw the distribution
t.test(sales_before, sales_after,var.equal = TRUE)

Contoh Uji T Berpasangan di R

Anda memperoleh nilai p sebesar 0.04606, lebih rendah dari ambang batas 0.05. Anda menyimpulkan bahwa rata-rata kedua kelompok berbeda secara signifikan. Program ini meningkatkan penjualan toko.

Kesimpulan

  • Inferensi Statistik adalah seni menghasilkan kesimpulan tentang distribusi data.
  • Uji-T termasuk dalam keluarga statistik inferensial. Hal ini biasanya digunakan untuk mengetahui apakah ada perbedaan statistik antara rata-rata dua kelompok.
  • Uji t Satu Sampel, atau uji siswa, membandingkan rata-rata vektor dengan rata-rata teoritis.
  • Uji-T Berpasangan, atau uji-t sampel dependen, digunakan ketika rata-rata kelompok yang diberi perlakuan dihitung dua kali.

Uji-t tersebut dapat kita simpulkan pada tabel dibawah ini:

uji Hipotesis untuk diuji p-value Kode Argumen opsional
uji-t satu sampel Rata-rata suatu vektor berbeda dengan rata-rata teoretis 0.05
t.test(x, mu = mean)
uji-t sampel berpasangan Mean A berbeda dengan mean B untuk kelompok yang sama 0.06
t.test(A,B, mu = mean)
var.equal= TRUE

Jika kita berasumsi variansnya sama, kita perlu mengubah parameter var.equal= TRUE.