Т-тест у програмуванні R: один зразок і парний Т-тест [Приклад]
Що таке статистичний висновок?
Статистичний висновок — це мистецтво створення висновків щодо розподілу даних. Науковці даних часто стикаються з питаннями, на які можна відповісти лише науково. Таким чином, статистичне висновок — це стратегія перевірки вірності гіпотези, тобто підтвердженої даними.
Загальною стратегією оцінки гіпотези є проведення t-тесту. Т-критерій може визначити, чи дві групи мають однакове середнє значення. Т-критерій також називають a Тест студента. Т-тест можна оцінити для:
- Один вектор (тобто одновибірковий t-тест)
- Два вектори з однієї вибіркової групи (тобто парний t-тест).
Ви припускаєте, що обидва вектори є випадковою вибіркою, незалежні та походять від нормально розподіленої сукупності з невідомими, але рівними дисперсіями.
Що таке T-тест у програмуванні R?
Основна ідея Т-тесту полягає у використанні статистики для оцінки двох протилежних гіпотез:
- H0: НУЛЬОВА гіпотеза: Середнє значення таке ж, як у використаній вибірці
- H3: Справжня гіпотеза: середнє значення відрізняється від використаної вибірки
Т-тест зазвичай використовується для невеликих розмірів вибірки. Щоб виконати t-тест, вам потрібно припустити нормальність даних.
Синтаксис T-тесту в R
Основний синтаксис t.test() у R:
t.test(x, y = NULL, mu = 0, var.equal = FALSE) arguments: - x : A vector to compute the one-sample t-test - y: A second vector to compute the two sample t-test - mu: Mean of the population- var.equal: Specify if the variance of the two vectors are equal. By default, set to `FALSE`
Один зразок Т-тесту в R
Т-критерій однієї вибірки, або критерій Стьюдента, порівнює середнє значення вектора з теоретичним середнім, . Формула, яка використовується для обчислення t-критерію:
Тут,
відноситься до середнього
до теоретичного середнього
- s — стандартне відхилення
- n кількість спостережень.
Щоб оцінити статистичну значущість t-критерію, потрібно обчислити р-значення, р-значення коливається від 0 до 1 і інтерпретується таким чином:
- P-значення, нижче за 0.05, означає, що ви повністю впевнені, що відхилите нульову гіпотезу, тому H3 приймається.
- P-значення вище 0.05 означає, що у вас недостатньо доказів, щоб відхилити нульову гіпотезу.
Ви можете побудувати p-значення, дивлячись на відповідне абсолютне значення t-критерію в розподілі Стьюдента зі ступенями свободи, що дорівнює
Наприклад, якщо у вас є 5 спостережень, вам потрібно порівняти наше t-значення з t-значенням у розподілі Стьюдента з 4 ступенями свободи та 95-відсотковим довірчим інтервалом. Щоб відхилити нульову гіпотезу, t-значення повинно бути вищим за 2.77.
Порівняйте таблицю нижче:
Один приклад T-тесту в R
Припустімо, ви компанія, що виробляє печиво. Кожне печиво має містити 10 грамів цукру. Печиво виробляється машиною, яка додає цукор у миску перед тим, як все змішати. Ви вважаєте, що машина не додає 10 грамів цукру на кожне печиво. Якщо ваше припущення вірне, машину потрібно полагодити. Ви зберегли рівень цукру тридцяти печива.
Примітка:: Ви можете створити рандомізований вектор за допомогою функції rnorm(). Ця функція генерує нормально розподілені значення. Основний синтаксис:
rnorm(n, mean, sd) arguments - n: Number of observations to generate - mean: The mean of the distribution. Optional - sd: The standard deviation of the distribution. Optional
Ви можете створити розподіл із 30 спостережень із середнім значенням 9.99 і стандартним відхиленням 0.04.
set.seed(123) sugar_cookie <- rnorm(30, mean = 9.99, sd = 0.04) head(sugar_cookie)
вихід:
## [1] 9.967581 9.980793 10.052348 9.992820 9.995172 10.058603
Щоб перевірити, чи рівень цукру відрізняється від рецептурного, можна використати t-тест для одного зразка. Ви можете провести перевірку гіпотези:
- H0: Середній рівень цукру дорівнює 10
- H3: Середній рівень цукру відрізняється від 10
Ви використовуєте рівень значущості 0.05.
# H0 : mu = 10 t.test(sugar_cookie, mu = 10)
Ось висновок:
P-значення t-критерію для одного зразка становить 0.1079 і вище 0.05. Ви можете бути впевнені на 95%, що кількість цукру, доданого машиною, становить від 9.973 до 10.002 грамів. Ви не можете відхилити нульову (H0) гіпотезу. Немає достатньо доказів того, що кількість цукру, доданого машиною, не відповідає рецептурі.
Парний T-тест у R
Парний T-критерій або t-критерій залежної вибірки використовується, коли середнє значення для групи, що пройшла лікування, обчислюється двічі. Основним застосуванням парного t-критерію є:
- Тестування A / B: Порівняйте два варіанти
- Кейс-контроль: До/після лікування
Приклад парного T-тесту в R
Компанії, що виробляє напої, цікаво знати ефективність програми знижок на продажі. Компанія вирішила стежити за щоденними розпродажами в одному зі своїх магазинів, де просувається програма. Наприкінці програми компанія хоче знати, чи є статистична різниця між середніми продажами магазину до та після програми.
- Компанія відстежувала продажі щодня до початку програми. Це наш перший вектор.
- Програма просувається протягом тижня, а продажі фіксуються щодня. Це наш другий вектор.
- Ви виконаєте t-тест, щоб оцінити ефективність програми. Це називається парним t-тестом, оскільки значення обох векторів походять з одного розподілу (тобто з одного магазину).
Перевірка гіпотези полягає в:
- H0: немає різниці в середньому
- H3: Два засоби різні
Пам’ятайте, що одне припущення в t-критерії – це невідома, але рівна дисперсія. Насправді дані ледь мають однакове середнє значення, і це призводить до неправильних результатів t-тесту.
Одним із рішень послаблення припущення рівної дисперсії є використання тесту Велча. R припускає, що дві дисперсії не рівні за замовчуванням. У вашому наборі даних обидва вектори мають однакову дисперсію, ви можете встановити var.equal= TRUE.
Ви створюєте два випадкових вектора з розподілу Гауса з вищим середнім для продажів після програми.
set.seed(123) # sales before the program sales_before <- rnorm(7, mean = 50000, sd = 50) # sales after the program.This has higher mean sales_after <- rnorm(7, mean = 50075, sd = 50) # draw the distribution t.test(sales_before, sales_after,var.equal = TRUE)
Ви отримали p-значення 0.04606, що є нижчим за порогове значення 0.05. Ви робите висновок, що середні показники двох груп значно відрізняються. Програма покращує продажі магазинів.
Підсумки
- Статистичний висновок — це мистецтво створення висновків щодо розподілу даних.
- Т-тест належить до сімейства інференціальних статистичних даних. Його зазвичай використовують, щоб з’ясувати, чи є статистична різниця між середніми значеннями двох груп.
- Т-критерій однієї вибірки, або критерій Стьюдента, порівнює середнє значення вектора з теоретичним середнім.
- Парний T-критерій або t-критерій залежної вибірки використовується, коли середнє значення для групи, що пройшла лікування, обчислюється двічі.
Ми можемо підсумувати t-тест у таблиці нижче:
Тест | Гіпотеза для перевірки | р-значення | код | Необов'язковий аргумент |
---|---|---|---|---|
одновибірковий t-тест | Середнє значення вектора відрізняється від теоретичного середнього | 0.05 |
t.test(x, mu = mean) |
|
t-критерій парної вибірки | Середнє значення А відрізняється від середнього значення В для тієї самої групи | 0.06 |
t.test(A,B, mu = mean) |
var.equal= TRUE |
Якщо ми припустимо, що дисперсії рівні, нам потрібно змінити параметр var.equal= TRUE.