Статистичні гіпотези. Нульова та альтернативна гіпотези

Отримані у дослідженнях вибіркові дані завжди обмежені і мають значною мірою випадковий характер. Саме тому для аналізу таких даних і використовується математична статистика, що дозволяє узагальнювати закономірності, отримані на вибірці, і поширювати їх усю генеральну сукупність.

Підкреслимо ще раз, що отримані в результаті експерименту на будь-якій вибірці дані є підставою для судження про генеральну сукупність. Однак через дію випадкових ймовірнісних причин оцінка параметрів генеральної сукупності, зроблена на підставі експериментальних (вибіркових) даних, завжди супроводжуватиметься похибкою, і тому подібні оцінки повинні розглядатися як імовірні, а не як остаточні твердження.

Як свідчить Г.В. Суходольський: «Під статистичною гіпотезою зазвичай розуміють формальне припущення про те, що подібність (або відмінність) деяких параметричних або функціональних характеристиквипадково чи, навпаки, невипадково». Подібні припущення про властивості та параметри генеральної сукупності, відмінність вибірок чи залежності між ознаками отримали назву статистичних гіпотез.

Сутність перевірки статистичної гіпотези полягає в тому, щоб встановити, чи узгоджуються експериментальні дані та висунута гіпотеза, чи допустимо віднести розбіжність між гіпотезою та результатом статистичного аналізу експериментальних даних за рахунок випадкових причин? Таким чином, статистична гіпотеза - це наукова гіпотеза, що допускає статистичну перевірку, а математична статистика - це наукова дисципліна, завданням якої є науково обґрунтована перевірка статистичних гіпотез.

Під час перевірки статистичних гіпотез використовуються два поняття: так звана нульова (позначення Н 0) та альтернативна гіпотеза (позначення Н 1).

При порівнянні розподілів прийнято вважати, що нульова гіпотеза Н 0 - це гіпотеза про схожість, а альтернативна Н 1 - гіпотеза про відмінність. Таким чином, прийняття нульової гіпотези Н 0 свідчить про відсутність відмінностей, а гіпотези Н 1 – наявність відмінностей.

Наприклад, дві вибірки вилучені з нормально розподілених генеральних сукупностей і маємо завдання порівняти ці вибірки. Одна вибірка має параметри та σ 1 , а інша параметри та σ 2 . Нульова гіпотеза Н 0виходить із припущення про те, що = іσ 1 = σ 2 , тобто різниця двох середніх =0 і різницю двох стандартних відхилень σ 1 σ 2 =0 (звідси і назва гіпотези - нульова).

Прийняття альтернативної гіпотези Н 1свідчить про наявність відмінностей і виходить із припущення, що ≠0 та σ 1 σ 2 ,≠0.


Дуже часто альтернативна гіпотеза має назву експериментальної гіпотезиякщо в дослідженні ставиться завдання довести існування відмінностей між вибірками. Якщо ж дослідник хоче довести саме відсутність відмінностей, то експериментальною гіпотезою є нульова гіпотеза.

При порівнянні вибірок альтернативні статистичні гіпотези можуть бути спрямованими та неспрямованими.

Якщо ми помітили, що в одній вибірці індивідуальні значення випробуваних за якоюсь ознакою вище, а в іншій - нижче, то для перевірки відмінностей між вибірками формулюється спрямована гіпотеза . Якщо ми ходимо довести, що в одній групі під впливом якихось експериментальних впливів відбулися більш виражені зміни, необхідно сформулювати спрямовану гіпотезу. Формально вона записується так Н 1: х 1 перевищує х 2. Нульова гіпотеза у своїй виглядає так Н 0: х 1 не перевищує х 2.

Якщо хочемо довести, що різняться форми розподілу, то формулюються ненаправлені гіпотези . Формально вони записуються так Н 1: х 1 відрізняється від х 2. Нульова гіпотеза Н 0: х 1 не відрізняється від х 2.

Взагалі кажучи, при прийнятті чи запереченні гіпотез можливі різні варіанти.

При перевірці гіпотези експериментальні дані можуть суперечити гіпотезі Н 0 тоді ця гіпотеза відхиляється. Інакше, тобто. якщо експериментальні дані узгоджуються з гіпотезою Н 0 вона не відхиляється. Часто в таких випадках говорять, що гіпотеза Н 0 приймається (хоча таке формулювання не зовсім точне, проте воно широко поширене). Звідси видно, що статистична перевірка гіпотез, заснована на експериментальних, вибіркових даних, неминуче пов'язані з ризиком (імовірністю) прийняти хибне рішення. У цьому можливі помилки двох пологів. Помилка першого родувідбудеться, коли буде ухвалено рішення відхилити гіпотезу Н 0 , хоча насправді вона виявляється правильною. Помилка другого родувідбудеться коли буде ухвалено рішення не відхиляти гіпотезу Н 0 , хоча насправді вона буде невірною. Вочевидь, як і правильні висновки може бути прийнято й у випадках. Вищесказане можна подати у вигляді таблиці 25.

Оскільки статистика як метод дослідження має справу з даними, в яких цікаві дослідника закономірності спотворені різними випадковими факторами, більшість статистичних обчислень супроводжується перевіркою деяких припущень або гіпотез про джерело цих даних.

Педагогічна гіпотеза (наукове припущенняе про перевагу того чи іншого методу) у процесі статистичного аналізу перекладається мовою статистичної науки і заново формулюється, щонайменше, у вигляді двох статистичних гіпотез.

Можливі два типи гіпотез: перший тип - описові гіпотези, в яких описуються причини та можливі наслідки. Другий тип - пояснювальні : в них дається пояснення можливим наслідкам з певних причин, а також характеризуються умови, за яких ці слідства обов'язково будуть, тобто пояснюється, в силу яких факторів і умов буде дане слідство. Описові гіпотези не мають передбачення, а пояснювальні мають таку властивість. Пояснювальні гіпотези виводять дослідників на припущення про існування певних закономірних зв'язків між явищами, факторами та умовами.

Гіпотези в педагогічних дослідженнях можуть припускати, що один із засобів (або їх група) буде більш ефективним, ніж інші засоби. Тут гіпотетично висловлюється припущення про порівняльну ефективність засобів, способів, методів, форм навчання.

Більш високий рівень гіпотетичного передбачення полягає в тому, що автор дослідження висловлює гіпотезу про те, що якась система заходів буде не тільки кращою за іншу, але і з ряду можливих систем вона здається оптимальною з точки зору певних критеріїв. Така гіпотеза потребує ще більш суворого від того більш розгорнутому доказі.

Кулаїчов А.П. Методи та засоби аналізу даних у середовищі Windows. Вид. 3-тє, перераб. та дод. - М: ІнКо, 1999, стор 129-131

Психолого-педагогічний словник для вчителів та керівників загальноосвітніх установ. - Ростов-н / Д: Фенікс, 1998, стор 92

На основі зібраних у статистичних дослідженнях даних після їх обробки робляться висновки про досліджувані явища. Ці висновки робляться шляхом висування та перевірки статистичних гіпотез.

Статистичною гіпотезоюназивається будь-яке твердження про вид або властивості розподілу випадкових величин, що спостерігаються в експерименті. Статистичні гіпотези перевіряються статистичними методами.

Перевірена гіпотеза називається основний (нульовий)і позначається Н 0 . Крім нульової висувається ще й альтернативна (конкуруюча) гіпотеза Н 1 ,що заперечує основну . Таким чином, в результаті перевірки буде прийнята одна і лише одна з гіпотез , а друга буде відкинута.

Типи помилок. Висунута гіпотеза перевіряється виходячи з дослідження вибірки, отриманої з генеральної сукупності. Через випадковість вибірки в результаті перевірки не завжди робиться правильний висновок. При цьому можуть виникати такі ситуації:
1. Основна гіпотеза вірна і приймається.
2. Основна гіпотеза вірна, але вона відкидається.
3. Основна гіпотеза неправильна і вона відкидається.
4. Основна гіпотеза неправильна, але вона приймається.
У випадку 2 говорять про помилки першого роду, в останньому випадку йдеться про помилки другого роду.
Таким чином, за одними вибірками приймається правильне рішення, А за іншими – неправильне. Рішення приймається за значенням деякої функції вибірки, яка називається статистичною характеристикою, статистичним критеріємабо просто статистикою. Безліч значень цієї статистики можна розділити на дві непересічні підмножини:

  • Н 0 приймається (не відхиляється), називається областю прийняття гіпотези (допустимою областю);
  • підмножина значень статистики, за яких гіпотеза Н 0 відкидається (відхиляється) і приймається гіпотеза Н 1 ,називається критичною областю.

Висновки:

  1. Критеріємназивається випадкова величина K, яка дозволяє прийняти або відхилити нульову гіпотезу H0.
  2. При перевірці гіпотез можна припуститися помилок 2 пологів.
    Помилка першого родуполягає в тому, що буде відхилено гіпотезу H 0, якщо вона вірна ("перепустка мети"). Імовірність зробити помилку першого роду позначається α і називається рівнем значимості. Найчастіше практично приймають, що α = 0,05 чи α = 0,01.
    Помилка другого родуполягає в тому, що гіпотеза H0 приймається, якщо вона неправильна ("хибне спрацьовування"). Імовірність помилки цього виду позначається β.

Класифікація гіпотез

Основна гіпотеза Н 0 про значення невідомого параметра q розподілу зазвичай виглядає так:
Н0: q = q0.
Конкуруюча гіпотеза Н 1 може при цьому мати такий вигляд:
Н 1: q < q 0 , Н 1: q > q 0 або Н 1: qq 0 .
Відповідно виходить лівостороння, правосторонняабо двостороннякритичні сфери. Граничні точки критичних областей ( критичні точки) визначають за таблицями розподілу відповідної статистики.

Під час перевірки гіпотези розумно зменшити ймовірність прийняття неправильних рішень. Допустима ймовірність помилки першого родупозначається зазвичай aі називається рівнем значимості. Його значення, як правило, мало ( 0,1, 0,05, 0,01, 0,001 …). Але зменшення ймовірності помилки першого роду призводить до збільшення ймовірності помилки другого роду ( b), тобто. Прагнення приймати лише вірні гіпотези викликає зростання кількості відкинутих правильних гіпотез. Тому вибір рівня значущості визначається важливістю поставленої проблеми та тяжкістю наслідків невірно прийнятого рішення.
Перевірка статистичної гіпотези складається з наступних етапів:
1) визначення гіпотез Н 0 та Н 1 ;
2) вибір статистики та завдання рівня значимості;
3) визначення критичних точок До крта критичної області;
4) обчислення щодо вибірки значення статистики До екс;
5) порівняння значення статистики з критичною областю ( До крі До екс);
6) ухвалення рішення: якщо значення статистики не входить у критичну область, то приймається гіпотеза Н 0 і відкидається гіпотеза H 1 , а якщо входить у критичну область, то відкидається гіпотеза Н 0 і приймається гіпотеза Н 1 . При цьому результати перевірки статистичної гіпотези потрібно інтерпретувати так: якщо прийняли гіпотезу Н 1 , то можна вважати її доведеною, а якщо прийнялигіпотезу Н 0 , то визнали, що вона не суперечить результатам спостережень. Однак цією властивістю поряд з Н 0 можуть мати й інші гіпотези.

Класифікація перевірок гіпотез

Розглянемо далі кілька різних статистичних гіпотез та механізмів їх перевірки.
I) Гіпотеза про генеральне середнє значення нормального розподілу при невідомій дисперсії. Припускаємо, що генеральна сукупність має нормальний розподіл, її середнє та дисперсія невідомі, але є підстави вважати, що генеральне середнє дорівнює a . За рівня значимості α потрібно перевірити гіпотезу Н 0: x = a. Як альтернативну можна використовувати одну з трьох розглянутих вище гіпотез. У даному випадкустатистикою служить випадкова величина, що має розподіл Стьюдента з n- 1 ступенями свободи. Визначається відповідне експериментальне (спостережуване) значення t екс t кр Н 1: x >a воно знаходиться за рівнем значущості α і числом ступенів свободи n- 1. Якщо t екс < t кр Н 1: x ≠a критичне значення знаходиться за рівнем значущості α / 2 і тому числі ступенів свободи. Нульова гіпотеза приймається, якщо | t екс | II) Гіпотеза про рівність двох середніх значень довільно розподілених генеральних сукупностей (великі незалежні вибірки). За рівня значимості α потрібно перевірити гіпотезу Н 0: x ≠y. Якщо обсяг обох вибірок великий, можна вважати, що вибіркові середні мають нормальний розподіл, які дисперсії відомі. В цьому випадку як статистику можна використовувати випадкову величину
,
має нормальний розподіл, причому M(Z) = 0, D(Z) = 1. Визначається відповідне експериментальне значення z екс. З таблиці функції Лапласа є критичне значення z кр. При альтернативній гіпотезі Н 1: x > y воно перебуває з умови F(z кр) = 0,5 – a. Якщо z екс< z кр , то нульова гіпотеза приймається, інакше – відкидається. При альтернативній гіпотезі Н 1: x ≠y критичне значення перебуває з умови F(z кр) = 0,5×(1 – a). Нульова гіпотеза приймається, якщо | z екс |< z кр .

III) Гіпотеза про рівність двох середніх значень нормально розподілених генеральних сукупностей, дисперсії яких невідомі та однакові (малі незалежні вибірки). За рівня значущості α потрібно перевірити основну гіпотезу Н 0: x = y. Як статистику використовуємо випадкову величину
,
має розподіл Стьюдента з ( n х + n у- 2) ступенями свободи. Визначається відповідне експериментальне значення t екс. З таблиці критичних точок розподілу Стьюдента перебуває критичне значення t кр. Все вирішується аналогічно до гіпотези (I).

IV) Гіпотеза про рівність двох дисперсій нормально розподілених генеральних сукупностей. У разі при рівні значимості aпотрібно перевірити гіпотезу Н 0: D(Х) = D(Y). Статистикою служить випадкова величина, що має розподіл Фішера - Снедекору з f 1 = n б- 1 і f 2 = n м– 1 ступенями свободи (S 2 б – велика дисперсія, обсяг її вибірки n б). Визначається відповідне експериментальне (спостережуване) значення F екс. Критичне значення F крпри альтернативній гіпотезі Н 1: D(Х) > D(Y) З таблиці критичних точок розподілу Фішера – Снедекора за рівнем значимості aі числу ступенів свободи f 1 і f 2 . Нульова гіпотеза приймається, якщо F екс < F кр.

Інструкція. Для розрахунку необхідно вказати розмірність вихідних даних.

V) Гіпотеза про рівність кількох дисперсій нормально розподілених генеральних сукупностей за вибірками однакового обсягу. У разі при рівні значимості aпотрібно перевірити гіпотезу Н 0: D(Х 1) = D(Х 2) = …= D(Х l). Статистикою є випадкова величина , що має розподіл Кочрена зі ступенями свободи f = n- 1 і l (n –обсяг кожної вибірки, l- Кількість вибірок). Перевірка цієї гіпотези проводиться як і, як і попередньої. Використовується таблиця критичних точок розподілу Кочрена.

VI) Гіпотеза про суттєвість кореляційного зв'язку.У разі при рівні значимості aпотрібно перевірити гіпотезу Н 0: r= 0. (Якщо коефіцієнт кореляції дорівнює нулю, то відповідні величини не пов'язані одна з одною). Статистикою у разі служить випадкова величина
,
має розподіл Стьюдента з f = n- 2 числом ступенів свободи. Перевірка цієї гіпотези проводиться аналогічно до перевірки гіпотези (I).

Інструкція. Вкажіть кількість вихідних даних.

VII) Гіпотеза про значення можливості появи події.Проведено достатньо велика кількість nнезалежних випробувань, у яких подія Авідбулося mразів. Є підстави вважати, що ймовірність настання цієї події в одному випробуванні дорівнює р 0. Потрібно при рівні значимості aперевірити гіпотезу про те, що ймовірність події Адорівнює гіпотетичній ймовірності р 0. (Т.к. ймовірність оцінюється за відносною частотою, то гіпотезу, що перевіряється, можна сформулювати і інакше: значимо чи ні розрізняються спостерігається відносна частота і гіпотетична ймовірність).
Кількість випробувань досить велика, тому відносна частота події Арозподілено за нормальним законом. Якщо нульова гіпотеза вірна, то її математичне очікування дорівнює р 0, а дисперсія. Відповідно до цього як статистику виберемо випадкову величину
,
яка розподілена приблизно за нормальним законом з нульовим математичним очікуванням та одиничною дисперсією. Перевірка цієї гіпотези здійснюється так само, як і у випадку (I).

Інструкція. Для розрахунку потрібно заповнити вихідні дані.

СТАТИСТИЧНІ ГІПОТЕЗИ

Отримані в експериментах вибіркові дані завжди обмежені і мають значною мірою випадковий характер. Ось тому для аналізу таких даних і використовується математична статистика, що дозволяє узагальнювати закономірності, отримані на вибірці, і поширювати їх на всю генеральну сукупність.

Отримані в результаті експерименту на будь-якій вибірці дані є підставою для судження про генеральну сукупність. Однак через дію випадкових ймовірнісних причин оцінка параметрів генеральної сукупності, зроблена на підставі експериментальних (вибіркових) даних, завжди супроводжуватиметься похибкою, і тому подібні оцінки повинні розглядатися як імовірні, а не як остаточні твердження. Подібні припущення про властивості та параметри генеральної сукупності отримали назву статистичних гіпотез . Як свідчить Г.В. Суходольський: «Під статистичною гіпотезою зазвичай розуміють формальне припущення про те, що подібність (або відмінність) деяких параметричних чи функціональних характеристик випадково чи, навпаки, невипадково».

Сутність перевірки статистичної гіпотези полягає в тому, щоб встановити, чи узгоджуються експериментальні дані та висунута гіпотеза, чи допустимо віднести розбіжність між гіпотезою та результатом статистичного аналізу експериментальних даних за рахунок випадкових причин. Отже, статистична гіпотеза – це наукова гіпотеза, яка допускає статистичну перевірку, а математична статистика – це наукова дисципліна, завданням якої є науково обгрунтована перевірка статистичних гіпотез.

Статистичні гіпотези поділяються на нульові та альтернативні, спрямовані та неспрямовані.

Нульова гіпотеза(H 0) – це гіпотеза про відсутність відмінностей. Якщо хочемо довести значимість відмінностей, то нульову гіпотезу потрібно спростувати, інакше потрібно підтвердити.

Альтернативна гіпотеза (Н 1) - гіпотеза про значущість відмінностей. Це те, що ми хочемо довести, тому іноді її називають експериментальної гіпотезою.

Бувають завдання, коли ми хочемо довести якраз незначущістьвідмінностей, тобто підтвердити нульову гіпотезу. Наприклад, якщо нам потрібно переконатися, що різні піддослідні отримують хоч і різні, але врівноважені за труднощами завдання або експериментальна і контрольна вибірки не різняться між собою за якимись значущими характеристиками. Однак частіше нам все-таки потрібно довести значимість відмінностей,бо вони є більш інформативними для нас у пошуку нового.

Нульова та альтернативна гіпотези можуть бути спрямованими та неспрямованими.

Спрямовані гіпотези –якщо передбачається в одній групі значення ознаки вище, а в іншій нижче:

Н 0: Х 1не перевищує Х 2,

Н 1: Х 1перевищує Х 2.

Ненаправлені гіпотези –якщо передбачається що різняться форми розподілу ознаки у групах:

Н 0: Х 1не відрізняється від Х 2,

Н 1: Х 1відрізняється Х 2.

Якщо ми помітили, що в одній із груп індивідуальні значення випробуваних за якоюсь ознакою, наприклад, за соціальною активністю, вищі, а в іншій нижче, то для перевірки значущості цих відмінностей нам необхідно сформулювати спрямовані гіпотези.

Якщо ми хочемо довести, що у групі Апід впливом якихось експериментальних впливів відбулися більш виражені зміни, ніж у групі Б, то нам також необхідно сформулювати спрямовані гіпотези.

Якщо ж хочемо довести, що різняться форми розподілу ознаки у групах Аі Бто формулюються ненаправлені гіпотези.

Перевірка гіпотез здійснюється з допомогою критеріїв статистичної оцінки відмінностей.

Висновок, що приймається, носить назву статистичного рішення. Підкреслимо, що таке рішення завжди ймовірне. Під час перевірки гіпотези експериментальні дані можуть суперечити гіпотезі Н 0тоді ця гіпотеза відхиляється. Інакше, тобто. якщо експериментальні дані узгоджуються з гіпотезою Н 0вона не відхиляється. Часто у таких випадках кажуть, що гіпотеза Н 0приймається. Звідси видно, що статистична перевірка гіпотез, що ґрунтується на експериментальних вибіркових даних, неминуче пов'язана з ризиком (імовірністю) прийняти хибне рішення. У цьому можливі помилки двох пологів. Помилка першого роду станеться, коли буде ухвалено рішення відхилити гіпотезу Н 0хоча насправді вона виявляється вірною. Помилка другого роду станеться, коли буде ухвалено рішення не відхиляти гіпотезу Н 0, хоча насправді вона буде невірною. Вочевидь, як і правильні висновки може бути прийнято й у випадках. У таблиці 7.1 узагальнено сказане вище.

Таблиця 7.1

Не виключено, що психолог може помилитися у своєму статистичному рішенні; як бачимо з таблиці 7.1, ці помилки можуть лише двох пологів. Оскільки виключити помилки при прийнятті статистичних гіпотез неможливо, необхідно мінімізувати можливі наслідки, тобто. прийняття неправильної статистичної гіпотези. Найчастіше єдиний шлях мінімізації помилок полягає у збільшенні обсягу вибірки.

СТАТИСТИЧНІ КРИТЕРІЇ

Статистичний критерій- Це вирішальне правило, що забезпечує надійну поведінку, тобто прийняття істинної та відхилення помилкової гіпотези з високою ймовірністю.

Статистичні критерії позначають також метод розрахунку певної кількості і саме це число.

Коли говоримо, що достовірність відмінностей визначалася за критерієм j *(Критерій - кутове перетворення Фішера), то маємо на увазі, що використовували метод j *до розрахунку певного числа.

За співвідношенням емпіричного та критичного значень критерію ми можемо судити про те, чи підтверджується чи спростовується нульова гіпотеза.

У більшості випадків для того, щоб ми визнали відмінності значущими, необхідно, щоб емпіричне значення критерію перевищувало критичне, хоча є критерії (наприклад, критерій Манна-Уітні або критерій знаків), у яких ми повинні дотримуватись протилежного правила.

У деяких випадках розрахункова формула критерію включає кількість спостережень у досліджуваній вибірці, що позначається як n. У цьому випадку емпіричне значення критерію одночасно є тестом для перевірки статистичних гіпотез. За спеціальною таблицею ми визначаємо, який рівень статистичної значимостівідмінностей відповідає ця емпірична величина. Прикладом такого критерію є критерій j *, що обчислюється на основі кутового перетворення Фішера.

У більшості випадків, однак, те саме емпіричне значення критерію може виявитися значущим або незначним залежно від кількості спостережень у досліджуваній вибірці ( n) або від так званої кількості ступенів свободи, яка позначається як vабо як df.

Число ступенів свободи vдорівнює кількості класів варіаційного ряду мінус число умов, за яких він був сформований. До таких умов відносяться обсяг вибірки ( n), середні та дисперсії.

Допустимо, групу з 50 осіб розділили на три класи за принципом:

Вміє працювати на комп'ютері;

Вміє виконувати лише певні операції;

Не вміє працювати на комп'ютері.

До першої та другої групи потрапило по 20 осіб, до третьої – 10.

Ми обмежені однією умовою – обсягом вибірки. Тому навіть якщо ми втратили дані про те, скільки людей не вміють працювати на комп'ютері, ми можемо визначити це, знаючи, що в першому та другому класах – по 20 піддослідних. Ми не вільні у визначенні кількості піддослідних у третьому розряді, «свобода» тягнеться лише на перші два осередки класифікації:

5. Основні проблеми прикладної статистики - опис даних, оцінювання та перевірка гіпотез

Основні поняття, що використовуються під час перевірки гіпотез

Статистична гіпотеза – будь-яке припущення щодо невідомого розподілу випадкових величин (елементів). Наведемо формулювання кількох статистичних гіпотез:

1. Результати спостережень мають нормальний розподіл із нульовим математичним очікуванням.
2. Результати спостережень мають функцію розподілу N(0,1).
3. Результати спостережень мають нормальний розподіл.
4. Результати спостережень у двох незалежних вибірках мають один і той самий нормальний розподіл.
5. Результати спостережень у двох незалежних вибірках мають один і той самий розподіл.

Розрізняють нульову та альтернативну гіпотези. Нульова гіпотеза – гіпотеза, яка підлягає перевірці. Альтернативна гіпотеза – кожна допустима гіпотеза, відмінна від нульової. Нульову гіпотезу позначають Н 0альтернативну - Н 1(Від Hypothesis - "гіпотеза" (англ.)).

Вибір тих чи інших нульових чи альтернативних гіпотез визначається стоять перед менеджером, економістом, інженером, дослідником прикладними завданнями. Розглянемо приклади.

Приклад 11.Нехай нульова гіпотеза – гіпотеза 2 із наведеного вище списку, а альтернативна – гіпотеза 1. Сказане означає, що реальна ситуація описується імовірнісною моделлю, згідно з якою результати спостережень розглядаються як реалізації незалежних однаково розподілених випадкових величин з функцією розподілу N(0,σ), де параметр невідомий статистику. У рамках цієї моделі нульову гіпотезу записують так:

Н 0: σ = 1,

а альтернативну так:

Н 1: σ ≠ 1.

приклад 12.Нехай нульова гіпотеза - як і раніше гіпотеза 2 з наведеного вище списку, а альтернативна - гіпотеза 3 з того ж списку. Тоді в імовірнісні моделі управлінської, економічної або виробничої ситуації передбачається, що результати спостережень утворюють вибірку з нормального розподілу N(m, σ) при деяких значеннях mта σ. Гіпотези записуються так:

Н 0: m= 0, σ = 1

(обидва параметри приймають фіксовані значення);

Н 1: m≠ 0 та/або σ ≠ 1

(тобто або m≠ 0, або σ ≠ 1, або і m≠ 0, та σ ≠ 1).

приклад 13.Нехай Н 0 – гіпотеза 1 із наведеного вище списку, а Н 1 - гіпотеза 3 з того ж списку. Тоді ймовірнісна модель – та сама, що у прикладі 12,

Н 0: m= 0, σ довільно;

Н 1: m≠ 0, σ довільно.

приклад 14.Нехай Н 0 – гіпотеза 2 з наведеного вище списку, а згідно Н 1 результати спостережень мають функцію розподілу F(x), що не збігається з функцією стандартного нормального розподілу Ф(х).Тоді

Н 0: F(х) = Ф(х)при всіх х(записується як F(х) ≡ Ф(х));

Н 1: F(х 0) ≠ Ф(х 0)при деякому х 0(Тобто невірно, що F(х) ≡ Ф(х)).

Примітка.Тут ≡ - знак тотожного збігу функцій (тобто збігу при всіх можливих значеннях аргументу х).

приклад 15.Нехай Н 0 – гіпотеза 3 із наведеного вище списку, а згідно Н 1 результати спостережень мають функцію розподілу F(x), не є нормальною. Тоді

За деяких m, σ;

Н 1: для будь-яких m, σ знайдеться х 0 = х 0(m, σ) таке, що .

Приклад 16Нехай Н 0 – гіпотеза 4 з наведеного вище списку, згідно з імовірнісною моделлю дві вибірки вилучені з сукупностей з функціями розподілу F(x) і G(x), є нормальними з параметрами m 1 , σ 1 і m 2 σ 2 відповідно, а Н 1 – заперечення Н 0 . Тоді

Н 0: m 1 = m 2 , σ 1 = σ 2 , причому m 1 і 1 довільні;

Н 1: m 1 ≠ m 2 та/або σ 1 ≠ σ 2 .

Приклад 17Нехай в умовах прикладу 16 додатково відомо, що 1 = 2 . Тоді

Н 0: m 1 = m 2 σ > 0, причому m 1 і σ довільні;

Н 1: m 1 ≠ m 2 σ > 0.

приклад 18.Нехай Н 0 – гіпотеза 5 з наведеного вище списку, згідно з ймовірнісною моделлю дві вибірки вилучені з сукупностей з функціями розподілу F(x) і G(x) відповідно, а Н 1 – заперечення Н 0 . Тоді

Н 0: F(x) G(x) , де F(x)

Н 1: F(x) і G(x) - довільні функції розподілу, причому

F(x) G(x) за деяких х.

Приклад 19.Нехай в умовах прикладу 17 додатково передбачається, що функції розподілу F(x) і G(x) відрізняються лише зрушенням, тобто. G(x) = F(x- а)при деякому а. Тоді

Н 0: F(x) G(x) ,

де F(x) - Довільна функція розподілу;

Н 1: G(x) = F(x- а), а ≠ 0,

де F(x) - Довільна функція розподілу.

Приклад 20Нехай в умовах прикладу 14 додатково відомо, що згідно з ймовірнісною моделлю ситуації F(x) - функція нормального розподілу із одиничною дисперсією, тобто. має вигляд N(m 1). Тоді

Н 0: m = 0 (Тобто. F(х) = Ф(х)

при всіх х); (записується як F(х) ≡ Ф(х));

Н 1: m 0

(Тобто невірно, що F(х) ≡ Ф(х)).

Приклад 21.При статистичному регулюванні технологічних, економічних, управлінських чи інших процесів розглядають вибірку, витягнуту із сукупності з нормальним розподілом та відомою дисперсією, та гіпотези

Н 0: m = m 0 ,

Н 1: m= m 1 ,

де значення параметра m = m 0 відповідає налагодженому ходу процесу, а перехід до m= m 1 свідчить про розлад.

Приклад 22.При статистичному приймальному контролі кількість дефектних одиниць продукції у вибірці підпорядковується гіпергеометричному розподілу, невідомим параметром є p = D/ N– рівень дефектності, де N- Обсяг партії продукції, D– загальна кількість дефектних одиниць продукції партії. Використані в нормативно-технічній та комерційній документації (стандартах, договорах на постачання та ін.) плани контролю часто націлені на перевірку гіпотези

Н 0: p < AQL

Н 1: p > LQ,

де AQL - приймальний рівень дефектності, LQ - бракувальний рівень дефектності (очевидно, що AQL < LQ).

Приклад 23.Як показники стабільності технологічного, економічного, управлінського чи іншого процесу використовують низку характеристик розподілів контрольованих показників, зокрема, коефіцієнт варіації v = σ/ M(X). Потрібно перевірити нульову гіпотезу

Н 0: v < v 0

при альтернативній гіпотезі

Н 1: v > v 0 ,

де v 0 - Деяке заздалегідь задане граничне значення.

Приклад 24Нехай імовірнісна модель двох вибірок – та сама, що у прикладі 18, математичні очікування результатів спостережень у першій і другій вибірках позначимо М(Х) та М(У) відповідно. У низці ситуацій перевіряють нульову гіпотезу

Н 0: М(Х) = М(У)

проти альтернативної гіпотези

Н 1: М(Х) ≠ М(У).

Приклад 25. Вище зазначалося велике значенняу математичній статистиці функцій розподілу, симетричних щодо 0, При перевірці симетричності

Н 0: F(- x) = 1 – F(x) при всіх x, в іншому Fдовільна;

Н 1: F(- x 0 ) ≠ 1 – F(x 0 ) при деякому x 0 , в іншому Fдовільна.

У ймовірносно-статистичних методах прийняття рішень використовуються і багато інших постановок завдань перевірки статистичних гіпотез. Деякі їх розглядаються нижче.

Конкретне завданняперевірки статистичної гіпотези повністю описано, якщо задані нульова та альтернативна гіпотези. Вибір методу перевірки статистичної гіпотези, властивості та характеристики методів визначаються як нульовою, так і альтернативною гіпотезами. Для перевірки однієї і тієї ж нульової гіпотези при різних альтернативних гіпотезах слід використовувати взагалі кажучи, різні методи. Так, у прикладах 14 і 20 нульова гіпотеза одна й та сама, а альтернативні – різні. Тому в умовах прикладу 14 слід застосовувати методи, що ґрунтуються на критеріях згоди з параметричним сімейством (типу Колмогорова або типу омега-квадрат), а в умовах прикладу 20 – методи на основі критерію Стьюдента або критерію Крамера-Уелча. Якщо в умовах прикладу 14 використовувати критерій Стьюдента, то він не вирішуватиме поставлених завдань. Якщо в умовах прикладу 20 використовувати критерій згоди типу Колмогорова, то він, навпаки, вирішуватиме поставлені завдання, хоча, можливо, і гірше, ніж спеціально пристосований для цього випадку критерій Стьюдента.

При обробці реальних даних велике значення має правильний вибіргіпотез Н 0 та Н 1 . Припущення, наприклад, нормальність розподілу, повинні бути ретельно обґрунтовані, зокрема, статистичними методами. Зазначимо, що у переважній більшості конкретних прикладних постановок розподіл результатів спостережень від нормального .

Часто виникає ситуація, коли вид нульової гіпотези випливає із постановки прикладного завдання, а вид альтернативної гіпотези не зрозумілий. У таких випадках слід розглядати альтернативну гіпотезу найбільш загального виглядуі використовувати методи, що вирішують поставлене завдання за всіх можливих Н 1 . Зокрема при перевірці гіпотези 2 (з наведеного вище списку) як нульовий слід як альтернативну гіпотезу використовувати Н 1 з прикладу 14, а не з прикладу 20, якщо немає спеціальних обґрунтувань нормальності розподілу результатів спостережень альтернативної гіпотезі.

Попередня