Dviejų populiacijos proporcijų skirtumo hipotezės testas

Testo statistika, skirta dviejų populiacijos proporcijų palyginimui

Testo statistika, skirta dviejų populiacijos proporcijų palyginimui. C.K.Taylor





Šiame straipsnyje apžvelgsime veiksmus, kurių reikia norint atlikti a hipotezės testas , arba reikšmingumo testas, skirtas dviejų populiacijos proporcijų skirtumui. Tai leidžia palyginti dvi nežinomas proporcijas ir daryti išvadą, ar jos nėra lygios viena kitai, ar viena didesnė už kitą.

Hipotezių testo apžvalga ir pagrindas

Prieš pradėdami gilintis į hipotezės testo specifiką, pažvelgsime į hipotezės testų sistemą. Svarbumo testu bandome parodyti, kad teiginys apie populiacijos vertę parametras (o kartais ir pačios populiacijos prigimtis) greičiausiai yra tiesa.



Sukaupiame šio pareiškimo įrodymų, atlikdami a statistinė imtis . Iš šios imties apskaičiuojame statistiką. Šios statistikos vertė yra tai, ką naudojame, norėdami nustatyti pradinio teiginio teisingumą. Šiame procese yra neapibrėžtumo, tačiau mes galime jį kiekybiškai įvertinti

Bendras hipotezės testo procesas pateiktas toliau pateiktame sąraše:



  1. Įsitikinkite, kad yra įvykdytos mūsų bandymui būtinos sąlygos.
  2. Aiškiai nurodykite nulinės ir alternatyvios hipotezės . Alternatyvi hipotezė gali apimti vienpusį arba dvipusį testą. Taip pat turėtume nustatyti reikšmingumo lygį, kuris bus žymimas graikiška raide alfa.
  3. Apskaičiuokite testo statistiką. Naudojamos statistikos tipas priklauso nuo konkretaus mūsų atliekamo testo. Skaičiavimas remiasi mūsų statistine imtimi.
  4. Apskaičiuokite p-reikšmė . Testo statistiką galima išversti į p reikšmę. P reikšmė yra tikimybė, kad vien tik atsitiktinumas sukuria mūsų testo statistikos vertę, darant prielaidą, kad nulinė hipotezė yra teisinga. Bendra taisyklė yra ta, kad kuo mažesnė p reikšmė, tuo daugiau įrodymų prieš nulinę hipotezę.
  5. Padarykite išvadą. Galiausiai kaip slenkstinę reikšmę naudojame alfa reikšmę, kuri jau buvo pasirinkta. Sprendimo taisyklė yra tokia, kad jei p reikšmė yra mažesnė arba lygi alfa, tada atmetame nulinę hipotezę. Kitaip mes nesugeba atmesti nulinė hipotezė.

Dabar, kai pamatėme hipotezės testo pagrindą, pamatysime dviejų populiacijos proporcijų skirtumo hipotezės testo specifiką.

Sąlygos

Hipotezės testas dėl dviejų populiacijos proporcijų skirtumo reikalauja, kad būtų įvykdytos šios sąlygos:

  • Mes turime du paprasti atsitiktiniai pavyzdžiai iš didelių populiacijų. Čia „didelis“ reiškia, kad populiacija yra bent 20 kartų didesnė už imties dydį. Mėginių dydžiai bus pažymėti n 1ir n du.
  • Mūsų imčių asmenys buvo atrinkti nepriklausomai vienas nuo kito. Pačios populiacijos taip pat turi būti nepriklausomos.
  • Abiejuose mūsų pavyzdžiuose yra bent 10 sėkmingų ir 10 nesėkmių.

Kol šios sąlygos bus įvykdytos, galime tęsti hipotezės testą.

Nulinės ir alternatyvios hipotezės

Dabar turime apsvarstyti hipotezes mūsų reikšmingumo testui. Nulinė hipotezė yra mūsų pareiškimas, kad nėra jokio poveikio. Šiame konkretaus tipo hipotezės teste mūsų nulinė hipotezė yra ta, kad tarp dviejų populiacijos proporcijų nėra skirtumo. Tai galime parašyti kaip H0: p 1= p du.



Alternatyvi hipotezė yra viena iš trijų galimybių, priklausomai nuo to, ką mes tikriname:

  • Ha: p 1yra didesnis nei p du. Tai yra vienpusis arba vienpusis testas.
  • Ha: p 1mažiau nei p du. Tai taip pat yra vienpusis testas.
  • Ha: p 1nėra lygus p du. Tai dviuodegis arba dvipusis testas.

Kaip visada, norėdami būti atsargūs, turėtume naudoti dvipusę alternatyvią hipotezę, jei prieš gaudami pavyzdį neturime galvoje krypties. To priežastis yra ta, kad nulinę hipotezę sunkiau atmesti naudojant dvipusį testą.



Trys hipotezės gali būti perrašytos nurodant kaip p 1- p duyra susijęs su nuline verte. Tiksliau tariant, nulinė hipotezė taptų H0: p 1- p du= 0. Galimos alternatyvios hipotezės būtų parašytos taip:

  • Ha: p 1- p du> 0 atitinka teiginį ' p 1yra didesnis nei p du.'
  • Ha: p 1- p du<0 is equivalent to the statement ' p 1mažiau nei p du.'
  • Ha: p 1- p du≠ 0 atitinka teiginį ' p 1nėra lygus p du.'

Ši lygiavertė formuluotė iš tikrųjų parodo mums šiek tiek daugiau to, kas vyksta užkulisiuose. Šiame hipotezės teste mes keičiame du parametrus p 1ir p duį vieną parametrą p 1- p du.Tada išbandome šį naują parametrą lyginant su nuline verte.



Testo statistika

Testo statistikos formulė pateikta aukščiau esančiame paveikslėlyje. Toliau pateikiamas kiekvieno termino paaiškinimas:

  • Imtis iš pirmosios populiacijos yra dydžio n 1.Šios imties sėkmės skaičius (kuris nėra tiesiogiai matomas aukščiau pateiktoje formulėje) yra k 1.
  • Imtis iš antrosios populiacijos yra dydžio n du.Šios imties sėkmės skaičius yra k du.
  • Mėginio proporcijos yra p1-Turi = k 1 / n 1ir pdu -kepurė = k du / n du .
  • Tada sujungiame arba sujungiame abiejų šių pavyzdžių sėkmę ir gauname: p-kepurė = ( k1+ kdu) / ( n1+ ndu).

Kaip visada, skaičiuodami būkite atsargūs su operacijų tvarka. Viskas, kas yra po radikalu, turi būti apskaičiuota prieš imant kvadratinę šaknį.



P vertė

Kitas žingsnis yra apskaičiuoti p reikšmę, atitinkančią mūsų bandymo statistiką. Savo statistikai naudojame standartinį normalųjį skirstinį ir skaitome verčių lentelę arba naudojame statistinę programinę įrangą.

Mūsų p vertės skaičiavimo detalės priklauso nuo alternatyvios hipotezės, kurią naudojame:

  • Dėl Ha: p 1- p du> 0, apskaičiuojame normaliojo skirstinio dalį, kuri yra didesnė už NUO .
  • Dėl Ha: p 1- p du<0, we calculate the proportion of the normal distribution that is less than NUO .
  • Dėl Ha: p 1- p du≠ 0, apskaičiuojame normaliojo skirstinio dalį, kuri yra didesnė už | NUO |, absoliuti vertė NUO . Po to, norėdami atsižvelgti į tai, kad turime dviejų dalių testą, padvigubiname proporciją.

Sprendimo taisyklė

Dabar priimame sprendimą, ar atmesti nulinę hipotezę (ir taip priimti alternatyvą), ar neatmesti nulinės hipotezės. Šį sprendimą priimame lygindami savo p reikšmę su reikšmingumo alfa lygiu.

  • Jei p reikšmė yra mažesnė arba lygi alfa, tada atmetame nulinę hipotezę. Tai reiškia, kad turime statistiškai reikšmingą rezultatą ir sutiksime su alternatyvia hipoteze.
  • Jei p reikšmė yra didesnė už alfa, tada mes negalime atmesti nulinės hipotezės. Tai neįrodo, kad nulinė hipotezė yra teisinga. Vietoj to tai reiškia, kad mes negavome pakankamai įtikinamų įrodymų, kad atmestume nulinę hipotezę.

Speciali pastaba

The dviejų populiacijos proporcijų skirtumo pasikliautinasis intervalas nesujungia sėkmės, o hipotezės testas tai daro. To priežastis yra ta, kad mūsų nulinė hipotezė tai daro prielaidą p 1- p du= 0. Pasikliautinasis intervalas to nepriima. Kai kurie statistikai nesujungia šio hipotezės testo sėkmės, o naudoja šiek tiek pakeistą anksčiau pateiktos testo statistikos versiją.