Az alkalmassági kritériumok a statisztikai innovációs technológiákban. Hozzájárulási kritériumok. Az egyenletes eloszlás hipotézisének tesztelése

fejezetben figyelembe vették. 5 itt jelentkezünk ez a módszer beruházási projektekhez. A módszer alkalmazásának korlátait és feltételeit a fejezet tárgyalja. 15, ahol a kockázatos befektetések alkalmassági tesztjét vesszük figyelembe. Itt csak az a célunk, hogy bemutassuk, hogyan mérik a kockázatot a kockázatos befektetések kombinációi esetén, feltételezve, hogy egy ilyen kritérium szükséges.

A következő szakasz a magasabb származékok használatához kötődik (Taylor-képlet), és ez a szakasz a módszer egészének áttekintésével zárul, majd a függvények numerikus jellemzőinek néhány kérdése - numerikus módszerek (differenciálszámítás alkalmazása közelítésre számításokat) figyelembe veszik. Ebben a szakaszban meghatározzuk a szaggatott vonalak eltérési hibáját a szekánsoktól, a szaggatott vonalak az érintőtől, a darabonkénti görbék a magasabb fokú Taylor-paraboláktól függően ennek a függvénynek a differenciális tulajdonságaitól függően, és összehasonlítják a hibát. Az egyszerűség kedvéért tekintsük az egyenlő távolságra lévő csomópontok esetét. Így a differenciálszámítás módszerének alkalmazhatósági korlátai megállapítottak. Ennek a szakasznak a továbbfejlesztéseként más közelítő modellek is szóba jöhetnek, ezek megalkotása, például a következő séma szerint.

Ebben az elemzésben az empirikus és az elméleti eloszlás közötti egyezés mértékének értékelésekor V. I. Romanovsky Pearson-féle illeszkedési kritériumát alkalmaztuk.

Az eloszlási görbék paramétereinek számítási eredményeit a táblázat tartalmazza. 10. A becsült gyakoriságokat a 10., 11., 12. képlet alapján számítottuk ki. Az empirikus és elméleti gyakoriságok egybeesésének mértékének objektív értékelése az illeszkedési kritérium (ebben a tanulmányban V. I. illeszkedési tesztje. Romanovszkijt használták). A teszt azt mutatta, hogy a vizsgált empirikus intervallumsorokat a munkatárgyak által az átmeneti lemaradásokban eltöltött idő eloszlásáról a p (x) sűrűségfüggvény talált görbéi elég pontosan leírják.

Egységek száma a mintában, N intervallum mérete, N sorozat ferdeségi indexe, ch Túlzott görbületi index, Ex diszperzió, a középérték, X illeszkedési kritérium, K

Az így kapott empirikus eloszlást egy folytonos analitikus függvénnyel közelítjük, azaz azonosítjuk a valószínűségi változó eloszlási törvényét. Az elosztási törvény azonosítása során az illeszkedési kritériumok alkalmazását is figyelembe veszik.

Az illeszkedési kritériumok használata az elosztási törvény azonosításában valószínűségi változó.  

A Pearson-féle illeszkedési teszt alkalmazásakor ki kell számítani az értéket

Hangsúlyozandó, hogy a modell illeszkedési jósági kritériuma szerinti ellenőrzésekor csak a nemleges válasz biztos, vagyis a modell eltérése.

A pozitív válasz csak azt jelenti, hogy a modell nem mond ellent az empirikus adatoknak. Ez egyáltalán nem jelenti azt, hogy valójában ez a modell írja le az adatokat, hogy ez a legjobb modell, hogy nem lehet más modellt választani az adatok leírására stb. Valójában az egyetértési kritérium szerinti ellenőrzés pozitív válaszát úgy kell érteni, hogy "lehet, hogy ezt az adatot ilyen és olyan modell írja le", és semmi több.

A kapott hisztogramot Pearson-féle illeszkedési teszttel ellenőrizzük, hogy megfelel-e a normál eloszlásnak.

Sok valós probléma esetén a fő nehézség az, hogy a neurális hálózat nem képes egyértelműen kimutatni az ok-okozati összefüggéseket, és a fekete doboz elve szerint ad valamilyen megoldást. Ugyanakkor a pénzügyi elemzésben a különböző mutatók speciálisan kiválasztott kombinációit régóta használják a vállalkozások helyzetének felmérésére, és a modell minőségét az egyetértési kritériumok segítségével értékelik, a modell szerkezetének figyelembevétele nélkül. . Lényegében minden egy olyan mutató (vagy indikátorok kombinációjának) megválasztásán múlik, amely megfelel egy olyan döntési szabálynak, amely lehetővé teszi, hogy egy adott vállalkozást egy adott csoportba (életképes, gyorsan növekvő, rendkívül jövedelmező) vonjon be (vagy ne vonjon be).

A 21. feladat szerint igazítsa a lakosság eloszlását az egy főre jutó készpénzjövedelem nagyságához a normál eloszlási görbe mentén! Ábrázolja az empirikus és elméleti eloszlásokat! Mérje fel az empirikus és elméleti eloszlások közelségét illeszkedési tesztekkel [Pearson (khi-négyzet), Kolmogorov vagy mások]

Függetlenül attól, hogy milyen típusú illeszkedési tesztet alkalmaznak a pro-

S.p.g. különböző kritériumokat alkalmaznak. Különösen a minta és a hipotetikus eloszlások egyezésének ellenőrzésekor alkalmaznak egy illeszkedési tesztet, például az ún. Pearson khi-négyzet tesztje. Lásd még: Hiba.

Ha a (2.15) képletben M[H(x) és D-t a (2.3) egyenletekre cseréljük, akkor megkapjuk az illeszkedési jóság információs kritériumának végső képletét.

táblázatban. A 2.3 az eloszlási törvények technikai alkalmazásai során leggyakrabban előforduló entrópia paraméterek értékeit mutatja. A különböző eloszlási törvények entrópiaparamétereinek táblázata lehetővé teszi több hipotézis egyidejű tesztelését az információs egyetértési kritérium alkalmazásakor, ami a meglévő módszerekkel további számítások nélkül nem valósítható meg.

Mivel a Pearson-féle illeszkedési teszt a leggyakoribb, hasonlítsuk össze a J információs feltételt a %2 feltétellel.

Az empirikus eloszlás kiegyenlítésekor a nullhipotézist elfogadjuk, ha az információs jóság teszt alkalmazásakor

A GOST 8.532-85 javasolja az illeszkedési kritériumok használatát legalább 10%-os szignifikanciaszinten u>50 és 15 normál eloszlás esetén - Wilcoxon teszt segítségével a párok közötti különbségekre - az eloszlás szimmetriájának ellenőrzésére). a tanúsítási eredmények tömbje a normál, szimmetrikus, aszimmetrikus elosztási osztályok egyikébe. Minden eloszlási osztály esetében az RS fő metrológiai jellemzőinek értékeit különféle módon határozzák meg.

Különféle illeszkedési kritériumokat javasoltak az empirikus és az elméleti eloszlás közötti egyezés mértékének meghatározására. Így ismert Pearson, Romanovsky, Kolmogorov, Yastremsky megegyezési kritériuma. A Pearson-féle egyetértési kritérium az adott n 2 P = x2 érték elérésének valószínűségének Pearson-eloszlásának kiszámítására redukálódik. Ebben az esetben x2-t a (9.3) képlettel számítjuk ki.

Az optimális modellválasztásra kész sémák hiányában a kutatónak különféle statisztikai jósági teszteket kell kipróbálnia. Így Utans és Moody megbecsülték a különböző hálózati architektúrákkal kapott előrejelzés kockázatát, Kayama és munkatársai pedig a rejtett rétegben található duplikált elemek teljes számát találták meg. Egyszerűen összehasonlítottuk a négyzetes hiba négyzetgyökének (RMSE) értékeit egy 60 megfigyelésből álló tesztsorozaton, amely a megfigyelési intervallum utolsó 5 évéhez (1981-85) kapcsolódik. A további munkához a legalacsonyabb RMSE-t adó hálózati architektúrát vettük át.

Ezek az illeszkedési kritériumok lehetővé teszik a hipotézisek tesztelését

Az n.r.v entrópiájának becslésekor. Felmerül a kérdés, hogy hány intervallumot kell megválasztani a kísérleti adatok felosztásához. Ez a feladat hasonló a matematikai statisztika tipikus feladataihoz: az eloszlási törvény meghatározása, az empirikus eloszlások becsléseinek kiszámítása, az illeszkedési kritériumok jóságának számítása. A. Hald kimutatta, hogy akkor van optimális számú csoportosítási intervallum, ha a hisztogram lépcsőzetes burkológörbéje a legközelebb van az általános sokaság sima eloszlási görbéjéhez. Számos kritérium megfogalmazható az ilyen közelséghez, olyan mutatók használatával, mint a kurtosis, a %2 kritérium stb. Különféle kritériumok adjon meg kissé eltérő értékeket a csoportosítási intervallumok optimális számához. Az optimum meglétének ténye azonban nem függ a közelségi kritérium megválasztásától, hiszen ha túl sok kis intervallumba csoportosítjuk az adatokat, akkor ezek egy része üresnek vagy alultöltöttnek bizonyul. A hisztogram eltér a sima eloszlási görbétől a sok tüskés és dőlésszögű szaggatottsága miatt.

Storm R. a k = 5 lg p Brooks és Carruther képletet ajánlja az intervallumok optimális számának meghatározásához, a cikk pedig a k = 4p arányt ajánlja. A cikk egy táblázatot tartalmaz, amely szerint az intervallumok száma 7 és 22 között van hozzárendelve, a minta nagyságától függően 40 és 10 000 között. Ezen ajánlások összehasonlítása, az ábrán látható. A 2.2. az ajánlások közelségét n - 100-nál jelzi, és a minta méretének növekedésével a későbbiekben növekvő eltérést mutat. Külön csoportot alkotnak a %2 alkalmassági kritérium használatára vonatkozó ajánlások. A %2 feltétel alkalmazása állandó hosszúságú intervallumokra nem hatékony. Az x2 kritérium hatékonyságára vonatkozó összes munka előfeltétele az intervallumok egyenlő valószínűségű figyelembevétele. Ezeket az ajánlásokat azonban alkalmazásuk összetettsége miatt a gyakorlatban nem alkalmazzák. Tekintettel a fenti ajánlások heterogenitására, külön vizsgálatra van szükség az intervallumok számának befolyásáról a technológiai folyamatok elemzésére szolgáló információs módszerek alkalmazásakor.

6 vagy 7 intervallum közül választhat. Meghatározzuk az R méretek szórási zónáját. Beállítjuk az x = 0,126 méret maximális értékét és a minimális xm a = - 0,149 tartományt, az R = dgmax - xmin = 0,275 mm tartományt. Kiválasztunk 7 intervallumot, és meghatározzuk az osztásértéküket C = RI k 0,04 mm. Számítsuk ki a megfelelő intervallumba eső méreteltérések számát. Az eredmények (2.5. táblázat) lehetővé teszik, hogy hipotézist állítsunk fel a vizsgált hibák Gauss-törvény szerinti eloszlására vonatkozóan. A hipotézis teszteléséhez elő kell készíteni azokat az adatokat, amelyek részét képezik a

A véletlenszerűség tesztelésének és a kiugró értékek értékelésének kritériumai Irodalom Bevezetés A kísérleti adatok statisztikai elemzésének gyakorlatában a fő érdeklődés nem önmagában bizonyos statisztikák kiszámítása, hanem az ilyen típusú kérdések megválaszolása. Ennek megfelelően számos kritériumot dolgoztak ki a felállított statisztikai hipotézisek tesztelésére. A statisztikai hipotézisek tesztelésének minden kritériuma két nagy csoportra oszlik: parametrikus és nem paraméteres.


Ossza meg munkáját a közösségi hálózatokon

Ha ez a munka nem felel meg Önnek, az oldal alján található a hasonló művek listája. Használhatja a kereső gombot is


Teszt

Hozzájárulási feltételek használata

Bevezetés

Irodalom

Bevezetés

A kísérleti adatok statisztikai elemzésének gyakorlatában a fő érdeklődés nem önmagában bizonyos statisztikák kiszámítása, hanem az ilyen típusú kérdések megválaszolása. A lakosságszám valóban egy bizonyos szám? A korrelációs együttható jelentősen eltér a nullától? A két minta szórása egyenlő? És sok ilyen kérdés lehet, az adott kutatási feladattól függően. Ennek megfelelően számos kritériumot dolgoztak ki a felállított statisztikai hipotézisek tesztelésére. Megvizsgálunk néhányat a leggyakoribbak közül. Alapvetően az átlagokra, a szórásokra, a korrelációs együtthatókra és a populáció eloszlására vonatkoznak.

A statisztikai hipotézisek tesztelésének minden kritériuma két nagy csoportra oszlik: parametrikus és nem paraméteres. A paraméteres tesztek azon a feltételezésen alapulnak, hogy a mintaadatok egy ismert eloszlású sokaságból származnak, és a fő feladat ezen eloszlás paramétereinek becslése. A nem-paraméteres teszteknél az eloszlás természetére vonatkozó feltételezések nem szükségesek, kivéve azt a feltételezést, hogy az eloszlás folytonos.

Először nézzük meg a parametrikus kritériumokat. A tesztsorozat magában foglalja egy nullhipotézis és egy alternatív hipotézis megfogalmazását, a feltehető feltételezések megfogalmazását, a tesztben használt mintastatisztika meghatározását, valamint a tesztelendő statisztika mintaeloszlásának generálását, a kiválasztott kritérium kritikus régióinak meghatározását, és egy konfidenciaintervallum felépítése a mintastatisztika számára.

1 Az eszközök alkalmassági kritériumai

Legyen a vizsgált hipotézis a sokaság paramétere. Ilyen ellenőrzés szükségessége például a következő helyzetben merülhet fel. Tételezzük fel, hogy széleskörű kutatások alapján sikerült meghatározni egy fosszilis puhatestű héjának átmérőjét valamilyen fix helyről származó üledékekben. Legyen rendelkezésünkre bizonyos számú más helyen talált kagyló is, és abból indulunk ki, hogy egy adott hely nem befolyásolja a kagyló átmérőjét, pl. hogy az egykor új helyen élt puhatestűek teljes populációjának héjátmérőjének átlagos értéke megegyezik a korábban az első élőhelyen az ilyen típusú puhatestűek vizsgálatakor kapott ismert értékkel.

Ha ez az ismert érték egyenlő, akkor a nullhipotézist és az alternatív hipotézist a következőképpen írjuk fel: Tegyük fel, hogy a vizsgált sokaságban az x változó normális eloszlású, és a sokaság varianciája ismeretlen.

A hipotézist statisztika segítségével teszteljük:

, (1)
hol van a minta szórása.

Megmutattuk, hogy ha igaz, akkor t az (1) kifejezésben n-1 szabadságfokkal rendelkezik Student-féle t-eloszlással. Ha a szignifikancia szintet (a helyes hipotézis elvetésének valószínűségét) egyenlőnek választjuk, akkor az előző fejezetben tárgyaltaknak megfelelően meghatározhatjuk a =0 teszteléshez szükséges kritikus értékeket.

NÁL NÉL ez az eset, mivel a Student-féle eloszlás szimmetrikus, akkor ezen eloszlás görbe alatti területének (1-) n-1 szabadságfokkal rendelkező része az egymással abszolút értékben egyenlő és pontok közé fog zárni. Ezért a kiválasztott szignifikanciaszinten adott számú szabadságfokkal rendelkező t-eloszlás esetén minden negatívnál kisebb és pozitívnál nagyobb érték alkotja a kritikus tartományt. Ha a t mintaérték ebbe a területbe esik, az alternatív hipotézist elfogadjuk.

A konfidenciaintervallum a korábban leírt módszer szerint épül fel, és a következő kifejezésből kerül meghatározásra

(2)

Tehát esetünkben ismert, hogy egy fosszilis puhatestű héjának átmérője 18,2 mm. 50 db újonnan talált kagylóból álló minta áll rendelkezésünkre, melyeknél mm, a = 2,18 mm. Ellenőrzés: \u003d 18,2 vs. Megvan

Ha a szignifikanciaszint = 0,05, akkor a kritikus érték. Ebből következik, hogy a =0,05 szignifikancia szinten javára utasítható el. Így hipotetikus példánkra (természetesen, némi valószínűséggel) állíthatjuk, hogy egy bizonyos faj fosszilis puhatestűjeinek héjának átmérője attól függ, hogy hol éltek.

Tekintettel arra, hogy a t-eloszlás szimmetrikus, ennek az eloszlásnak csak pozitív értékei vannak megadva a kiválasztott szignifikanciaszinteken és a szabadságfokok számán. Sőt, nemcsak a t értéktől jobbra eső eloszlási görbe alatti terület arányát veszik figyelembe, hanem a -t értéktől balra eső területet is. Ennek az az oka, hogy a legtöbb esetben a hipotézisek tesztelésekor önmagában az eltérések jelentőségére vagyunk kíváncsiak, függetlenül attól, hogy ezek az eltérések felfelé vagy lefelé, i. ellene ellenőrizzük, nem ellene: >a vagy:

Térjünk most vissza példánkhoz. 100(1-)%-os konfidencia intervallum az is

18,92,01

Tekintsük most azt az esetet, amikor két sokaság átlagát kell összehasonlítani. A tesztelt hipotézis így néz ki: : =0, : 0. Feltételezzük azt is, hogy normális eloszlása ​​van átlaggal és varianciával, valamint normális eloszlása ​​átlaggal és azonos szórással. Ezen túlmenően feltételezzük, hogy a minták, amelyekkel az általános sokaságokat becsüljük, egymástól függetlenül kinyerjük és térfogatuk, illetve a minták függetlenségéből következik, hogy ha nagyobb számot veszünk belőlük, és kiszámítjuk a minden pár átlagértékét, akkor ezeknek az átlagpároknak a halmaza teljesen korrelálatlan lesz.

A nullhipotézis tesztelése statisztikák felhasználásával történik

(3)

ahol és az első és második minta varianciabecslései. Könnyen belátható, hogy (3) az (1) általánosítása.

Megmutattuk, hogy a (3) statisztikának van Student-féle t-eloszlása ​​szabadságfokkal. Ha és egyenlőek, azaz. = = A (3) képlet leegyszerűsített, és ennek alakja van

(4)

Vegyünk egy példát. Ugyanazon növénypopuláció szárleveleinek két évszak alatti mérése során a következő eredményeket kapjuk: Feltételezzük, hogy a Student-kritérium alkalmazásának feltételei, pl. teljesülnek azon általános sokaságok normalitása, amelyekből a mintákat vették, ismeretlen, de azonos szórás ezeknél a sokaságoknál, valamint a minták függetlensége teljesül. A =0,01 szignifikancia szinten becsüljük. Nekünk van

Táblázat értéke t = 2,58. Ezért a kiválasztott szignifikanciaszinten el kell utasítani azt a hipotézist, hogy a növénypopuláció szárleveleinek hosszának átlagértékei egyenlők legyenek két évszakban.

Figyelem! A matematikai statisztikában nullhipotézisként az összehasonlított mutatók közötti szignifikáns különbségek hiányának hipotézisét választjuk, függetlenül attól, hogy átlagokról, szórásokról vagy egyéb statisztikákról beszélünk. És mindezen esetekben, ha a kritérium empirikus (képlettel számított) értéke nagyobb, mint a (táblázatokból kiválasztott) elméleti érték, akkor az elutasításra kerül. Ha az empirikus érték kisebb, mint a táblázat értéke, akkor az elfogadásra kerül.

Annak érdekében, hogy a két általános sokaság átlaga közötti különbségre konfidenciaintervallumot hozzunk létre, figyelni kell arra, hogy a Student-féle t-próba, amint az a (3) képletből is látható, értékeli a különbség szignifikanciáját ennek a különbségnek a standard hibájához viszonyítva jelenti. Könnyen ellenőrizhető, hogy a (3)-ban szereplő nevező pontosan ezt a standard hibát reprezentálja, felhasználva a korábban már vizsgált összefüggéseket és a feltett feltevéseket. Valójában ezt általában tudjuk

Ha x és y függetlenek, akkor

Ha x és y mintaértékeket veszünk fel, és emlékezünk arra a feltételezésre, hogy mindkét populáció azonos szórással rendelkezik, azt kapjuk

(5)

A variancia becslését a következő összefüggésből kaphatjuk meg

(6)

(Osztunk azzal, hogy a mintákból két mennyiséget becsülünk, és ezért a szabadsági fokok számát kettővel kell csökkenteni.)

Ha most behelyettesítjük (6)-ot (5)-be, és felvesszük a négyzetgyököt, akkor a (3) kifejezésben megkapjuk a nevezőt.

Ezt a kitérést követően visszatérünk egy konfidenciaintervallum felépítéséhez a - keresztül.

Nekünk van

Tegyünk néhány megjegyzést a t-próba megalkotása során használt feltevésekkel kapcsolatban. Mindenekelőtt kimutatták, hogy a normalitás feltételezésének megsértése elhanyagolható mértékben befolyásolja a teszt szignifikancia szintjét és erejét 30-ra. szintén jelentéktelen, de csak akkor, ha a mintanagyság egyenlő. Ha azonban a két sokaság szórása eltér egymástól, akkor az első és a második típusú hibák valószínűsége jelentősen eltér a várttól.

Ebben az esetben a kritériumot kell használni az ellenőrzéshez

(7)

a szabadságfokok számával

. (8)

Általában törtszámnak bizonyul, ezért a t-eloszlási táblázatok használatakor táblázatos értékeket kell venni a legközelebbi egész értékekhez, és interpolálni kell, hogy megtaláljuk a megfelelő t-t. a kapotthoz.

Vegyünk egy példát. A mocsári béka két alfajának vizsgálatakor a testhossz és a sípcsonthossz arányát számítottuk ki. Két mintát vettünk =49 és =27 térfogattal. A számunkra érdekes arány átlaga és szórása =2,34-nek bizonyult; =2,08; =0,21; =0,35. Ha most a (2) képlet segítségével teszteljük a hipotézist, azt kapjuk

=0,05 szignifikanciaszintnél el kell vetnünk a nullhipotézist (t=1,995 táblázatos érték), és feltételezzük, hogy a választott szignifikancia szinten statisztikailag szignifikáns különbségek vannak a két béka-alfaj mért paramétereinek átlagértékei között.

A (6) és (7) képlet használatakor megvan

Ebben az esetben ugyanazon =0,05 szignifikanciaszint mellett a táblázat t=2,015 értéke és a nullhipotézis elfogadásra kerül.

Ez a példa elég világosan mutatja, hogy egy adott kritérium levezetésénél alkalmazott feltételek figyelmen kívül hagyása a ténylegesen bekövetkezőkkel közvetlenül ellentétes eredményekhez vezethet. Természetesen ebben az esetben eltérő méretű minták birtokában annak előre meghatározott tény hiányában, hogy a mért mutató szórása mindkét populációban statisztikailag egyenlő, a (7) és (8) képleteket kellett volna használni, amelyek a hiányt mutatták. statisztikailag szignifikáns különbségek.

Ezért szeretném még egyszer megismételni, hogy egy adott kritérium levezetése során felvett összes feltételezésnek való megfelelés ellenőrzése feltétlenül szükséges feltétele annak helyes használatának.

A t-próba mindkét fenti módosításánál változatlan követelmény volt az a követelmény, hogy a minták függetlenek legyenek egymástól. A gyakorlatban azonban gyakran előfordulnak olyan helyzetek, amikor ez a követelmény objektív okokból nem teljesíthető. Például egyes mutatókat ugyanazon az állaton vagy a terület területén mérnek egy külső tényező hatása előtt és után stb. És ezekben az esetekben érdekelhet bennünket a hipotézis ellentmondása. Továbbra is azt feltételezzük, hogy mindkét mintát azonos szórással vett normál populációkból vettük.

Ebben az esetben használhatja azt a tényt, hogy a normál eloszlású értékek közötti különbségek normális eloszlásúak is, ezért használhatja a Student-féle t-próbát az (1) formában. Így azt a hipotézist, hogy n különbség egy normális eloszlású általános sokaságból vett minta, amelynek átlaga nulla, tesztelésre kerül.

Az i-edik különbséget jelölve, megvan

, (9)
ahol

Vegyünk egy példát. Legyenek rendelkezésünkre adatok egy adott idegsejt impulzusainak számáról egy bizonyos időintervallumban az inger hatása előtt () és () után:

Ezért figyelembe véve, hogy (9) t-eloszlású, és a szignifikancia szint =0,01, a függelék megfelelő táblázatából azt találjuk, hogy t kritikus értéke n-1=10-1=9 szabadságfok esetén az 3,25. A t-statisztika elméleti és empirikus értékeinek összehasonlítása azt mutatja, hogy el kell vetni azt a nullhipotézist, hogy nincs statisztikailag szignifikáns különbség az impulzusok gyakorisága között az ingeradás előtt és után. Megállapítható, hogy az alkalmazott inger statisztikailag szignifikánsan megváltoztatja az impulzusok gyakoriságát.

A kísérleti vizsgálatok során, mint fentebb említettük, elég gyakran megjelennek függő minták. Ezt a tényt azonban néha figyelmen kívül hagyják, és a t-próbát helytelenül használják a (3) formában.

Ez rossznak tekinthető, ha figyelembe vesszük a nem korrelált és a korrelált átlagok különbségének standard hibáit. Az első esetben

És a másodikban

A d különbség standard hibája a

Ezt szem előtt tartva a (9)-ben szereplő nevező alakja lesz

Most figyeljünk arra, hogy a (4) és (9) kifejezések számlálói egybeesnek:

ezért bennük a t érték különbsége a nevezőktől függ.

Így ha a (3) képletet használjuk a függő minták problémájában, és a minták pozitív korrelációt mutatnak, akkor a kapott t értéke kisebb lesz, mint a (9) képlet használatakor kellene, és egy helyzet felmerülhet, hogy a nullhipotézist elfogadják, ha hamis. Fordított helyzet állhat elő, ha a minták között negatív korreláció van, pl. ebben az esetben az ilyen eltéréseket jelentősnek ismerjük el, amelyek valójában nem azok.

Térjünk vissza az impulzusaktivitású példához, és a (3) képlet segítségével számítsuk ki a t értékét az adott adatokra, nem figyelve arra, hogy a minták összefüggenek. A következőkkel rendelkezünk: A 18-cal egyenlő szabadságfokszám és a szignifikanciaszint = 0,01 esetén a táblázatos érték t = 2,88, és első pillantásra úgy tűnik, hogy nem történt semmi, még akkor sem, ha az adott feltételeknek nem megfelelő képletet használunk. És ebben az esetben a t számított értéke a nullhipotézis elutasításához vezet, azaz. ugyanarra a következtetésre jutunk, mint amit a (9) képlet segítségével vontunk le, ami ebben a helyzetben helyes.

A meglévő adatokat azonban alakítsuk át, és mutassuk be a következő formában (2):

Ezek ugyanazok az értékek, és néhány kísérletben nagyon jól megkaphatók. Mivel mindkét mintában minden érték elmentésre kerül, a Student-féle t-próba használata a (3) képletben a korábban kapott értéket = 3,32 adja, és ugyanarra a következtetésre vezet, mint amit már levontunk.

És most a (9) képlet szerint számítjuk ki t értékét, amelyet ebben az esetben kell használni. Megvan: t kritikus értéke a választott szignifikanciaszinten és kilenc szabadsági fokon 3,25. Következésképpen nincs okunk elvetni a nullhipotézist, elfogadjuk, és kiderül, hogy ez a következtetés egyenesen ellentétes a (3) képlet használatakor levont következtetéssel.

Ebben a példában ismét meggyőződhettünk arról, hogy a kísérleti adatok elemzésekor a helyes következtetések levonása érdekében mennyire fontos minden olyan követelmény szigorú betartása, amelyek egyik vagy másik kritérium meghatározásának alapját képezték.

A Student-kritérium figyelembe vett módosításai két minta átlagára vonatkozó hipotézisek tesztelésére szolgálnak. Előfordulnak azonban olyan helyzetek, amikor szükségessé válik az egyidejűleg k átlag egyenlőségére vonatkozó következtetések levonása. Erre az esetre egy bizonyos statisztikai eljárást is kidolgoztak, amelyet a későbbiekben a varianciaanalízissel kapcsolatos kérdések megvitatása során fogunk figyelembe venni.

2 Az eltérésekre való illeszkedés jósága

Az általános populációk szórására vonatkozó statisztikai hipotézisek tesztelése az átlagokkal azonos sorrendben történik. Emlékezzünk vissza röviden erre a sorrendre.

1. Feldolgozunk egy nullhipotézist (az összehasonlított varianciák közötti statisztikailag szignifikáns különbségek hiányáról).

2. A statisztika mintavételi eloszlására vonatkozóan megfogalmazunk néhány feltételezést, amelyek segítségével a hipotézisben szereplő paraméter becslését tervezzük.

3. A hipotézis tesztelésére egy szignifikancia szintet választunk.

4. Kiszámítjuk a számunkra érdekes statisztikák értékét, és döntést hozunk a nullhipotézis igazságtartalmáról.

És most kezdjük annak a hipotézisnek a tesztelésével, hogy az általános sokaság varianciája = a, azaz. ellen. Ha feltételezzük, hogy az x változó normális eloszlású, és a sokaságból véletlenszerűen n méretű mintát veszünk, akkor statisztikát használunk a nullhipotézis tesztelésére.

(10)

Emlékezve a szórás számítási képletére, átírjuk (10) a következőképpen:

. (11)

Ebből a kifejezésből látható, hogy a számláló a normál eloszlású mennyiségek átlagától való eltérésének négyzetes összege. Ezen eltérések mindegyike normális eloszlású. Ezért az általunk ismert eloszlásnak megfelelően a (10) és (11) statisztika normál eloszlású mennyiségeinek négyzetösszegei n-1 szabadságfokú -eloszlásúak.

A t-eloszlás használatához hasonlóan a kiválasztott szignifikanciaszint ellenőrzésekor az eloszlási táblázat beállítja a nullhipotézis elfogadásának valószínűségeinek megfelelő kritikus pontokat és. A kiválasztott konfidencia intervallum a következőképpen épül fel:

. (12)

Vegyünk egy példát. Kiterjedt kísérleti vizsgálatok alapján állapítható meg, hogy egy növényfaj alkaloidtartalmának szórása egy adott területről 4,37 konvencionális egység. Egy n = 28 ilyen növényből álló minta, feltehetően ugyanarról a területről kerül szakember rendelkezésére. Az elemzés kimutatta, hogy ennél a mintánál =5,01, és meg kell győződni arról, hogy ez és a korábban ismert varianciák statisztikailag megkülönböztethetetlenek a =0,1 szignifikancia szinten.

A (10) képlet alapján megvan

A kapott értéket össze kell hasonlítani a /2=0,05 és 1--/2=0,95 kritikus értékekkel. A Függelék táblázatból 27 szabadságfokra 40,1 és 16,2 van, ami azt jelenti, hogy a nullhipotézis elfogadható. A megfelelő konfidenciaintervallum 3,37<<8,35.

Ellentétben a Student-próbával a mintaátlagokra vonatkozó hipotézisek tesztelésével, amikor az első és második típusú hibák jelentéktelen mértékben változtak, ha a populációk normális eloszlására vonatkozó feltevést megsértették, a variancia hipotézisek esetében, amikor a normalitási feltételek nem teljesülnek. , a hibák jelentősen megváltoznak.

A variancia valamely fentebb vizsgált fix értékkel való egyenlőségének problémája korlátozottan érdekes, mivel meglehetősen ritkák az olyan helyzetek, amikor a teljes sokaság szórása ismert. Sokkal érdekesebb az az eset, amikor ellenőrizni kell, hogy két sokaság szórása egyenlő-e, pl. hipotézis tesztelése egy alternatívával szemben. Feltételezzük, hogy a méret és a minták véletlenszerűen származnak olyan populációkból, amelyek eltérései és.

A nullhipotézis teszteléséhez a Fisher varianciahányados tesztet használjuk

(13)

Mivel a normális eloszlású valószínűségi változók átlagértékeitől való négyzetes eltéréseinek összege eloszlású, a számláló és a nevező (13) is elosztott értékek, amelyek osztva és sorrendben vannak elosztva, így arányuk F-eloszlású. -1 és -1 szabadsági fok.

Általánosan elfogadott - és így épülnek fel az F-eloszlás táblái -, hogy a (13) szórásnégyzetek közül a legnagyobbat veszik számlálónak, és ezért csak egy kritikus pontot határoznak meg, amely megfelel a választott szignifikanciaszintnek. .

Legyen rendelkezésünkre két =11 és =28 térfogatú minta a közönséges és ovális tavi csigák populációiból, amelyeknél a magasság-szélesség arányok =0,59 és =0,38 eltéréseket mutatnak. Szükséges tesztelni azt a hipotézist, hogy ezen mutatók szórása egyenlő a vizsgált populációkban = 0,05 szignifikancia szinten. Nekünk van

A szakirodalomban olykor találkozhatunk azzal a kijelentéssel, hogy az átlagegyenlőség hipotézisének Student-kritériummal történő tesztelését meg kell előzni a szórások egyenlőségére vonatkozó hipotézis tesztelésének. Ez a rossz ajánlás. Sőt, olyan hibákhoz vezethet, amelyek elkerülhetők, ha nem követik.

Valójában a varianciaegyenlőség hipotézisének Fisher-próbával történő tesztelésének eredményei nagymértékben függenek attól a feltételezéstől, hogy a mintákat normál eloszlású populációkból vettük. Ugyanakkor a Student-féle t-próba érzéketlen a normalitás megsértésére, és ha lehetséges azonos méretű mintákat kapni, akkor a varianciaegyenlőség feltételezése sem lényeges. Nem egyenlő n esetén a (7) és (8) képletet kell használni az ellenőrzéshez.

A varianciaegyenlőségre vonatkozó hipotézisek tesztelésekor a függő mintákhoz kapcsolódó számítások során bizonyos jellemzők merülnek fel. Ebben az esetben a statisztikát arra használjuk, hogy teszteljük a hipotézist az alternatívával szemben.

(14)

Ha a nullhipotézis igaz, akkor a (14) statisztika Student-féle t-eloszlással rendelkezik n-2 szabadságfokkal.

35 bevonatminta fényességének mérésekor =134,5 diszperziót kaptunk. Két héttel később ismételt mérések 199,1 értéket mutattak. Ebben az esetben a páros mérések közötti korrelációs együttható =0,876. Ha nem figyelünk arra, hogy a minták függőek, és a Fisher-kritériumot használjuk a hipotézis tesztelésére, akkor F = 1,48-at kapunk. Ha a =0,05 szignifikancia szintet választja, akkor a nullhipotézis elfogadásra kerül, mivel az F-eloszlás kritikus értéke =35-1=34 és =35-1=34 szabadságfok esetén 1,79.

Ugyanakkor, ha az erre az esetre alkalmas (14) képletet használjuk, akkor t=2,35-öt kapunk, míg t kritikus értéke 33 szabadságfokra és a választott =0,05 szignifikanciaszintre 2,03. Ezért a két minta varianciáinak egyenlőségére vonatkozó nullhipotézist el kell utasítani. Ez a példa tehát azt mutatja, hogy az átlagegyenlőség hipotézisének teszteléséhez hasonlóan a kísérleti adatok sajátosságait figyelmen kívül hagyó kritérium alkalmazása hibához vezet.

Az ajánlott irodalomban megtalálható a k variancia egyidejű egyenlőségére vonatkozó hipotézisek tesztelésére használt Bartlett-teszt. Amellett, hogy ennek a tesztnek a statisztikáinak kiszámítása meglehetősen munkaigényes, ennek a tesztnek az a fő hátránya, hogy szokatlanul érzékeny a mintákat vett populációk normális eloszlásának feltételezésétől való eltérésekre. Használata során tehát soha nem lehet biztos abban, hogy a nullhipotézist valóban azért utasítják el, mert a szórások statisztikailag szignifikánsan különböznek egymástól, és nem azért, mert a minták nem normális eloszlásúak. Ezért több variancia összehasonlításának problémája esetén meg kell keresni a probléma ilyen megfogalmazását, amikor a Fisher-kritérium vagy annak módosításai használhatók lesznek.

3 A részvényekről szóló megállapodás kritériumai

Elég gyakran szükséges elemezni azokat a sokaságokat, amelyekben az objektumok két kategória valamelyikéhez rendelhetők. Például nem szerint egy bizonyos populációban, egy bizonyos nyomelem jelenlétében a talajban, egyes madárfajoknál a tojások sötét vagy világos színe alapján stb.

A bizonyos minőségű elemek arányát P-vel jelöljük, ahol P az általunk érdekelt minőségű objektumok és az összesített objektumok aránya.

Teszteljük azt a hipotézist, hogy néhány kellően nagy populációban a P részarány egyenlő valamilyen a számmal (0

A dichotóm (két fokozatú) változók esetében, mint esetünkben is, P ugyanazt a szerepet tölti be, mint a változók sokaságának mennyiségileg mért átlaga. Másrészt korábban jeleztük, hogy a P tört standard hibája így ábrázolható

Aztán ha a hipotézis igaz, akkor a statisztika

, (19)
ahol p a P mintaértéke, egységnyi normális eloszlású. Azonnal fenntartással kell élnünk, hogy egy ilyen közelítés akkor érvényes, ha az np vagy (1-p)n szorzatok közül a kisebbik nagyobb 5-nél.

Ismertesse meg az irodalmi adatokból, hogy a tavi békaállományban a háton hosszanti csíkkal rendelkező egyedek aránya 62%, vagyis 0,62. 125 (n) egyedből álló minta áll rendelkezésünkre, ebből 93 (f) egyed hátán hosszanti csík látható. Ki kell deríteni, hogy a mintavételi populációban az érdeklődésre számot tartó tulajdonsággal rendelkező egyedek aránya megfelel-e az ismert adatoknak. Van: p=f/n=93/125=0,744, a=0,62, n(1-p)=125(1-0,744)=32>5 és

Ezért mind a = 0,05, mind a = 0,01 szignifikanciaszint esetén a nullhipotézist el kell vetni, mivel = 0,05 esetén a kritikus érték 1,96, = 0,01 - 2,58 esetén.

Ha van két nagy populáció, amelyben a számunkra érdekes tulajdonsággal rendelkező objektumok aránya rendre és, akkor érdemes tesztelni a hipotézist: = versus alternatíva:. Ellenőrzés céljából véletlenszerűen és egymástól függetlenül két térfogati mintát kell kivonni. E minták alapján megbecsülik és meghatározzák a statisztikákat.

(20)

ahol és azoknak az objektumoknak a száma, amelyek rendelkeznek ezzel a tulajdonsággal az első és a második mintában.

A (20) képletből érthető, hogy levezetésénél ugyanazt az elvet alkalmaztuk, amellyel korábban találkoztunk. Ugyanis a statisztikai hipotézisek teszteléséhez meghatározzák a számunkra érdekes mutatók közötti különbséget alkotó szórások számát, valójában a (+)/(+) érték az adott tulajdonsággal rendelkező objektumok aránya mindkettőben. mintákat egyszerre. Ha jelöljük, akkor a (20) nevező második zárójelében lévő kifejezés (1-) és nyilvánvalóvá válik, hogy a (20) kifejezés ekvivalens a nullhipotézis tesztelésére szolgáló képlettel:

Mint.

Másrészt standard hiba. Így a (20) így írható fel

. (21)

Az egyetlen különbség e statisztika és az átlagokra vonatkozó hipotézisek teszteléséhez használt statisztika között az, hogy z egységnyi normális eloszlású, nem pedig t-eloszlású.

Mutassa meg egy embercsoport (= 82) vizsgálata, hogy az elektroencefalogramon -ritmusú emberek aránya 0,84 vagy 84%. Egy másik területen tartózkodó embercsoport (=51) vizsgálata kimutatta, hogy ez az arány 0,78. =0,05 szignifikanciaszint esetén ellenőrizni kell, hogy az agy alfa-aktivitással rendelkező egyedek aránya megegyezik-e az általános populációkban, amelyekből a mintákat vettük.

Mindenekelőtt győződjünk meg arról, hogy a rendelkezésre álló kísérleti adatok lehetővé teszik a statisztikák felhasználását (20). Nekünk van:

és mivel z normális eloszlású, amelyre =0,05-nél a kritikus pont 1,96, a nullhipotézist elfogadjuk.

A figyelembe vett kritérium akkor érvényes, ha függetlenek azok a minták, amelyeknél a számunkra érdekes tulajdonságú objektumok arányait hasonlítottuk össze. Ha ez a követelmény nem teljesül, például ha a halmazt egymást követő időintervallumokban vizsgáljuk, akkor ugyanaz az objektum rendelkezhet vagy nem rendelkezik ezzel a tulajdonsággal ezekben az intervallumokban.

Jelöljük az objektumot érdeklő tulajdonság jelenlétét 1-el, hiányát pedig 0-val. Ezután a 3. táblázathoz jutunk, ahol (a+c) az első mintában szereplő objektumok száma, amelyek rendelkeznek valamilyen tulajdonsággal, ( a+c) az ezzel a tulajdonsággal rendelkező objektumok száma a második mintában, n pedig a vizsgált objektumok teljes száma. Nyilvánvaló, hogy ez már egy jól ismert négymezős táblázat, amelyben az összefüggést az együttható segítségével becsüljük meg

Egy ilyen asztalhoz és kicsi (<10) значений в каждой клетке Р.Фишером было найдено точное распределение для, которое позволяет проверять гипотезу: =. Это распределение имеет довольно сложный вид, и его критические точки приводятся в специальных таблицах. В реальных ситуациях, как правило, значения в каждой клетке больше 10, и было показано, что в этих случаях для проверки нулевой гипотезы можно использовать статистику

(22)
amelynek, ha igaz a nullhipotézis, egy szabadságfokú khi-négyzet eloszlása ​​van.

Vegyünk egy példát. Az év különböző szakaszaiban adott malária elleni védőoltások hatékonyságát két évig teszteljük, tesztelés alatt áll az a hipotézis, hogy a védőoltások hatékonysága nem függ attól, hogy az év melyik időszakában végezzük őket. Nekünk van

A táblázatos értéke =0,05 esetén 3,84, =0,01 esetén pedig 6,64. Ezért ezen szignifikanciaszintek bármelyikén el kell vetni a nullhipotézist, és ebben a hipotetikus példában (amely azonban a valóság szempontjából releváns) megállapítható, hogy az év második felében készült sörök lényegesen több hatékony.

A négymezős tábla kapcsolódási együtthatójának természetes általánosítása, mint korábban említettük, a Chuprov kölcsönös konjugációs együttható. Ennek az együtthatónak a pontos eloszlása ​​nem ismert, ezért a hipotézis érvényességét úgy ítéljük meg, hogy a számított értéket és a kiválasztott szignifikanciaszintet összehasonlítjuk az eloszlás kritikus pontjaival. A szabadsági fokok számát az (r-1)(c-1) kifejezés határozza meg, ahol r és c az egyes jellemzők fokozatainak száma.

Emlékezzünk vissza a számítási képletekre

Bemutatjuk azokat az adatokat, amelyeket a jobb és bal szem látási tartományának tanulmányozása során nyertünk olyan embereknél, akiknek nincs látási rendellenességük. Hagyományosan ezt a tartományt négy kategóriába sorolják, és minket a bal és a jobb szem látótávolsága közötti kapcsolat megbízhatósága érdekel. Először megtaláljuk az összes tagot a dupla összegben. Ehhez a táblázatban megadott egyes értékek négyzetét el kell osztani annak a sornak és oszlopnak az összegével, amelyhez a kiválasztott szám tartozik. Nekünk van

Ezt az értéket használva =3303,6 és T=0,714 kapunk.

4 A népességeloszlások összehasonlításának kritériumai

G. Mendel a borsónemesítés klasszikus kísérletei során, amely a genetika kezdetét jelentette, megfigyelte a növények kerek sárga magvakkal és ráncos zöld magvakkal való keresztezésével nyert különböző magvak gyakoriságát.

Ebben és hasonló esetekben érdekes a nullhipotézis tesztelése azon általános sokaságok eloszlási függvényeinek egyenlőségéről, amelyekből a mintákat veszik, azaz. Az elméleti számítások azt mutatták, hogy egy ilyen probléma megoldása során statisztikai adatok használhatók

= (23)

A statisztikát használó kritériumot K. Pearson javasolta, és az ő nevét viseli. A Pearson-tesztet csoportosított adatokra alkalmazzák, függetlenül attól, hogy azok folytonos vagy diszkrét eloszlásúak. A (23)-ban k a klaszterezési intervallumok száma, az empirikus abundanciák és a várható vagy elméleti abundanciák (=n). Ha a nullhipotézis igaz, akkor a (23) statisztikának - eloszlása ​​van k-1 szabadságfokkal.

A táblázatban megadott adatokhoz

A 3 szabadságfokkal rendelkező -eloszlás kritikus pontjai =0,05 és =0,01 esetén 7,81 és 11,3. Ezért a nullhipotézist elfogadjuk, és arra a következtetésre jutunk, hogy az utódok szegregációja jó összhangban van az elméleti törvényekkel.

Nézzünk még egy példát. A tengerimalac telepen az év folyamán, januártól kezdődően a következő hónapok szerinti hím születési számokat kaptuk: 65, 64, 65, 41, 72, 80, 88, 114, 80, 129, 112, 99. megfelel egyenletes eloszlásra, pl. eloszlás, amelyben az egyes hónapokban született hímek száma átlagosan ugyanannyi? Ha elfogadjuk ezt a hipotézist, akkor a születések várható átlagos száma egyenlő lesz. Azután

A 11 szabadságfokú és = 0,01-es eloszlás kritikus értéke 24,7, így a nullhipotézist a választott szignifikanciaszinten elvetjük. A kísérleti adatok további elemzése azt mutatja, hogy nő a hím tengerimalacok születésének valószínűsége az év második felében.

Abban az esetben, ha az elméleti eloszlást egyenletesnek tételezzük fel, nincs probléma az elméleti számok kiszámításával. Más eloszlások esetén a számítások bonyolultabbá válnak. Nézzünk példákat arra, hogyan számítják ki az elméleti számokat normál és Poisson-eloszlások esetén, amelyek meglehetősen gyakoriak a kutatási gyakorlatban.

Kezdjük a normális eloszlás elméleti számainak meghatározásával. Az ötlet az, hogy empirikus eloszlásunkat nulla átlagú és egységnyi varianciájú eloszlássá alakítsuk át. Természetesen ebben az esetben az osztályintervallumok határait a szórás mértékegységében fejezzük ki, majd emlékezve arra, hogy a görbe azon szakasza alatti terület, amelyet az egyes intervallumok felső és alsó értéke határol, egyenlő ebbe az intervallumba esés valószínűségét, ezt a valószínűséget megszorozva az összes mintaszámmal, megkapjuk a kívánt elméleti számot.

Tegyük fel, hogy van egy empirikus eloszlásunk a tölgylevelek hosszára, és meg kell vizsgálni, hogy a = 0,05 szignifikancia szint mellett tekinthető-e ez az eloszlás nem tér el szignifikánsan a normáltól.

Elmagyarázzuk, hogyan számították ki a táblázatban megadott értékeket. Először a csoportosított adatok standard módszerével számítottuk ki az átlagot és a szórást, amely =10,3 és =2,67 lett. Ezen értékek alapján az intervallumok határait a szórás mértékegységében találtuk meg, azaz. talált szabványos értékeket Például a (46) intervallum határaihoz a következőket kapjuk: (4-10,3)/2,67=-2,36; (6-10,3)/2,67=-1,61. Ezután minden intervallumra kiszámítottuk a beleesés valószínűségét. Például a normál eloszlási táblázatból származó (-0,110,64) intervallumra azt kapjuk, hogy a (-0,11) ponttól balra az egységnyi normális eloszlás területének 0,444-e, az egységnyi normál eloszlás területének bal oldalán található. pont (0,64) - 0,739 ebből a területből. Így az ebbe az intervallumba való esés valószínűsége 0,739-0,444=0,295. A többi számítás nyilvánvaló. Magyarázza el a különbséget n és . Ez abból adódik, hogy az elméleti normális eloszlás gyakorlati okokból úgy tekinthető, hogy egy intervallum középpontjában áll. A kísérletben nincs olyan érték, amely jobban eltérne az átlagtól. Ezért az empirikus eloszlási görbe alatti terület nem egyenlő az egységgel, ami miatt hiba keletkezik. Ez a hiba azonban nem változtat jelentősen a végeredményen.

Az empirikus és elméleti eloszlások összehasonlításakor az -eloszlás szabadságfokainak számát az f=m-1-l összefüggésből kapjuk, ahol m az osztályintervallumok száma, l pedig a független eloszlási paraméterek száma. mintából becsüljük. Normál eloszlás esetén l=2, mivel két paramétertől függ: és.

A szabadsági fokok száma is csökken 1-gyel, mivel bármely eloszlásnál van egy feltétel, hogy \u003d 1, és ezért a függetlenül meghatározott valószínűségek száma k-1, nem k.

Az adott példában f = 8-2-1 = 5 és a kritikus érték =0,05-nél 5 szabadságfokú α-eloszlás esetén 11,07. Ezért a nullhipotézist elfogadjuk.

Megvizsgáljuk az empirikus eloszlás és a Poisson-eloszlás összehasonlításának technikáját, azzal a klasszikus példával, hogy a porosz hadseregben havonta hány dragonyos hal meg egy ló patája miatt. Az adatok a 19. századra vonatkoznak, a halálozások száma 0, 1, 2 stb. jellemzi ezeket a szomorú, de szerencsére viszonylag ritka eseményeket a porosz lovasságban közel 20 éves megfigyelés alatt.

Mint tudják, a Poisson-eloszlás a következő formában van:

ahol az eloszlási paraméter egyenlő az átlaggal,

K=0,1,2,...,n.

Mivel az eloszlás diszkrét, a számunkra érdekes valószínűségeket közvetlenül a képlet találja meg.

Mutassuk meg például, hogyan határozható meg a k=3 elméleti szám. A szokásos módon azt találjuk, hogy ebben az eloszlásban az átlag 0,652. Ezzel az értékkel azt találjuk

Innen

Ha a =0,05-öt választjuk, akkor a 2-DOF β-eloszlás kritikus értéke 5,99, így elfogadjuk azt a hipotézist, hogy az empirikus eloszlás a választott szignifikanciaszinten nem tér el a Poisson-eloszlástól. A szabadsági fokok száma ebben az esetben kettővel egyenlő, mivel a Poisson-eloszlás egy paramétertől függ, ezért f = m-1-l arányban a mintából becsült paraméterek száma l = 1, és f=4-1-1=2.

Néha a gyakorlatban fontos tudni, hogy két eloszlás különbözik-e egymástól, még akkor is, ha nehéz eldönteni, melyik elméleti eloszlással közelíthetőek. Ez különösen fontos olyan esetekben, amikor például átlaguk és/vagy szórásaik nem térnek el statisztikailag szignifikánsan egymástól. Az eloszlási minták közötti jelentős különbségek megtalálása segíthet a kutatónak abban, hogy feltételezéseket tegyen azokról a lehetséges tényezőkről, amelyek ezekhez a különbségekhez vezetnek.

Ebben az esetben a statisztika (23) használható, és az egyik eloszlás értékeit tapasztalati számként, egy másik eloszlás értékeit pedig elméleti számként használjuk. Természetesen ebben az esetben az intervallumok osztályára való felosztásnak mindkét eloszlásnál azonosnak kell lennie. Ez azt jelenti, hogy mindkét minta összes adatához kiválasztják a minimális és maximális értékeket, függetlenül attól, hogy melyik mintához tartoznak, majd a kiválasztott számú osztályintervallumnak megfelelően meghatározzák a szélességüket és a minták számát. A külön intervallumokra eső objektumok minden mintára külön számítanak ki.

Ebben az esetben kiderülhet, hogy egyes osztályok nem vagy kevés (35) értéket kapnak. A Pearson-kritérium alkalmazása kielégítő eredményt ad, ha minden intervallumba legalább 35 érték esik. Ezért, ha ez a követelmény nem teljesül, össze kell vonni a szomszédos intervallumokat. Természetesen ez mindkét disztribúciónál megtörténik.

És végül még egy megjegyzés a számított érték és a kritikus pontok összehasonlításához a választott szignifikanciaszint szerint. Azt már tudjuk, hogy ha >, akkor a nullhipotézist elvetjük. A jobb oldali 1-es kritikus ponthoz közeli értékek azonban felkelthetik a gyanúnkat, mert az empirikus és elméleti eloszlás ilyen túl jó egyezése vagy két empirikus eloszlás (elvégre ebben az esetben a számok nagyon kis mértékben különböznek majd egymástól) véletlenszerű eloszlások esetén nem valószínű. Ebben az esetben két alternatív magyarázat lehetséges: vagy egy törvénnyel van dolgunk, és akkor nem meglepő a kapott eredmény, vagy a kísérleti adatok valamilyen okból „illeszthetők” egymáshoz, amihez újraellenőrzésre van szükség.

Egyébként a borsó példájában csak az első eset van, i.e. a különböző simaságú és színű magvak megjelenését az utódokban törvény határozza meg, ezért nem meglepő, hogy a számított érték ilyen kicsinek bizonyult.

Most térjünk vissza a két empirikus eloszlás azonosságára vonatkozó statisztikai hipotézis teszteléséhez. A különböző élőhelyekről vett kökörcsinvirágok szirmszámának megoszlására vonatkozó adatokat közöljük.

A táblázatos adatokból látható, hogy az első két és az utolsó két intervallumot össze kell vonni, mivel a beléjük eső értékek száma nem elegendő a Pearson-kritérium helyes használatához. Ez a példa azt is mutatja, hogy ha csak az A élőhelyből származó eloszlást elemeznénk, akkor a 4 szirmot tartalmazó osztályintervallum egyáltalán nem létezne. Ez annak eredményeként jelent meg, hogy két eloszlást egyidejűleg veszünk figyelembe, és a második eloszlásban van egy ilyen osztály.

Tehát teszteljük azt a hipotézist, hogy ez a két eloszlás nem különbözik egymástól. Nekünk van

4-es szabadságfokszám és akár 0,001 szignifikanciaszint esetén a nullhipotézist elvetjük.

Két mintaeloszlás összehasonlításához használhatunk egy N. V. Smirnov által javasolt, A. N. Kolmogorov által korábban bemutatott statisztikákon alapuló, nem paraméteres kritériumot is. (Ezért ezt a tesztet néha Kolmogorov-Smirnov tesztnek is nevezik.) Ez a teszt kumulatív frekvenciasorok összehasonlításán alapul. Ennek a kritériumnak a statisztikája a következőképpen érhető el:

max, (24)
ahol és kumulatív gyakorisági eloszlási görbék.

A statisztika kritikus pontjai (24) a relációból származnak

, (25)
ahol és az első és második minta térfogata.

Kritikus értékek =0,1;=0,05; és =0,01 egyenlő 1,22-vel; 1,36; 1.63. Szemléltessük a Szmirnov-kritérium használatát csoportosított adatokon, és két különböző körzetből származó azonos korú iskolások növekedését reprezentálva.

A kumulatív gyakorisági görbék közötti maximális eltérés 0,124. Ha a =0,05 szignifikancia szintet választjuk, akkor a (25) képletből megkapjuk

0,098.

Így a maximális empirikus különbség nagyobb az elméletileg vártnál, ezért az elfogadott szignifikanciaszinten a két figyelembe vett eloszlás azonosságára vonatkozó nullhipotézist elvetjük.

A Smirnov-teszt nem csoportosított adatokra is használható, csak az a követelmény, hogy az adatokat folytonos eloszlású populációkból kell levonni. Az is kívánatos, hogy az értékek száma minden mintában legalább 40-50 legyen.

A nullhipotézis tesztelésére, amely szerint két független n és m méretű minta azonos eloszlásfüggvényeknek felel meg, F. Wilcoxon nem-paraméteres kritériumot javasolt, amelyet G. Mann és F. Whitney munkái is alátámasztanak. Ezért a szakirodalomban ezt a kritériumot vagy Wilcoxon-kritériumnak, vagy Mann-Whitney-kritériumnak nevezik. Akkor indokolt ezt a kritériumot alkalmazni, ha a beérkezett minták mennyisége kicsi, és más kritériumok alkalmazása illegális.

Az alábbi számítások szemléltetik a kritériumok felépítésének megközelítését, amelyek nem magukra a mintaértékekre, hanem azok rangjára vonatkozó statisztikákat használnak.

Két n és m térfogatú minta álljon rendelkezésünkre. Készítsünk belőlük egy általános variációs sorozatot, és hasonlítsuk össze ezeket az értékeket a rangjával (), pl. a sorszám, amelyet a rangsorolt ​​sorban elfoglal. Ha a nullhipotézis igaz, akkor a rangok tetszőleges eloszlása ​​ekvivalens, és adott n és m esetén a lehetséges rangkombinációk száma megegyezik az N=n+m elem kombinációinak számával m-vel.

A Wilcoxon-teszt statisztikákon alapul

. (26)

Formálisan a nullhipotézis teszteléséhez ki kell számítani a rangok összes lehetséges kombinációját, amelyekre a W statisztika értéke egyenlő vagy kisebb, mint egy adott rangsorolt ​​sorozatnál, és meg kell találni ennek a számnak az összértékhez viszonyított arányát. mindkét minta lehetséges rangkombinációinak száma. A kapott érték és a választott szignifikancia szint összehasonlítása lehetővé teszi a nullhipotézis elfogadását vagy elutasítását. Ennek a megközelítésnek az ésszerűsége az, hogy ha az egyik eloszlás a másikhoz képest torzított, akkor ez abban nyilvánul meg, hogy a kis rangoknak főként az egyik mintának, a nagyoknak pedig a másiknak kell megfelelniük. Ettől függően a megfelelő rangok összegének kicsinek vagy nagynak kell lennie, attól függően, hogy melyik alternatíva következik be.

A két mérési módszert jellemző eloszlási függvények azonosságára vonatkozó hipotézist tesztelni kell, szignifikanciaszint = 0,05.

Ebben a példában n=3, m=2, N = 2+3 = 5, a B módszerrel végzett méréseknek megfelelő rangsorok összege pedig 1+3 = 4.

Írjuk fel az összes =10 lehetséges rangeloszlást és azok összegét:

Rangsorok: 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5

Összegek: 3 4 5 6 5 6 7 7 8 9

A fokozatkombinációk számának, amelyek összege nem haladja meg a B módszernél kapott 4-es értéket, aránya a lehetséges rangkombinációk összesített számához viszonyítva 2/10=0,2>0,05, tehát ennél a példánál a a nullhipotézist elfogadjuk.

Kis n és m értékek esetén a nullhipotézist úgy lehet tesztelni, hogy közvetlenül megszámoljuk a megfelelő rangösszegek kombinációinak számát. Nagy minták esetén azonban ez gyakorlatilag lehetetlenné válik, ezért közelítést kaptunk a W statisztikára, amely, mint kiderült, aszimptotikusan a megfelelő paraméterekkel normális eloszlásra hajlik. Ezeket a paramétereket fogjuk kiszámítani, hogy illusztráljuk a statisztikai kritériumok rangsorokon alapuló szintézisének megközelítését. Ennek során a 37. fejezetben bemutatott eredményeket fogjuk felhasználni.

Legyen W az egyik mintának megfelelő rangok összege, például az m térfogatú mintának. Legyen ezeknek a rangoknak a számtani átlaga. Az érték matematikai elvárása az

mivel a nullhipotézis szerint az m méretű minta elemeinek sorai egy 1, 2,...,N (N=n+m) véges sokaságból vett minta. Ismeretes, hogy

Így.

A variancia kiszámításakor azt a tényt vesszük figyelembe, hogy az összesített rangsorolt ​​sorozat négyzetes rangjainak összege mindkét minta értékéből egyenlő

Az általános sokaságok és minták szórásának becslésére korábban kapott összefüggéseket figyelembe véve azt kaptuk, hogy

Ebből következik tehát

Kiderült, hogy a statisztikák

(27)

nagy n és m esetén aszimptotikusan egységnyi normális eloszlású.

Vegyünk egy példát. A vérszérum szűrlet polarográfiai aktivitására vonatkozó adatokat két korcsoportra vonatkozóan nyerjük. Szükséges tesztelni azt a hipotézist = 0,05 szignifikancia szint mellett, hogy a minták azonos eloszlási függvényekkel rendelkező általános sokaságokból származnak. A rangok összege az első mintánál 30, a másodiknál ​​- 90. A rangösszegek számításának helyességének ellenőrzése a feltétel teljesülése. Esetünkben 30+90=(7+8)(7+8+1):

:2=120. A (27) képlet alapján a második minta rangsorainak összegét felhasználva megkaptuk

Ha az első mintánál a rangok összegét használjuk, akkor a = -3,01 értéket kapjuk. Mivel a számított statisztika egységnyi normális eloszlású, ezért természetes, hogy mind az első, mind a második esetben a nullhipotézist elvetjük, hiszen az 5%-os szignifikanciaszint kritikus értéke modulo 1,96.

A Wilcoxon-teszt használatakor bizonyos nehézségek merülnek fel, ha mindkét mintában ugyanazok az értékek fordulnak elő, mivel a fenti képlet használata a teszt teljesítményének csökkenéséhez vezet, néha nagyon jelentős mértékben.

Az ilyen esetekben előforduló hibák minimalizálása érdekében célszerű a következő alapszabályt alkalmazni. Az első alkalom, amikor a különböző mintákhoz tartozó azonos értékekkel találkozunk, hogy melyiket helyezzük előbbre a variációs sorozatban, a véletlen, például egy érme feldobása határozza meg. Ha több ilyen érték van, akkor az első véletlenszerű meghatározása után mindkét mintából a fennmaradó egyenlő értékek váltakoznak egyenként. Azokban az esetekben, amikor más azonos értékek is előfordulnak, tegye ezt. Ha az első egyenlő értékek csoportjában az első értéket véletlenszerűen választották ki néhány mintából, akkor a következő egyenlő értékek csoportjában az első értéket egy másik mintából választották ki, és így tovább.

5. A véletlenszerűség tesztelésének és a kiugró értékek értékelésének kritériumai

Gyakran az adatokat időben vagy térben sorozatban szerzik be. Például a pszichofiziológiai kísérletek során, amelyek több órán át, több tíz vagy százszor is eltarthatnak, megmérik a bemutatott vizuális ingerre adott reakció látens (látens periódusát), vagy földrajzi felmérésekben, ha olyan helyszíneken találhatók. bizonyos helyeken, például a széli erdők mentén megszámolják egy-egy faj növényeinek számát stb. Másrészt a különböző statisztikák kiszámításakor azt feltételezzük, hogy a bemeneti adatok függetlenek és egyenlő eloszlásúak. Ezért érdemes ezt a feltevést tesztelni.

Először tekintsünk egy kritériumot az azonos normális eloszlású mennyiségek függetlenségének nullhipotézisének tesztelésére. Így ez a kritérium paraméteres. Ez az egymást követő különbségek átlagos négyzeteinek kiszámításán alapul

. (28)

Ha bevezetünk egy új statisztikát, akkor, mint az elméletből ismeretes, ha a nullhipotézis igaz, a statisztika

(29)
n>10 esetén aszimptotikus eloszlású a standard normális eloszlás szerint.

Vegyünk egy példát. Megadjuk az alany reakcióidejét () az egyik pszichofiziológiai kísérletben.

Megvan: hol

Mivel =0,05 esetén a kritikus érték 1,96, a kapott sorozat függetlenségére vonatkozó nullhipotézist a kiválasztott szignifikanciaszinttel elfogadjuk.

Egy másik kérdés, amely gyakran felmerül a kísérleti adatok elemzése során, hogy mi a teendő néhány olyan megfigyeléssel, amelyek élesen eltérnek a megfigyelések nagy részétől. Az ilyen szokatlan megfigyelések származhatnak módszertani hibákból, számítási hibákból stb. Minden olyan esetben, amikor a kísérletvezető tudja, hogy hiba csúszott a megfigyelésbe, ezt az értéket ki kell zárnia, függetlenül annak nagyságától. Más esetekben csak a tévedés gyanúja merül fel, és ilyenkor a megfelelő szempontok alapján kell meghozni egy-egy döntést, pl. zárja ki vagy hagyja meg a külső megfigyeléseket.

Általános esetben a kérdés a következő: a megfigyeléseket ugyanarra az általános sokaságra vonatkoztatták, vagy egyes rész- vagy egyedi értékek egy másik általános populációra vonatkoztak?

Természetesen az egyetlen megbízható módja az egyéni megfigyelések kizárásának, ha gondosan tanulmányozzuk azokat a körülményeket, amelyek között ezek a megfigyelések történnek. Ha a feltételek valamilyen oknál fogva eltértek a szokásostól, akkor a megfigyeléseket ki kell zárni a további elemzésből. Bizonyos esetekben azonban a meglévő kritériumok, bár tökéletlenek, jelentős előnyökkel járhatnak.

Bizonyítás nélkül bemutatunk itt több összefüggést, amelyekkel tesztelhetjük azt a hipotézist, hogy a megfigyeléseket véletlenszerűen végezzük ugyanazon az általános sokaságon. Nekünk van

(30)

(31)

(32)

hol van a kiugrónak gyanítható megfigyelés. Ha a sorozat összes értékét rangsoroljuk, akkor a kiugró megfigyelés az n-edik helyet foglalja el benne.

A statisztikához (30) az eloszlásfüggvény táblázatos. Ennek az eloszlásnak a kritikus pontjai adottak néhány n-re.

A statisztika kritikus értékei (31) n-től függően a következők

4,0; 6

4,5; 100

5,0; n>1000.

A (31) képletben azt feltételezzük, hogy és a feltételezett megfigyelés figyelembevétele nélkül számítják ki.

A statisztikákkal (32) a helyzet bonyolultabb. Megmutatjuk, hogy ha egyenletes eloszlásúak, akkor a matematikai elvárásnak és szórásnak a következő alakja van:

A kritikus régiót kis értékek alkotják, amelyek nagy értékeknek felelnek meg. Ha szeretné ellenőrizni a legkisebb érték „kiugró értékét”, akkor először alakítsa át az adatokat úgy, hogy egyenletes eloszlású legyen az intervallumon belül, majd adja ezeket az egységes értékeket 1-hez, és ellenőrizze a képlettel ( 32).

Fontolja meg a fenti kritériumok használatát a következő rangsorolt ​​megfigyelési sorozatokhoz: 3,4,5,5,6,7,8,9,9,10,11,17. El kell döntenie, hogy elutasítja-e a legnagyobb, 17-es értéket.

A (30) képlet szerint =(17-11)/3,81=1,57, és a nullhipotézist =0,01 értékkel kell elfogadni. A (31) képlet szerint =(17-7,0)/2,61=3,83, és a nullhipotézist is el kell fogadni. A harmadik feltétel használatához akkor =5,53-at kapunk

A w statisztika normál eloszlású nulla átlaggal és egységnyi szórással, ezért a =0,05 nullhipotézist elfogadjuk.

A statisztika (32) használatának összetettsége abban rejlik, hogy előzetes információval kell rendelkezni a mintaértékek eloszlásának törvényéről, majd ezt az eloszlást analitikusan átalakítani az intervallumon belüli egyenletes eloszlássá.

Irodalom

1. Eliseeva I.I. A statisztika általános elmélete: tankönyv egyetemek számára / I.I. Eliseeva, M.M. Juzbasev; szerk. I.I. Eliseeva. - M.: Pénzügy és statisztika, 2009. - 656 p.

2. Efimova M.R. Workshop a statisztika általános elméletéről: tankönyv egyetemeknek / M.R. Efimova és mások - M .: Pénzügy és statisztika, 2007. - 368 p.

3. Melkumov Ya.S. Társadalmi-gazdasági statisztika: oktatási segédlet. - M.: IMPE-PUBLISH, 2007. - 200 p.

4. A statisztika általános elmélete: Statisztikai módszertan a kereskedelmi tevékenység vizsgálatában: tankönyv egyetemek számára / O.E. Bashina és mások; szerk. O.E. Bashina, A.A. Spirin. - M.: Pénzügy és statisztika, 2008. - 440 p.

5. Salin V.N. A statisztika elméletének tanfolyama a pénzügyi-gazdasági profilú szakemberek képzéséhez: tankönyv / V.N. Salin, E. Yu. Churilova. - M.: Pénzügy és statisztika, 2007. - 480 p.

6. Társadalmi-gazdasági statisztika: műhely: tankönyv / V.N. Salin és mások; szerk. V.N. Salina, E.P. Shpakovskaya. - M.: Pénzügy és statisztika, 2009. - 192 p.

7. Statisztika: tankönyv / A.V. Bagat és mások; szerk. V.M. Simchery. - M.: Pénzügy és statisztika, 2007. - 368 p.

8. Statisztika: tankönyv / I.I. Eliseeva és mások; szerk. I.I. Eliseeva. - M.: Felsőoktatás, 2008. - 566 p.

9. A statisztika elmélete: tankönyv egyetemek számára / R.A. Shmoylov és mások; szerk. R.A. Shmoylova. - M.: Pénzügy és statisztika, 2007. - 656 p.

10. Shmoylova R.A. Workshop a statisztika elméletéről: tankönyv egyetemeknek / R.A. Shmoylov és mások; szerk. R.A. Shmoylova. - M.: Pénzügy és statisztika, 2007. - 416 p.

OLDAL \* MERGEFORMAT 1

Egyéb kapcsolódó munkák, amelyek érdekelhetik.vshm>

17926. Az ipari robotika tömörségi kritériumainak elemzése 1,77 MB
Szoftvermegoldások a robot kompaktságának felmérésére. A miniatűr robotok behatolhatnak a nyílás szűk résképződményeibe, és be tudnak mozogni, ami lehetővé teszi, hogy különböző feladatokat végezzenek szűk helyeken, például kis átmérőjű, több milliméteres nagyságrendű csöveken. Gyakorlatilag az ipar minden ágában a hajtóművek és mechanizmusok miniatürizálásának kérdései a kiemelt feladatok közé tartoznak; nagy jelentőséggel bírnak az alacsony erőforrás-igényű technológiai folyamatokban ...
1884. Kritériumok kidolgozása a hatékony személyzeti menedzsmenthez az OJSC Kazan-Orgsintez for QMS-ben 204,77 KB
A személyzetirányítási rendszer főbb elméleti vonatkozásai. A személyzet, mint a menedzsment tárgya. A minőségirányítási rendszer személyzetirányítási rendszerének kutatási módszerei. A személyzeti menedzsment hatékonyságának javításának módjai.
16316. és ez az elmélet feloldja ezt a dilemmát; b e dilemma megoldásához az elmélet kritériumainak megléte szükséges. 12,12 KB
A szerző azt állítja, hogy a rögzített árfolyam melletti makrogazdasági politika dilemmájának alapvető oka nem a Tinbergen-szabály megsértése, ami valójában következmény és nem ok, hanem az árfolyam rögzítéséhez szükséges gazdasági előfeltételek hiányában. az optimális valutaövezetek elméletében bemutatott árfolyam. E dilemma okának általában Tinbergen szabályának megsértését tartják, amely szerint bizonyos számú gazdasági cél eléréséhez az államnak ...
18273. A kazah köztársasági elnök jogállásának elemzése a jogállamiság általánosan elfogadott kritériumai és a hatalmi ágak szétválasztása szempontjából 73,64 KB
Az elnök megközelítésének lényege az volt, hogy az ország természetes evolúciós úton fejlődjön. Az elnöki kormányzás - az állam alkotmánya szerint meghatározott területi közigazgatási egység önkormányzati intézményei tevékenységének megszüntetése, és az államfő által kijelölt meghatalmazott személyek - az elnök és az arra elszámolt személyek - útján történő irányítása. neki; az államfő Alkotmányába ruházott – a rendkívüli jogkörök elnöke az egész...
5713. DotNetNuke használata 1,87 MB
Ebben a kurzusban a DotNetNuke-ot fogjuk tanulmányozni. A DotNetNuke (rövidítve DNN) egy webes tartalomkezelő rendszer (Web Content Management System, rövidítve WCMS), amely magában foglalja a webprojektépítési technológiák területén elért összes legjobb vívmányt.
7073. INTERFÉSZEK HASZNÁLATA 56,59 KB
Az interfész szó kétértelmű, és különböző kontextusokban eltérő jelentéssel bír. Létezik egy szoftver vagy hardver interfész fogalma, de a legtöbb esetben az interfész szó valamilyen objektumok vagy folyamatok közötti kommunikációhoz kapcsolódik.
6471. A regiszterek felépítése és használata 193,04 KB
A regiszterek felépítése és használata A regisztereket többbites bináris számok tárolására és konvertálására tervezték. A regiszterek flip-flopok rendezett sorozataként épülnek fel. A mikroprocesszorokban a regiszterek jelentik a digitális információk gyors memorizálásának és tárolásának fő eszközét. Az elemek, amelyekből a regiszterek épülnek, D RS JK flip-flopok dinamikus levágással vagy statikus vezérléssel.
6472. A számlálók felépítése és használata 318,58 KB
Az aszinkron számlálók osztályozása és felépítési elve A számláló olyan eszköz, amelynek kimenetein bináris kód jön létre, amely kifejezi a számláló bemenetén kapott impulzusok számát. A lehetséges számlálóállapotok számát modulusának vagy számlálótényezőjének nevezzük, és jelöljük. A számlálók főbb időbeli jellemzői: – a számláló impulzusok érkezésének maximális gyakorisága; az egyik állapotból a másikba való átmenet ideje; Valójában vannak számláló mikroáramkörök és áramkörök, amelyek egy vagy több ...
7066. A MENÜ HASZNÁLATA AZ ALKALMAZÁSBAN 240,2 KB
A programmenü A programmenünek meg kell felelnie a program főbb módjainak, ezért a menüpontok kiválasztását és az egyes tételek parancsait különös gonddal kell kezelni. A menük programokban való használatának technológiájának jobb megértéséhez vegyük figyelembe a műveletek sorrendjét a következő képzési program megoldása során. Minden művelet a menü segítségével történik.
7067. PÁRBESZÉD MENÜK HASZNÁLATA 73,13 KB
Folytatva egy menüvel és eszköztárral rendelkező alkalmazás fejlesztését, meg kell írnunk a parancsokhoz az üzenetkezelő kódot, hogy létrehozzunk egy 6 * 6-os mátrixot és megjelenítsük (nyomtassuk) a mátrixot az alkalmazásunk kliens területén. A mátrix létrehozását úgy kell befejezni, hogy a képernyőn megjelenik egy üzenet a kezelő sikeres befejezéséről, például: "A mátrix létrejött."

Mivel egy adott eloszlás természetére vonatkozó minden feltételezés hipotézis, ezeket statisztikailag ellenőrizni kell beleegyezési kritériumok, amelyek lehetővé teszik annak megállapítását, hogy az elméleti és empirikus gyakoriságok közötti eltéréseket mikor kell jelentéktelennek elismerni, pl. véletlenszerű, és amikor - szignifikáns (nem véletlenszerű). Így az illeszkedési kritériumok lehetővé teszik a hipotézis helyességének elvetését vagy megerősítését az empirikus sorozatok eloszlásának természetére vonatkozó sorozatok kiegyenlítésekor.

A beleegyezésnek számos kritériuma van. Gyakrabban használják a Pearson, Romanovsky és Kolmogorov kritériumokat.

Pearson alkalmassági teszt - az egyik fő

ahol k azoknak a csoportoknak a száma, amelyekre az empirikus eloszlás fel van osztva,
a tulajdonság megfigyelt gyakorisága az i-edik csoportban,
az elméleti frekvencia.
Az eloszláshoz táblázatokat állítottunk össze, ahol a választott szignifikanciaszinthez és szabadsági fokokhoz az illeszkedési kritérium kritikus értéke van feltüntetve df.(vagy )
A szignifikancia szintje a feltett hipotézis hibás elutasításának valószínűsége, azaz. annak a valószínűsége, hogy a helyes hipotézist elutasítják. A statisztikákban három szintet használnak:

  • a= 0,10, majd Р=0,90 (100-ból 10 esetben elvethető a helyes hipotézis);
  • a=0,05, majd P=0,95;
  • a=0,01, majd P=0,99.

A df szabadsági fokok számát úgy definiáljuk, mint az eloszlási sorozat csoportjainak számát mínusz a kötések száma: df = k –z. A kapcsolatok száma alatt az elméleti gyakoriságok számításánál használt empirikus sorozatok mutatóinak számát értjük, pl. empirikus és elméleti gyakoriságokat összekapcsoló mutatók.
Például, ha egy normál eloszlási görbéhez igazítjuk, három összefüggés létezik:
; ; .
Ezért a normál eloszlási görbe mentén történő szintezéskor a szabadsági fokok számát a következőképpen definiáljuk: df = k –3.
A lényegesség megítéléséhez a számított értéket összehasonlítják a táblázatos értékkel.
Az elméleti és tapasztalati eloszlások teljes egybeesésével , egyébként >0. Ha >, akkor adott szignifikanciaszintre és szabadságfokszámra vonatkozóan elvetjük az eltérések jelentéktelenségének (véletlenszerűségének) hipotézisét.
Ha , arra a következtetésre jutunk, hogy az empirikus sorozat jó egyezést mutat a várható eloszlás hipotézisével, és Р=(1-a) valószínűséggel állítható, hogy az elméleti és az empirikus gyakoriságok közötti eltérés véletlenszerű.
A Pearson-féle illeszkedési tesztet akkor alkalmazzuk, ha a populáció mérete elég nagy, és az egyes csoportok gyakoriságának legalább 5-nek kell lennie.

Romanovsky-kritérium -val a Pearson-kritérium alkalmazása alapján, azaz. már talált értékek, és a szabadsági fokok száma df:

Akkor hasznos, ha nincsenek táblák a számára.
Ha azzal<3, то расхождения распределений случайны, если же с>3, akkor ezek nem véletlenszerűek, és az elméleti eloszlás nem szolgálhat modellként a vizsgált empirikus eloszláshoz.

Kolmogorov-kritérium l a halmozott gyakoriságok és az empirikus és elméleti eloszlások gyakoriságai közötti maximális eltérés meghatározásán alapul:
vagy ,
ahol D és d a legnagyobb különbség az empirikus és elméleti eloszlássorozatok halmozott gyakoriságai és halmozott gyakoriságai között;
N a lakossági egységek száma.
Az l értékét kiszámítva a P(l) táblázat meghatározza, hogy mekkora valószínűséggel állítható, hogy az empirikus gyakoriságok eltérései az elméletitől véletlenszerűek. Р(l) valószínűsége 0 és 1 között változhat. Р(l)=1 esetén a frekvenciák teljes egybeesése, Р(l)=0 – teljes eltérés. Ha l értéket vesz fel 0,3-ig, akkor P(l)=1.
A Kolmogorov-kritérium használatának fő feltétele a kellően nagy számú megfigyelés.

51. definíció. Kritériumok, amelyek lehetővé teszik annak megítélését, hogy az értékek megegyeznek-e x 1 , x 2 ,…, x n valószínűségi változó x eloszlásfüggvényére vonatkozó hipotézissel ún beleegyezési kritériumok.

Az alkalmassági kritériumok alkalmazásának ötlete

E statisztikai anyag alapján szükséges a hipotézis tesztelése H, ami abból áll, hogy az SW x engedelmeskedik valamilyen meghatározott elosztási törvénynek. Ez a törvény eloszlásfüggvényként is megadható F(x), vagy eloszlási sűrűség formájában f(x), vagy valószínűségi halmaz formájában pi. Mivel mindezen formák közül az eloszlásfüggvény F(x) a legáltalánosabb (a DSW és az NSW esetében is létezik), és meghatároz minden mást, akkor megfogalmazzuk a hipotézist H, mivel abból áll, hogy a mennyiség x elosztó funkciója van F(x).

Egy hipotézis elfogadása vagy elutasítása H, vegye figyelembe bizonyos mennyiséget U az elméleti és statisztikai eloszlások eltérésének (eltérésének) mértékét jellemzi. ÉrtékU többféleképpen választható ki: 1) az elméleti valószínűségek négyzetes eltéréseinek összege pi a megfelelő gyakoriságoktól, 2) ugyanazon négyzetek összege bizonyos együtthatókkal (súlyokkal), 3) a statisztikai (empirikus) eloszlásfüggvény maximális eltérése az elméletitől. F(x).

Legyen az érték Uígy vagy úgy választják. Nyilvánvalóan ez egy véletlen változó. elosztási törvény U a valószínűségi változó eloszlási törvényétől függ x, amelyen kísérleteket végeztek, és a kísérletek száma n. Ha a hipotézis H igaz, akkor a mennyiség eloszlási törvénye U a mennyiség eloszlási törvénye határozza meg x(funkció F(x)) és a szám n.

Tegyük fel, hogy ez az eloszlási törvény ismert. Ennek a kísérletsorozatnak az eredményeként azt találták, hogy a választott eltérés mértéke U felvett némi értéket u. Kérdés: magyarázható-e ez véletlenszerű okokkal ill ez az eltérés is nagy, és szignifikáns különbséget jelez az elméleti és statisztikai (empirikus) eloszlás között, és ezért a hipotézis alkalmatlanságát H? A kérdés megválaszolásához tegyük fel, hogy a hipotézis H helyes, és ennek a feltevésnek megfelelően kiszámítjuk annak valószínűségét, hogy az elégtelen mennyiségű kísérleti anyaghoz kapcsolódó véletlenszerű okok miatt az eltérés mértéke U nem lesz kisebb, mint a kísérletileg megfigyelt érték u, azaz kiszámítjuk az esemény valószínűségét: .

Ha ez a valószínűség kicsi, akkor a hipotézis H el kell utasítani, mint alig valószínű, de ha ez a valószínűség szignifikáns, akkor arra a következtetésre jutunk, hogy a kísérleti adatok nem mondanak ellent a hipotézisnek H.

Felmerül a kérdés: hogyan válasszuk meg az eltérés (eltérés) mértékét? U? Kiderül, hogy bizonyos választási módoknál a mennyiség eloszlásának törvénye U nagyon egyszerű tulajdonságokkal rendelkezik, és elég nagy n gyakorlatilag független a funkciótól F(x). A matematikai statisztikában pontosan az eltérés mértékét használják az egyetértés kritériumaként.

Meghatározás 51 / . Az illeszkedési jóság kritériuma az ismeretlen eloszlás feltételezett törvényére vonatkozó hipotézis tesztelésének kritériuma.

A normálhoz közeli eloszlású kvantitatív adatokhoz használja a parametrikus olyan mutatókon alapuló módszerek, mint a matematikai várakozás és a szórás. Különösen a két minta átlagai közötti különbség megbízhatóságának meghatározására a Student-féle módszert (kritériumot), három vagy több minta közötti különbségek megítélésére pedig a tesztet. F, vagy varianciaanalízis. Ha nem kvantitatív adatokkal van dolgunk, vagy a minták túl kicsik ahhoz, hogy megbizonyosodjunk arról, hogy a populációk, amelyekből származnak, normális eloszlást követnek, akkor a nem paraméteres módszerek – kritérium χ 2(khi-négyzet) vagy Pearson a minőségi adatokhoz és kritériumokhoz a jelekhez, rangokhoz, Mann-Whitney, Wilcoxon stb.

Ezen túlmenően a statisztikai módszer megválasztása attól is függ, hogy azok a minták, amelyek átlagait összehasonlítjuk független(azaz például két különböző tantárgycsoportból vettük) ill függő(azaz ugyanazon alanycsoport expozíció előtti és utáni vagy két különböző expozíció utáni eredményeit tükrözi).

Pp. 1. Pearson-teszt (- chi-négyzet)

Legyen előállított n független kísérletek, amelyek mindegyikében az X valószínűségi változó egy bizonyos értéket vett fel, azaz egy valószínűségi változó megfigyeléseinek mintáját adjuk meg x(általános népesség) mennyiség n. Tekintsük az elméleti és empirikus eloszlásfüggvények közelségének ellenőrzésének problémáját diszkrét eloszlás esetén, azaz ellenőrizni kell, hogy a kísérleti adatok összhangban vannak-e a hipotézissel H 0 jelzi, hogy a valószínűségi változó x elosztási törvénye van F(x) szignifikancia szinten α . Nevezzük ezt a törvényt „elméletinek”.

Amikor egy hipotézis teszteléséhez megfelelőségi kritériumot kapunk, meghatározunk egy mértéket D adott minta empirikus eloszlásfüggvényének eltérései a feltételezett (elméleti) eloszlásfüggvénytől F(x).

A leggyakrabban használt mérték a Pearson által bevezetett. Nézzük meg ezt az intézkedést. Felosztjuk a valószínűségi változó értékkészletét x a r készletek - csoportok S 1 , S 2 ,…, S r, közös pontok nélkül. A gyakorlatban egy ilyen partíciót a ( r- 1) számok c 1 < c 2 < … < r-egy. Ebben az esetben minden intervallum vége kimarad a megfelelő halmazból, a bal pedig belekerül.

S 1 S 2 S 3 …. S r -1 S r

c 1 c 2 c 3 r -1

Legyen pi, , - annak a valószínűsége, hogy az SW x a készlethez tartozik Si(magától értetődően ). Legyen n i, , - az értékek (változatok) száma a halmazhoz tartozó megfigyelhetőek számából Si(empirikus frekvenciák). Ekkor az SW relatív gyakorisága ütött x sok Si nál nél n megfigyelések. Nyilvánvaló, hogy ,.

A fenti felosztáshoz pi van növekedés F(x) forgatáson Si, és a növekmény ugyanazon a halmazon van. A kísérletek eredményeit táblázatba foglaljuk csoportosított statisztikai sorozat formájában.

Csoporthatárok Relatív gyakoriság
S 1:x 1 – x 2
S 2: x 2 – x 3
S r: x rx r +1

Az elméleti eloszlási törvény ismeretében megtalálhatjuk az egyes csoportokba eső valószínűségi változók elméleti valószínűségét: R 1 , R 2 , …, p r. Az elméleti és empirikus (statisztikai) eloszlások konzisztenciáját ellenőrizve az elméleti valószínűségek közötti eltérésekből indulunk ki. piés a megfigyelt frekvenciák.

Mértékre D az empirikus eloszlásfüggvény elméletitől való eltérései (eltérései) vegyük az elméleti valószínűségek négyzetes eltéréseinek összegét pi bizonyos "súllyal" vett frekvenciákról c i: .

Esély c i azért vezetik be, mert általános esetben a különböző csoportokhoz kapcsolódó eltérések nem tekinthetők egyforma jelentőségűnek: az azonos abszolút érték eltérése csekély jelentőségű lehet, ha maga a valószínűség pi nagy, és nagyon észrevehető, ha kicsi. Ezért természetesen "súlyok" c i fordítottan arányosak legyenek a valószínűségekkel. Hogyan válasszuk ki ezt az arányt?

K. Pearson megmutatta, hogy ha tesszük, akkor nagyra n mennyiségi elosztási törvény U nagyon egyszerű tulajdonságokkal rendelkezik: gyakorlatilag független az eloszlásfüggvénytől F(x) és a kísérletek számáról n, de csak a csoportok számától függ r, mégpedig ez a törvény növekvő n megközelíti az úgynevezett khi-négyzet eloszlást .

Ha további anyagra van szüksége ebben a témában, vagy nem találta meg, amit keresett, javasoljuk, hogy használja a munkaadatbázisunkban található keresést:

Mit csinálunk a kapott anyaggal:

Ha ez az anyag hasznosnak bizonyult az Ön számára, elmentheti az oldalára a közösségi hálózatokon:

Az illeszkedési teszt egy szignifikancia-teszt, amelyet a mintavétel alapjául szolgáló általános sokaság eloszlási törvényére vonatkozó hipotézis tesztelésére használnak.

Leggyakrabban az érdekli a kutatót, hogy a kísérleti adatok eloszlása ​​megfelel-e a normál törvénynek. Ezért a példák a kísérleti eloszlás normalitási vizsgálatához kapcsolódnak.

  • Shapiro-Wilk teszt
  • Khi-négyzet teszt
  • Kolmogorov-Smirnov lambda-kritérium

SHAPIRO-WILKI KRITÉRIUM

Alkalmazási feltételek: kis mintaméret

H 0 - az általános sokaság megoszlása, amelyből a sokaság mintája származott, megfelel a normál törvénynek.

H 1 - az általános sokaság eloszlása, amelyből a sokaság mintája származott, nem felel meg a normál törvénynek.

1. táblázat - Algoritmus a Shapiro-Wilk teszt kiszámításához.

xx∆kkankankΔk
1 2 3 4 5 6 7
1 11,8 13,8 2 1 0,5739 1,1478
2 12 13,2 1,2 2 0,3291 0,39492
3 12,1 13 0,9 3 0,2141 0,19269
4 12,3 12,8 0,5 4 0,1224 0,0612
5 12,6 12,6 0 5 0,0399 0
6 12,6 12,6
7 12,8 12,3 Összeg=b=17966
8 13 12,1
9 13,2 12
10 13,8 11,8

A Shapiro-Wilky-kritérium kiszámításának eljárása

  1. Megfogalmazzuk a H 0 hipotézist az általános sokaság, amelyből az adatokat nyertük, eloszlásának a normáltörvénynek való megfeleléséről. α=0,05 szignifikancia szintet rendelünk.
  2. Mintát kapunk a kísérleti adatokból (1. táblázat 1. oszlopa). Esetünkben n=10.
  3. Kiszámoljuk a minta variancia értékét. Például S 2 \u003d 0,37.
  4. A mintát növekvő és csökkenő sorrendbe soroljuk (2. és 3. oszlop)
  5. Számítsa ki a Δk különbségeket (5. oszlop)
  6. A függelék 6. táblázatából (lásd V.S. Ivanov, 1990) megtaláljuk az együtthatók értékeit ank (6. oszlop)
  7. Keresse meg a terméket ankΔk
  8. Számítsd ki: b=összeg ankΔk= 1,7966
  9. A Wf-kritérium értékét a következő képlet segítségével számítjuk ki:
  1. Táblázatból. 7 Alkalmazások (lásd V.S. Ivanov, 1990) a Shapiro-Wilk teszt kritikus értékét α=0,05 Wcrit= 0,842 esetén találjuk.
  2. Következtetés. A Wf>Wcrit óta azt mondhatjuk, hogy a kísérleti adatok 0,05 szignifikancia szinten megfelelnek a normál törvénynek.

KHI-NÉGY TESZT

Tervezett Karl Pearson. Intervallumvariációs sorozat felépítése és empirikus (n em) és elméleti (n t) gyakoriságok összehasonlítása alapján (1. ábra).

1. ábra. Az empirikus eloszlást és a normális eloszlás valószínűségi sűrűségfüggvényét jellemző hisztogram.

Statisztikai hipotézis: annak az általános sokaságnak az eloszlási sűrűsége, amelyből a mintát veszik, megfelel a normális eloszlás elméleti modelljének.

A tényleges khi-négyzet teszt értékét a következő képlet számítja ki:

Ha a khi-négyzet próba tényleges értéke nagyobb vagy egyenlő, mint a khi-négyzet próba kritikus értéke, akkor megállapítható, hogy az empirikus eloszlás α szignifikancia szinten nem követi a normál törvényt.

KOLMOGOROV-SZMIRNOV LAMBDA KRITÉRIUM

Kifejlesztette: Andrey Nikolaevich Kolmogorovés Nyikolaj Vasziljevics Szmirnov.

Statisztikai hipotézis: az általános sokaság eloszlásfüggvénye (2. ábra), amelyből a mintát veszik, megfelel a normáltörvény eloszlásfüggvényének.

2. ábra. A piros pontok a kísérleti adatok alapján felépített kumulátum, a kék görbe az elméleti eloszlásfüggvény (normál eloszlás).

A λ f kritérium értékét a következő képlettel számítjuk ki:

Következtetés: ha λ f > λ kritikus - empirikus eloszlás nem felel meg a normálisnakα szignifikancia szinten.

IRODALOM

  1. Felsőmatematika és matematikai statisztika: tankönyv egyetemek számára / Szerk. szerk. G. I. Popova. - M. Testkultúra, 2007. - 368 p.
  2. A matematikai statisztika alapjai: Oktatóanyag az in-t nat. kultusz / Szerk. V.S. Ivanova.– M.: Fizkultura i sport, 1990. 176 p.