Interval de încredere pentru care tabel. Metode cantitative: Estimarea intervalelor de încredere

Să construim în MS EXCEL un interval de încredere pentru a estima valoarea medie a distribuției în cazul unei valori cunoscute a varianței.

Desigur alegerea nivelul de încredere depinde complet de problema rezolvată. Astfel, gradul de încredere al pasagerului aerian în fiabilitatea aeronavei, fără îndoială, ar trebui să fie mai mare decât gradul de încredere al cumpărătorului în fiabilitatea becului.

Enunțarea problemei

Să presupunem că de la populatia generala luând probă marimea n. Se presupune că deviație standard această distribuţie este cunoscută. Este necesar pe baza acestui fapt prelevarea de probe evalua necunoscutul distribuția medie(μ,) și construiți corespunzătoare cu două feţe interval de încredere.

Estimarea punctuala

După cum se știe din, statistici(o notăm X Mier) este o estimare imparțială a mediei acest populatia generalași are distribuția N (μ; σ 2 / n).

Notă: Ce să faci dacă trebuie să construiești interval de încredereîn cazul unei distribuţii care nu este normal?În acest caz, vine vorba de salvare, care spune că cu o dimensiune suficient de mare prelevarea de probe n din distributie a nu fi normal, distribuția eșantionului de statistică X av voi aproximativ corespund distributie normala cu parametrii N (μ; σ 2 / n).

Asa de, estimare punctuală mijloc valorile de distributie avem - asta eșantion mediu, adică X Mier... Acum să trecem la interval de încredere.

Trasarea unui interval de încredere

De obicei, cunoscând distribuția și parametrii acesteia, putem calcula probabilitatea ca o variabilă aleatorie să ia o valoare din intervalul pe care l-am specificat. Acum să facem invers: găsim intervalul în care variabila aleatoare va cădea cu o probabilitate dată. De exemplu, din proprietăți distributie normala se știe că, cu o probabilitate de 95%, o variabilă aleatorie distribuită peste legea normală, se va încadra într-un interval de aproximativ +/- 2 de la Valoarea medie(vezi articolul despre). Acest interval ne va servi drept prototip interval de încredere.

Acum să ne dăm seama dacă știm distribuția , pentru a calcula acest interval? Pentru a răspunde la întrebare, trebuie să indicăm forma distribuției și parametrii acesteia.

Cunoaștem forma de distribuție - este distributie normala(amintiți-vă că vorbim despre distribuția probei statistici X Mier).

Nu cunoaștem parametrul μ (trebuie doar estimat folosind interval de încredere), dar avem estimarea lui X miercuri, calculat pe baza prelevare de probe, care poate fi folosit.

Al doilea parametru este abaterea standard a mediei eșantionului îl vom considera cunoscut, este egal cu σ / √n.

pentru că nu știm μ, atunci vom construi intervalul +/- 2 abateri standard nu de la Valoarea medie, și din estimarea sa cunoscută X Mier... Acestea. la calcul interval de încredere NU vom presupune că X Mier se încadrează în intervalul +/- 2 abateri standard de la μ cu o probabilitate de 95% și vom presupune că intervalul +/- 2 abateri standard din X Mier cu o probabilitate de 95% va acoperi μ - media populației generale, din care se ia probă... Aceste două afirmații sunt echivalente, dar a doua declarație ne permite să construim interval de încredere.

În plus, clarificăm intervalul: o variabilă aleatoare distribuită peste legea normală, cu o probabilitate de 95% se încadrează în intervalul +/- 1,960 abateri standard, nu +/- 2 abateri standard... Aceasta poate fi calculată folosind formula = NORM.ST.OBR ((1 + 0,95) / 2), cm. fișier exemplu Spațiere între foi.

Putem formula acum o afirmație probabilistică care ne va servi să formăm interval de încredere:
„Probabilitatea ca media populatiei este de la proba medieîn termen de 1.960" abaterile standard ale mediei eșantionului ", este egal cu 95%”.

Valoarea probabilității menționată în declarație are o denumire specială care este asociat cu nivelul de semnificație α (alfa) printr-o expresie simplă nivel de încredere =1 . În cazul nostru nivelul de semnificație α =1-0,95=0,05 .

Acum, pe baza acestei afirmații probabilistice, notăm o expresie pentru calcul interval de încredere:

unde Z α / 2 standard distributie normala(o astfel de valoare a unei variabile aleatoare z, ce P(z>=Z α / 2 ) = α / 2).

Notă: α / 2-cuantilă superioară determină lățimea interval de încredere v abateri standard eșantion mediu. α / 2-cuantilă superioară standard distributie normalaîntotdeauna mai mare decât 0, ceea ce este foarte convenabil.

În cazul nostru, la α = 0,05, α / 2-cuantilă superioară este egal cu 1.960. Pentru alte niveluri de semnificație α (10%; 1%) α / 2-cuantilă superioară Z α / 2 poate fi calculat folosind formula = NORM.ST.OBR (1-α / 2) sau, dacă este cunoscută nivel de încredere, = ST.OBR STANDARD ((1 + nivel de încredere) / 2).

De obicei, la construirea intervale de încredere pentru estimarea mediei utilizați numai α superioară/2-cuantilă si nu folositi mai mic α/2-cuantilă... Acest lucru este posibil pentru că standard distributie normala simetric față de axa x ( densitatea sa de distribuție simetric în raport cu medie, adică 0). Prin urmare, nu este nevoie să se calculeze α / 2-cuantilă inferior(se numește pur și simplu α / 2-cuantilă), deoarece este egal α superioară/2-cuantilă cu semnul minus.

Reamintim că, în ciuda formei distribuției cantității x, variabila aleatoare corespunzătoare X Mier distribuite aproximativ amenda N (μ; σ 2 / n) (vezi articolul despre). Prin urmare, în cazul general, expresia de mai sus pentru interval de încredere este doar aproximativă. Dacă cantitatea x este distribuită peste legea normală N (μ; σ 2 / n), apoi expresia pentru interval de încredere este exactă.

Calculul intervalului de încredere în MS EXCEL

Să rezolvăm problema.
Timpul de răspuns al componentei electronice la semnalul de intrare este caracteristică importantă dispozitive. Inginerul vrea să traseze un interval de încredere pentru timpul mediu de răspuns la un nivel de încredere de 95%. Inginerul știe din experiența anterioară că abaterea standard a timpului de răspuns este de 8 ms. Se știe că inginerul a făcut 25 de măsurători pentru a estima timpul de răspuns, valoarea medie a fost de 78 ms.

Soluţie: Un inginer vrea să cunoască timpul de răspuns al unui dispozitiv electronic, dar realizează că timpul de răspuns nu este o variabilă fixă, ci o variabilă aleatoare care are propria sa distribuție. Deci, cel mai bun lucru pe care se poate baza este să determine parametrii și forma acestei distribuții.

Din păcate, din starea problemei, forma distribuției timpului de răspuns nu ne este cunoscută (nu trebuie să fie normal). , această distribuție este, de asemenea, necunoscută. Cunoscut doar pentru el deviație standardσ = 8. Prin urmare, până când putem calcula probabilitățile și construi interval de încredere.

Cu toate acestea, în ciuda faptului că nu cunoaștem distribuția timp răspuns separat, știm că conform CPT, distribuția probei timpul mediu de răspuns este de aproximativ normal(vom presupune că condițiile CPT sunt efectuate deoarece marimea prelevarea de probe suficient de mare (n = 25)) .

În plus, media a acestei distribuţii este in medie distribuția unui singur răspuns, adică μ. A deviație standard a acestei distribuții (σ / √n) poate fi calculată prin formula = 8 / ROOT (25).

De asemenea, se știe că inginerul a primit estimare punctuală parametrul μ egal cu 78 msec (X cf.). Prin urmare, acum putem calcula probabilitățile, deoarece cunoaștem forma de distribuție ( normal) și parametrii săi (X cf și σ / √n).

Inginerul vrea să știe valorea estimataμ din distribuția timpului de răspuns. După cum sa menționat mai sus, acest μ este egal cu așteptarea matematică a distribuției eșantionului a timpului mediu de răspuns... Dacă folosim distributie normala N (X cf; σ / √n), atunci μ dorit va fi în intervalul +/- 2 * σ / √n cu o probabilitate de aproximativ 95%.

Nivel de semnificație este egal cu 1-0,95 = 0,05.

În cele din urmă, găsiți chenarul din stânga și din dreapta interval de încredere.
Chenarul din stânga: = 78-ST.OBR STANDARD (1-0,05 / 2) * 8 / ROOT (25) = 74,864
Chenarul din dreapta: = 78 + NORM.ST.OBR (1-0,05 / 2) * 8 / ROOT (25) = 81,136

Chenarul din stânga: = NORM.OBR (0,05 / 2; 78; 8 / ROOT (25))
Chenarul din dreapta: = NORM.INV (1-0,05 / 2; 78; 8 / ROOT (25))

Răspuns: interval de încredere la nivelul de încredere 95% și σ=8Domnișoară este egal cu 78 +/- 3,136 msec.

V exemplu de fișier pe foaia de lucru Sigma se cunoaşte o formă de calcul şi construcţie bilateral interval de încredere pentru arbitrar mostre cu un σ dat și nivelul de semnificație.

Funcția ÎNCREDERE.NORM ().

Dacă valorile prelevarea de probe sunt în gamă B20: B79 , A nivelul de semnificație egal cu 0,05; apoi formula MS EXCEL:
= MEDIE (B20: B79) -TRUST.NORM (0,05, σ, COUNT (B20: B79))
va întoarce marginea stângă interval de încredere.

Aceeași margine poate fi calculată folosind formula:
= MEDIE (B20: B79) -NORM.ST.INV (1-0,05 / 2) * σ / ROOT (NUMĂRĂ (B20: B79))

Notă: Funcția CONFIRM.NORM () a apărut în MS EXCEL 2010. În versiunile anterioare ale MS EXCEL, a fost utilizată funcția CONFIDENCE ().

Se numește probabilitatea ca adevărata valoare a mărimii măsurate să se afle într-un anumit interval nivel de încredere , sau factor de securitate, și intervalul în sine - interval de încredere.

Fiecare nivel de încredere are propriul interval de încredere. În special, un interval de încredere de 0,67 corespunde unui interval de încredere de la până la. Cu toate acestea, această afirmație este valabilă doar pentru un număr suficient de mare de măsurători (mai mult de 10), iar probabilitatea de 0,67 nu pare să fie suficient de sigură - în aproximativ fiecare dintre cele trei serii de măsurători y poate fi în afara intervalului de încredere. Pentru a obține mai multă încredere că valoarea valorii măsurate se află în intervalul de încredere, li se oferă de obicei o probabilitate de încredere de 0,95 - 0,99. Interval de încredere pentru un anumit nivel de încredere, ținând cont de influența numărului de măsurători n poate fi găsit prin înmulțirea abaterii standard a mediei aritmetice

.

prin așa-numitul coeficient Student. Coeficienții elevului pentru un număr de valori și n sunt date în tabel.

Tabel - Coeficienții elevului

Număr de măsurători n Probabilitatea de încredere y
0,67 0,90 0,95 0,99
2,0 6,3 12,7 63,7
1,3 2,4 3,2 5,8
1,2 2,1 2,8 4,6
1,2 2,0 2,6 4,0
1,1 1,8 2,3 3,3
1,0 1,7 2,0 2,6

În sfârșit, pentru măsurand y la un anumit nivel de încredere y și numărul de măsurători n se obtine conditia

Vom chema cantitatea eroare aleatorie magnitudini y.

Exemplu: vezi prelegerea # 5 - o serie de numere.

Noi definim

Cu numărul de măsurători - 45 și nivelul de încredere - 0,95, obținem că coeficientul Student este aproximativ egal cu 2,15. Atunci intervalul de încredere pentru această serie de măsurători este 62,6.

Ratări (eroare gravă) - erori grave asociate cu erorile operatorului sau nesocotite pentru influențe externe. Acestea sunt de obicei excluse din rezultatele măsurătorilor. Ratele sunt de obicei cauzate de neglijență. Acestea pot apărea și din cauza unei defecțiuni a dispozitivului.

Intervale de încredere ( Engleză Intervale de încredere) unul dintre tipurile de estimări de interval utilizate în statistică, care sunt calculate pentru un anumit nivel de semnificație. Ele ne permit să facem afirmația că valoarea adevărată a parametrului statistic necunoscut al populației generale se află în intervalul de valori obținut cu o probabilitate care este stabilită de nivelul de semnificație statistică selectat.

Distributie normala

Când se cunoaște variația (σ 2) a populației, scorul z poate fi utilizat pentru a calcula limitele de încredere (punctele limită ale intervalului de încredere). În comparație cu utilizarea distribuției t, utilizarea scorului z va permite nu numai construirea unui interval de încredere mai îngust, ci și obținerea unor estimări mai fiabile ale așteptării matematice și a abaterii standard (σ), deoarece scorul Z este pe baza distribuţiei normale.

Formulă

Pentru a determina punctele limită ale intervalului de încredere, cu condiția ca abaterea standard a populației generale de date să fie cunoscută, se utilizează următoarea formulă

L = X - Z α / 2 σ
√n

Exemplu

Să presupunem că dimensiunea eșantionului este de 25 de observații, așteptarea eșantionului este de 15 și abaterea standard a populației este 8. Pentru un nivel de semnificație de α = 5%, scorul Z este Z α / 2 = 1,96. În acest caz, limitele inferioare și superioare ale intervalului de încredere vor fi

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Astfel, putem susține că, cu o probabilitate de 95%, așteptarea matematică a populației generale va scădea în intervalul de la 11,864 la 18,136.

Tehnici de îngustare a intervalului de încredere

Să presupunem că gama este prea largă pentru scopurile studiului nostru. Există două moduri de a reduce intervalul intervalului de încredere.

  1. Reduceți nivelul de semnificație statistică α.
  2. Măriți dimensiunea eșantionului.

Reducerea nivelului de semnificație statistică la α = 10%, obținem un scor Z egal cu Z α / 2 = 1,64. În acest caz, limitele inferioare și superioare ale intervalului vor fi

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Iar intervalul de încredere în sine poate fi scris ca

În acest caz, putem presupune că, cu o probabilitate de 90%, așteptările matematice ale populației generale se vor încadra în interval.

Dacă dorim să nu reducem nivelul de semnificație statistică α, atunci singura alternativă este creșterea dimensiunii eșantionului. Mărind-o la 144 de observații, obținem următoarele valori limitele de încredere

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Intervalul de încredere în sine va fi după cum urmează

Astfel, îngustarea intervalului de încredere fără a reduce nivelul de semnificație statistică este posibilă doar prin creșterea dimensiunii eșantionului. Dacă nu este posibilă o creștere a dimensiunii eșantionului, atunci o îngustare a intervalului de încredere poate fi realizată numai prin reducerea nivelului de semnificație statistică.

Reprezentarea grafică a unui interval de încredere pentru o altă distribuție decât cea normală

Dacă abaterea standard a populației generale nu este cunoscută sau distribuția este diferită de normală, distribuția t este utilizată pentru a construi intervalul de încredere. Această tehnică este mai conservatoare, care este exprimată în intervale de încredere mai largi, comparativ cu tehnica bazată pe scorul Z.

Formulă

Pentru a calcula limitele inferioare și superioare ale intervalului de încredere pe baza distribuției t, se aplică următoarele formule

L = X - t α σ
√n

Distribuția Student sau distribuția t depinde doar de un parametru - numărul de grade de libertate, care este egal cu numărul de valori individuale ale caracteristicii (numărul de observații din eșantion). Valoarea testului t Student pentru un anumit număr de grade de libertate (n) și nivelul de semnificație statistică α pot fi găsite din tabelele de căutare.

Exemplu

Să presupunem că dimensiunea eșantionului este de 25 de valori individuale, așteptarea matematică a eșantionului este de 50, iar abaterea standard a eșantionului este de 28. Este necesar să se construiască un interval de încredere pentru nivelul de semnificație statistică α = 5%.

În cazul nostru, numărul de grade de libertate este 24 (25-1), prin urmare, valoarea tabelară corespunzătoare a testului t Student pentru nivelul de semnificație statistică α = 5% este 2,064. Prin urmare, limitele inferioare și superioare ale intervalului de încredere vor fi

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Iar intervalul în sine poate fi scris ca

Astfel, putem susține că, cu o probabilitate de 95%, așteptările matematice ale populației generale vor fi în interval.

Utilizarea distribuției t îngustează intervalul de încredere fie prin scăderea semnificației statistice, fie prin creșterea dimensiunii eșantionului.

Reducând semnificația statistică de la 95% la 90% în condițiile exemplului nostru, obținem valoarea tabelară corespunzătoare a testului t Student 1.711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

În acest caz, putem argumenta că, cu o probabilitate de 90%, așteptările matematice ale populației generale vor fi în interval.

Dacă nu dorim să reducem semnificația statistică, atunci singura alternativă ar fi creșterea dimensiunii eșantionului. Să presupunem că este vorba de 64 de observații individuale, și nu de 25 ca în condiția inițială a exemplului. Valoarea tabelară a testului t Student pentru 63 de grade de libertate (64-1) și nivelul de semnificație statistică α = 5% este 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Acest lucru ne permite să afirmăm că, cu o probabilitate de 95%, așteptările matematice ale populației generale vor fi în interval.

Mostre mari

Eșantioanele mari includ eșantioane din populația generală de date, numărul de observații individuale în care depășește 100. Studiile statistice au arătat că eșantioanele mai mari tind să fie distribuite normal, chiar dacă distribuția populației generale diferă de normal. În plus, pentru astfel de eșantioane, utilizarea scorurilor z și a distribuțiilor t oferă aproximativ aceleași rezultate la construirea intervalelor de încredere. Astfel, pentru eșantioane mari, scorul z pentru distribuția normală poate fi utilizat în locul distribuției t.

Să rezumam

Pentru majoritatea covârșitoare a măsurătorilor simple, așa-numita lege normală a erorilor aleatorii ( legea lui Gauss) derivate din următoarele prevederi empirice.

1) erorile de măsurare pot lua o serie continuă de valori;

2) cu un număr mare de măsurători, erori de aceeași amploare, dar de semn diferit, apar la fel de des,

3) cu cât valoarea erorii aleatoare este mai mare, cu atât probabilitatea apariției acesteia este mai mică.

Graficul distribuției gaussiene normale este prezentat în Fig. 1. Ecuația pentru curbă este

unde este funcția de distribuție a erorilor aleatoare (erori), care caracterizează probabilitatea unei erori, σ este eroarea pătratică medie.

Valoarea σ nu este o variabilă aleatoare și caracterizează procesul de măsurare. Dacă condițiile de măsurare nu se schimbă, atunci σ rămâne constantă. Pătratul acestei mărimi se numește variația măsurătorilor. Cu cât variația este mai mică, cu atât mai mică este împrăștierea valorilor individuale și cu atât este mai mare precizia măsurării.

Valoarea exactă a erorii pătratice medii σ, precum și valoarea adevărată a mărimii măsurate, sunt necunoscute. Există o așa-numită estimare statistică a acestui parametru, conform căreia eroarea pătratică medie este egală cu eroarea pătratică medie a mediei aritmetice. A cărui valoare este determinată de formula

unde este rezultatul i a-a măsurare; - media aritmetică a valorilor obţinute; n- numărul de măsurători.

Cu cât numărul de măsurători este mai mare, cu atât este mai mic și se apropie mai mult de σ. Dacă valoarea adevărată a valorii măsurate μ, valoarea medie aritmetică a acesteia obținută ca rezultat al măsurătorilor și o eroare absolută aleatorie, atunci rezultatul măsurării va fi scris în formă.

Se numește intervalul de valori de la până la, în care se încadrează valoarea adevărată a valorii măsurate μ interval de încredere. Deoarece este o variabilă aleatoare, valoarea adevărată se încadrează în intervalul de încredere cu o probabilitate α, care se numește nivel de încredere, sau fiabilitate măsurători. Această valoare este numeric egală cu aria trapezului curbat umbrit. (vezi fig.)

Toate acestea sunt valabile pentru un număr suficient de mare de măsurători atunci când este aproape de σ. Pentru a găsi intervalul de încredere și nivelul de încredere pentru un număr mic de măsurători, de care ne ocupăm în cursul lucrărilor de laborator, folosim Distribuția de probabilitate a elevului. Aceasta este distribuția de probabilitate a unei variabile aleatorii numite Coeficientul elevului, dă valoarea intervalului de încredere în fracții din eroarea pătratică medie a mediei aritmetice.


Distribuția de probabilitate a acestei mărimi nu depinde de σ 2, ci depinde în esență de numărul de experimente n. Cu o creștere a numărului de experimente n distribuția lui Student tinde spre distribuția gaussiană.

Funcția de distribuție este tabelată (Tabelul 1). Valoarea coeficientului Student se află la intersecția dreptei corespunzătoare numărului de măsurători n, iar coloana corespunzătoare probabilității de încredere α

Astăzi este într-adevăr prea ușor: poți merge până la un computer și, cu puține sau deloc cunoștințe despre ceea ce faci, poți crea sentimente și prostii la o viteză cu adevărat uimitoare. (J. Box)

Intervale de încredere

revizuire generală

Luând un eșantion din populație, obținem o estimare punctuală pentru parametrul care ne interesează și calculăm eroarea standard pentru a indica acuratețea estimării.

Cu toate acestea, în majoritatea cazurilor, eroarea standard ca atare nu este acceptabilă. Este mult mai util să combinați această măsură de precizie cu o estimare de interval pentru un parametru de populație.

Acest lucru se poate realiza prin utilizarea cunoștințelor distribuției teoretice de probabilitate a statisticii (parametrului) eșantionului pentru a calcula Intervalul de încredere (CI - Intervalul de încredere) pentru parametru.

În general, intervalul de încredere extinde estimările în ambele direcții cu o valoare care este un multiplu al erorii standard (a acestui parametru); cele două valori (limitele de încredere) care definesc intervalul sunt de obicei separate prin virgulă și cuprinse între paranteze.

Interval de încredere pentru medie

Folosind distribuția normală

Media eșantionului este distribuită în mod normal dacă dimensiunea eșantionului este mare, astfel încât cunoașterea distribuției normale poate fi aplicată atunci când se ia în considerare media eșantionului.

Mai exact, 95% din distribuția mediilor eșantionului se află în 1,96 deviații standard (SD) față de media populației.

Când avem un singur eșantion, îl numim eroarea standard a mediei (SEM) și calculăm intervalul de încredere de 95% pentru medie după cum urmează:

Dacă acest experiment este repetat de mai multe ori, atunci intervalul va conține media reală a populației în 95% din timp.

Acesta este de obicei un interval de încredere, cum ar fi intervalul de valori în care se află media reală a populației (media generală) cu un nivel de încredere de 95%.

Deși nu este în întregime strict (media populației este o valoare fixă ​​și, prin urmare, nu poate avea o probabilitate atribuită acesteia) să interpretăm intervalul de încredere în acest fel, este conceptual mai ușor de înțeles.

Utilizare t- distributie

Puteți utiliza distribuția normală dacă cunoașteți valoarea varianței în populație. De asemenea, atunci când dimensiunea eșantionului este mică, media eșantionului este distribuită în mod normal dacă datele care stau la baza populației sunt distribuite în mod normal.

Dacă datele care stau la baza unei populații nu sunt distribuite în mod normal și/sau varianța generală (varianța în populație) este necunoscută, media eșantionului respectă Distribuția t a studentului.

Calculăm intervalul de încredere de 95% pentru media populației generale după cum urmează:

Unde este punctul procentual (percentila) t- Distribuția t a lui Student cu (n-1) grade de libertate, care dă o probabilitate cu două fețe de 0,05.

În general, oferă o gamă mai largă decât atunci când se utilizează o distribuție normală, deoarece ține cont de incertitudinea suplimentară care este introdusă prin estimarea abaterii standard a populației și/sau din cauza dimensiunii reduse a eșantionului.

Când dimensiunea eșantionului este mare (aproximativ 100 sau mai mult), diferența dintre cele două distribuții ( t-Studentși normal) este neglijabilă. Cu toate acestea, folosiți întotdeauna t- distribuția la calcularea intervalelor de încredere, chiar dacă dimensiunea eșantionului este mare.

În mod obișnuit, sunt raportate IC de 95%. Alte intervale de încredere pot fi calculate, cum ar fi 99% CI pentru medie.

În loc să producă o eroare standard și o valoare de tabel t- a distribuției care corespunde unei probabilități cu două cozi de 0,05, înmulțiți-o (eroarea standard) cu valoarea care corespunde unei probabilități cu două cozi de 0,01. Acesta este un interval de încredere mai larg decât cazul de 95%, deoarece reflectă încrederea crescută că intervalul include într-adevăr media populației.

Interval de încredere pentru proporție

Distribuția eșantionului de proporții are o distribuție binomială. Cu toate acestea, dacă dimensiunea eșantionului n relativ mare, atunci distribuția eșantionului a proporției este aproximativ normală cu media.

Evaluarea cu o atitudine selectivă p = r / n(Unde r- numărul de indivizi din eșantion cu cei care ne interesează trasaturi caracteristice), iar eroarea standard este estimată:

Intervalul de încredere de 95% pentru proporție este estimat:

Dacă dimensiunea eșantionului este mică (de obicei când np sau n (1-p) Mai puțin 5 ), atunci este necesar să se utilizeze distribuția binomială pentru a calcula intervalele exacte de încredere.

Rețineți că dacă p este exprimat ca procent, atunci (1-p) inlocuit de (100-p).

Interpretarea intervalelor de încredere

Când interpretăm intervalul de încredere, ne interesează următoarele întrebări:

Cât de larg este intervalul de încredere?

Un interval larg de încredere indică faptul că estimarea este imprecisă; îngust indică o estimare precisă.

Lățimea intervalului de încredere depinde de dimensiunea erorii standard, care, la rândul său, depinde de dimensiunea eșantionului și, atunci când se ia în considerare o variabilă numerică, oferă intervale de încredere mai largi pentru variabilitatea datelor decât examinarea unui set mare de date de câteva variabile.

CI include valori de interes deosebit?

Puteți verifica dacă valoarea probabilă pentru un parametru de populație se încadrează în intervalul de încredere. Dacă da, rezultatele sunt în concordanță cu această valoare probabilă. Dacă nu, atunci este puțin probabil (pentru un interval de încredere de 95%, șansa este de aproape 5%) ca parametrul să aibă această valoare.