Metode statistice de sinteză - Banca de rezumate, eseuri, rapoarte, referate și

Metode de statistică matematică

statisticii matematice este știința care se ocupă cu dezvoltarea metodelor de primire, descrierea și prelucrarea datelor experimentale pentru a examina modele de fenomene de masă aleatoare.







În statisticile matematice două domenii se pot distinge: statistici descriptive și statistici inductive (inferență statistică). Statisticile descriptive se ocupă cu acumularea, sistematizarea și prezentarea datelor experimentale într-o formă convenabilă. Statisticile inductive bazate pe aceste date face posibilă pentru a trage anumite concluzii cu privire la obiectul, care conține datele sau estimarea parametrilor acestora.

Zonele tipice ale statisticii matematice sunt:

testarea ipotezelor statistice;

Baza statisticii matematice se află o serie de concepte de bază, care sunt indispensabile pentru studiul metodelor moderne de prelucrare a datelor experimentale. Numărul de primul dintre ele poate pune conceptul de populația generală și proba.

Cu producția industrială de masă de multe ori nevoie, fără a verifica fiecare produs realizat pentru a determina dacă standardele de calitate a produselor. Deoarece numărul de produse este foarte mare, sau testarea produsului asociat cu aducerea în stare proastă, acesta este verificat un număr mic de produse. Pe baza acestui test, trebuie să dea un aviz cu privire la o întreagă serie de produse. Desigur, nu se poate argumenta că toate tranzistori de la petrecere într-un milion. Piesele sunt apt sau inapt, a verifica afară una dintre ele. Pe de altă parte, din moment ce procesul de selecție a epruvetelor și testul în sine poate fi consumatoare de timp și conduce la costuri mai mari, cantitatea de produs de testare ar trebui să fie astfel încât el a fost în măsură să dea o prezentare corectă a întregului lot de produse ca dimensiuni minime. În acest scop, vom introduce o serie de concepte.

Totalitatea obiectelor de studiu sau experimentale de date se numește populație. Noi notăm cu N numărul de obiecte sau numărul de date care compun populația generală. Valoarea N se face referire la volumul din totalul populației. Dacă N >> 1, adică N este foarte mare, este în general considerată N = Ґ.

eșantion aleatoriu sau o probă este parte a populației, ales la întâmplare de la ea. Cuvântul „la întâmplare“, înseamnă că probabilitatea de selecție a oricărui obiect al aceleiași populații generale. Aceasta este o presupunere importantă, cu toate acestea, este adesea dificil de verificat în practică.

Dimensiunea eșantionului este numărul de obiecte sau cantitatea de date care constituie eșantionul, și este notată n. În cele ce urmează vom presupune că elementele eșantionului pot fi atribuite respectiv numerică valorile x1, x2. xn. De exemplu, în timpul controlului calității se face prin tranzistoare bipolare poate fi măsurarea coeficientului de DC câștig.

2. Caracteristici numerice ale eșantionului

2.1 Proba medie

Pentru o mărime a eșantionului dat n eșantionul medie este determinată de relația

unde xi - elementele de valoare eșantionului. De obicei, este necesar pentru a descrie proprietățile statistice ale eșantionare aleatorie arbitrară, nici unul dintre ele. Aceasta înseamnă că modelul matematic, care presupune un număr suficient de mare de eșantioane de volum n. În acest caz, elementele de probă sunt considerate ca variabile aleatoare Xi, xi, valori cu o densitate de probabilitate f (x), care este densitatea de probabilitate din totalul populației. Apoi, proba înseamnă, de asemenea, o variabilă aleatoare egală

Ca și mai înainte vom nota variabilele aleatoare cu majuscule, și valorile variabilelor aleatoare - cu litere mici.

Valoarea medie a populației din care se produce proba va fi numit un mediu general și denota mx. Poate fi de așteptat ca în cazul în care dimensiunea eșantionului este semnificativă, atunci media eșantionului nu va diferă semnificativ față de media generală. Deoarece media eșantionului este o variabilă aleatoare, este posibil să se găsească speranța matematică:

Astfel, speranța de media eșantionului este egală cu media generală. În acest caz, se spune că media eșantionului este un estimator imparțială a populației înseamnă. În viitor, vom reveni la acest termen. Deoarece media eșantionului este fluctuantă variabilă aleatoare în jurul mediei generale, este de dorit să evalueze această fluctuație folosind dispersia media eșantionului. Să considerăm un eșantion al cărui volum este considerabil mai mic decât volumul n populația N (n <

Variabile aleatoare Xi și Xj (i№j) poate fi considerat independent, în consecință,

Substituind acest rezultat în formula de dispersie:

în cazul în care s2 - dispersia populației.

Din această formulă rezultă că odată cu creșterea volumului eșantionului de fluctuație mediu media eșantionului sunt reduse ca s2 generală / n. Să ilustrăm acest lucru printr-un exemplu. Să presupunem că există un semnal aleator, cu media și varianța respectiv egală cu mx = 10, s2 = 9.







Probele de semnal sunt luate la intervale de timp la distanțe egale t1, t2.

Deoarece probele sunt variabile aleatoare, atunci vom nota X lor (T1), X (t2). X (tn).

Se determină numărul de probe la estimarea abaterii standard a semnalului de așteptare nu a depășit 1% din așteptările. Deoarece mx = 10, atunci trebuie să Pe de altă parte, sau așa Rezultă astfel că n i 900 de probe.

Prin eșantionarea este important să se cunoască nu numai proba medie, dar, de asemenea, răspândirea valorilor de probă în jurul mediei eșantionului. În cazul în care media eșantionului este o estimare a mediei generale, dispersia ar trebui să fie evaluarea selectivă a varianței populației. varianța eșantionului pentru un eșantion de variabile aleatoare definite după cum urmează

Folosind această reprezentare a varianța eșantionului, constatăm că se așteaptă

Astfel, vom vedea că acest lucru înseamnă că variația eșantionului este o estimare părtinitoare a varianței populației. Pentru a obține o estimare imparțială, este necesar să se multiplica valoarea, atunci variația eșantionului este dată de

Deci, avem următorul rezultat. În cazul în care, ca urmare a variabilei aleatoare n măsurători independente de X, cu așteptări necunoscute și varianța avem nevoie de date pentru a determina acești parametri, ar trebui să utilizați următoarele estimări aproximative

Dacă este cunoscută așteptarea matematică a MX totală a populației, varianța eșantionului ar trebui să fie calculată prin formula

care, de asemenea este o estimare imparțială.

Seria statistică. Funcția de distribuție statistică

Să presupunem că există rezultate de măsurare a unui X variabilă aleatoare cu legea de distribuție necunoscută, care sunt prezentate sub formă de tabel:

Acest tabel se numește seria statistică. Numărul statistic este forma primară de înregistrare a datelor statistice și pot fi prelucrate în diverse moduri. O astfel de metodă este de a construi o prelucrare statistică a variabilei aleatoare H. Funcția de distribuție

Statistică (empirică) F * (x) funcția de distribuție se numește legea de variație a frecvenței evenimentelor X

Pentru a găsi valoarea funcției de distribuție statistică pentru un anumit x, este necesar să se contoriza numărul de experimente în care variabila aleatoare X adoptate valori mai mici decât x, și se împarte la numărul total de experimente efectuate. Funcția de distribuție statistică astfel obținută este o aproximare foarte aproximativă a funcției F (x) de distribuție a unei variabile aleatoare X, și ca atare, nu este utilizată în practică. Este într-un sens, calitativ, din care se poate emite ipoteza legii aleatoare X. variabilă Prin creșterea numărului de experimente (n ®Ґ) F * (x) converge la probabilitatea F (x). Cu toate acestea, odată cu creșterea de construcție n F * (x) devine operațiune foarte consumatoare de timp. Prin urmare, în practică, este adesea convenabil să se utilizeze o măsură statistică care aproximează distribuția densității.

Populația statistică. diagramă cu bare

Atunci când un număr mare de reprezentare a datelor observationale sub formă de serii statistice este dificil, și pentru a rezolva o serie de probleme și inadecvate. In astfel de cazuri, rezultatele count observației făcute de grupuri și în sus tabel care specifică banda de frecvență și observațiile care rezultă din fiecare grup. Pluralitatea de grupe în care rezultatele observațiilor și frecvența obținute în fiecare grup cuprind agregat statistic, care este prezentată mai jos.

O reprezentare grafică a populației statistice se numește histograma. Histograma este construit după cum urmează. Intervalele axelor absciselor corespunzând pluralitatea grupurilor și fiecare dintre ele este construit dreptunghi a cărui suprafață este egală cu frecvența grupului. Din construcție rezultă că aria suma tuturor dreptunghiurile este egal cu unu. Evident, în cazul în care histograma punct conecta fără probleme, această curbă este o primă aproximare a distribuției densității a variabilei aleatoare X.

În cazul în care numărul de încercări pentru a crește și de a selecta grupuri mai mici (intervalele de cifră mică) într-o populație statistică, histograma rezultată va fi din ce în ce mai aproape de distribuția densității X. variabilei aleatoare Agregatul statistică poate fi utilizat și F * (x) de distribuție pentru a construi o funcție aproximativă ca o variabilă aleatoare grupuri de valori limită.

5. Metoda parametrului maximă probabilitate estimările pentru identificarea distribuției densității

Metoda se bazează pe reprezentarea probabilitate maximă de n ca volumul probei cantității n-dimensional aleatoare (X1, X2 ,. Xn), unde considerate ca variabile aleatoare independente cu uniformă de distribuție densitate f (x). Distribuția densității unei variabile aleatoare n-dimensional numit funcția probabilitate L (x1, x2. Xn), care, în virtutea variabilelor aleatoare este produsul distribuțiilor de densitate ale variabilelor aleatoare X1, X2. Xn:

L (x1, x2. Xn) = f (x1) f (x2). f (xn).

Rezultă că orice funcție y = y (x1, x2. Xn) valori de exemplu de x1, x2. xn, numite statistici pot fi privite ca o variabilă aleatoare a cărei distribuție este determinată în mod unic de funcția probabilitate.

Luați în considerare metoda de a găsi estimări ale parametrilor din datele experimentale, care utilizează funcția de probabilitate.

Fie f (x; a) - distribuția densității X variabila aleatoare (populație), care depinde de parametrul a. Funcția Probabilitatea va depinde și de parametrul a, și au forma

REZUMAT Metoda de probabilitate maximă este de a găsi o astfel de valoare a parametrului, în care funcția de probabilitate L (x1, x2. Xn, a) la maximum. Pentru a face acest lucru, trebuie să rezolve ecuația

și de a găsi o valoare la care funcția L (x1, x2. xn, a) atinge un maxim. Pentru a simplifica calculele de obicei, maximiza logaritmul natural al funcției de probabilitate, folosind faptul că

În cazul în care necunoscutele sunt mai mulți parametri a1, a2. AM, atunci funcția probabilitate depinde de variabilele m L = L (x1, x2 xn; .. A1, A2, Am) și ecuațiile sunt rezolvate m

Exemplu. Lăsați unitatea de intrare primește primește suma a două semnale: Y (t) = X + Z (t), în care X - nu este semnal necunoscut dependentă de timp și Z (t) - interferență aleatoare. Timpii t1, t2. tn fabricate valoarea măsurată Y (t). Pe baza datelor experimentale (eșantionare) y1 = y (t1), y2 = y (t2). yn = y (tn), este necesar să se găsească un semnal X. valoare aproximativă

Decizie. Să Z (T1), Z (t2). Z (tn) - variabile aleatoare independente sunt în mod normal distribuite cu medie 0 și mZ = dispersie D (Z) = s2. Apoi, variabilele aleatoare sunt independente și distribuite în mod normal, cu așteptări necunoscute și cu aceeași variație s2. Densitatea de distribuție a variabilelor aleatoare Y (t1), Y (t2). Y (tn), astfel, are formă

Scriem funcția de probabilitate pentru variabila aleatoare n-dimensional (Y1, Y2 Yn.):

apoi din ecuația