Kuidas oma äri edukaks muuta
  • Kodu
  • Arvutused
  • Usaldusvahemik. Usaldusintervall keskmise (teadaoleva dispersiooni) hindamiseks EXCELis. Mis on antud tõenäosuse sigma

Usaldusvahemik. Usaldusintervall keskmise (teadaoleva dispersiooni) hindamiseks EXCELis. Mis on antud tõenäosuse sigma

Võttes üldkogumist valimi, saame meid huvitava parameetri punkthinnangu ja arvutame hinnangu täpsuse näitamiseks standardvea.

Kuid enamikul juhtudel ei ole standardviga kui selline vastuvõetav. Palju kasulikum on kombineerida see täpsusmõõt populatsiooni parameetri intervallhinnanguga.

Seda saab teha, kasutades usaldusvahemiku (CI-) arvutamiseks teadmisi valimi statistika (parameetri) teoreetilise tõenäosusjaotuse kohta. Usaldusvahemik, DI - Usaldusvahemik) parameetri jaoks.

Üldiselt usaldusvahemik laiendab hinnanguid mõlemas suunas (antud parameetri) standardvea teatud kordse võrra; kaks väärtust (usalduspiirid), mis määravad intervalli, eraldatakse tavaliselt komaga ja on sulgudes.

Statistikas on a usaldusvahemik(CI) on populatsiooni parameetri intervallhinnangu tüüp. See on vaadeldud intervall (st see arvutatakse vaatluste põhjal), mis põhimõtteliselt erineb proovide lõikes ja mis katse kordamise korral sisaldab sageli ka mittejälgitava huvipakkuva parameetri väärtust. Kui sageli vaadeldav intervall parameetrit sisaldab, määrab usaldustaseme või usalduskoefitsiendi. Konkreetsemalt tähendab mõiste "usaldustase" seda, et kui CI konstrueeritakse paljude korduvate (ja võib-olla erinevate) katsete erinevate andmeanalüüside põhjal, vastab selliste intervallide osakaal, mis sisaldab parameetri tegelikku väärtust. usalduse tase. Kui kahepoolsed usalduspiirid moodustavad usaldusvahemiku, siis nende ühepoolseid vasteid nimetatakse alumiseks/ülemiseks usalduspiiriks (või piirideks).


Usaldusvahemik näitab, millisesse vahemikku valimivaatluste (küsitluste) tulemused paiknevad. Kui viia läbi 100 identset uuringut ühest elanikkonnast pärit identsetes valimites (näiteks 100 valimit 1000 inimesest 5 miljoni elanikuga linnas), siis 95% usaldusnivoo korral langeb 95 tulemust 100st. usaldusvahemik (näiteks 28%-lt 32%-ni tegeliku väärtusega 30%). Näiteks suitsetavate linnaelanike tegelik arv on 30%. Kui valime 100 korda järjest 1000 inimest ja nendes proovides esitame küsimuse "Kas te suitsetate?", siis 95-s neist 100 proovist on 2% usaldusvahemikuga väärtus vahemikus 28% kuni 32%.

Valemid usaldusintervallide koostamiseks koos praktilisi näiteid võib leida näiteks .

Usaldusvahemike tõlgendamine

Usaldusvahemiku tõlgendamisel huvitavad meid järgmised küsimused:

Kui lai on usaldusvahemik?

Lai usaldusvahemik näitab, et hinnang on ebatäpne; kitsas näitab täpset hinnangut.
Usaldusvahemiku laius oleneb standardvea suurusest, mis omakorda sõltub valimi suurusest ja annab andmete varieeruvusest numbrilist muutujat arvesse võttes laiemad usaldusvahemikud kui suure andmehulga uuringud. vähestest muutujatest.

Kas CI sisaldab mingeid erilist huvi pakkuvaid väärtusi?

Saate kontrollida, kas populatsiooni parameetri tõenäoline väärtus jääb usaldusvahemikku. Kui jah, siis on tulemused selle tõenäolise väärtusega kooskõlas. Kui ei, siis on ebatõenäoline (95% usaldusvahemiku korral on tõenäosus peaaegu 5%), et parameetril see väärtus on. ()

Usaldusvahemik(CI; inglise keeles usaldusvahemik - CI), mis saadi valimiga tehtud uuringus, annab mõõta uuringu tulemuste täpsust (või määramatust), et teha järeldusi kõigi selliste patsientide populatsiooni (üldpopulatsiooni) kohta. ). 95% CI õige määratluse võib sõnastada järgmiselt: 95% sellistest intervallidest sisaldab populatsiooni tegelikku väärtust. See tõlgendus on mõnevõrra vähem täpne: CI on väärtuste vahemik, mille piires võite olla 95% kindel, et see sisaldab tõelist väärtust. CI kasutamisel on rõhk kvantitatiivse efekti määramisel, mitte P väärtusel, mis saadakse statistilise olulisuse testimise tulemusena. P väärtus ei hinda ühtki summat, vaid pigem mõõdab tõendite tugevust nullhüpoteesi "mõju puudumise" suhtes. P väärtus iseenesest ei ütle meile midagi erinevuse suuruse ega isegi selle suuna kohta. Seetõttu on P sõltumatud väärtused artiklites või kokkuvõtetes absoluutselt vähe informatiivsed. Seevastu CI näitab nii vahetut huvi pakkuva mõju ulatust, nagu ravi kasulikkus, kui ka tõendite tugevust. Seetõttu on DI otseselt seotud DM praktikaga.

CI-ga illustreeritud statistilise analüüsi hindamismeetodi eesmärk on mõõta huvipakkuva mõju suurust (diagnostilise testi tundlikkus, prognoositav esinemissagedus, suhtelise riski vähenemine raviga jne) ja mõõta selle mõju ebakindlust. Kõige sagedamini on CI väärtuste vahemik hinnangu mõlemal küljel, milles tõenäoline väärtus on, ja võite selles 95% kindel olla. 95% tõenäosuse kasutamise kokkulepe on meelevaldne, nagu ka P väärtus<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI põhineb ideel, et erinevate patsientide rühmadega tehtud sama uuring ei annaks identseid tulemusi, vaid nende tulemused jaguneksid tõelise, kuid tundmatu väärtuse ümber. Teisisõnu kirjeldab CI seda kui "valimist sõltuvat varieeruvust". CI ei kajasta muudest põhjustest tulenevat täiendavat ebakindlust; Eelkõige ei hõlma see patsientide valikulise kaotuse mõju jälgimisele, halba vastavust või ebatäpset tulemuste mõõtmist, pimestamise puudumist jne. Seega alahindab CI alati ebakindluse kogusummat.

Usaldusintervalli arvutamine

Tabel A1.1. Mõnede kliiniliste mõõtmiste standardvead ja usaldusvahemikud

Tavaliselt arvutatakse CI kvantitatiivse mõõdiku vaadeldud hinnangu põhjal, nagu kahe proportsiooni erinevus (d) ja selle erinevuse hinnangu standardvea (SE). Nii saadud ligikaudne 95% CI on d ± 1,96 SE. Valem muutub vastavalt tulemusnäitaja olemusele ja CI katvusele. Näiteks atsellulaarse läkaköha vaktsiini randomiseeritud platseebokontrollitud uuringus tekkis läkaköha 72-l 1670-st (4,3%) vaktsiini saanud imikul ja 240-l 1665-st (14,4%) kontrollrühmas. Protsentuaalne erinevus, mida nimetatakse absoluutse riski vähendamiseks, on 10,1%. Selle erinevuse SE on 0,99%. Vastavalt on 95% CI 10,1% + 1,96 x 0,99%, st. 8,2 kuni 12,0.

Vaatamata erinevatele filosoofilistele lähenemisviisidele on CI-d ja statistilise olulisuse testid matemaatiliselt tihedalt seotud.

Seega on P väärtus “oluline”, st. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Hinnangu määramatus (ebatäpsus), väljendatuna CI-s, on suuresti seotud valimi suuruse ruutjuurega. Väikesed valimid annavad vähem teavet kui suured valimid ja väiksemates valimites on CI-d vastavalt laiemad. Näiteks artiklis, milles võrreldi Helicobacter pylori infektsiooni diagnoosimiseks kasutatud kolme testi toimivust, teatati uurea hingamistesti tundlikkusest 95,8% (95% CI 75–100). Kuigi 95,8% näib muljetavaldav, tähendab 24 täiskasvanud H. pylori patsiendi väike valimi suurus, et selles hinnangus on märkimisväärne ebakindlus, nagu näitab lai CI. Tõepoolest, alumine piir 75% on palju madalam kui 95,8% hinnang. Kui sama tundlikkust täheldataks 240 inimesest koosnevas valimis, oleks 95% CI 92,5–98,0, mis annab suurema kindlustunde, et test on väga tundlik.

Randomiseeritud kontrollitud uuringutes (RCT) on ebaolulised tulemused (st need, mille P > 0,05) on eriti vastuvõtlikud valesti tõlgendamisele. CI on siin eriti kasulik, kuna see näitab, kui ühilduvad tulemused kliiniliselt kasuliku tegeliku toimega. Näiteks RCT-s, kus võrreldi õmblust jämesoole klambri anastomoosiga, tekkis haavainfektsioon vastavalt 10,9% ja 13,5% patsientidest (P = 0,30). Selle erinevuse 95% usaldusvahemik on 2,6% (-2 kuni +8). Isegi selles uuringus, mis hõlmas 652 patsienti, on tõenäoline, et kahest protseduurist tulenevate infektsioonide esinemissagedus on tagasihoidlik. Mida väiksem on uuring, seda suurem on ebakindlus. Sung et al. viidi läbi RCT, milles võrreldi oktreotiidi infusiooni erakorralise skleroteraapiaga ägeda veenilaiendite verejooksu korral 100 patsiendil. Oktreotiidi rühmas oli verejooksu peatamise määr 84%; skleroteraapia rühmas - 90%, mis annab P = 0,56. Pange tähele, et jätkuva verejooksu määrad on sarnased mainitud uuringu haavainfektsiooni omadega. Sel juhul on sekkumiste erinevuse 95% CI 6% (-7 kuni +19). See vahemik on üsna lai võrreldes 5% erinevusega, mis pakuks kliinilist huvi. On selge, et uuring ei välista olulist erinevust efektiivsuses. Seetõttu ei pea kindlasti paika autorite järeldus "oktreotiidi infusioon ja skleroteraapia on veenilaiendite verejooksu ravis võrdselt tõhusad". Sellistel juhtudel, kus absoluutse riski vähendamise (ARR) 95% CI sisaldab nulli, nagu siin, on NNT CI (ravimiseks vajalik arv) üsna raske tõlgendada. NLP ja selle CI saadakse ACP pöördväärtustest (korrutades need 100-ga, kui need väärtused on antud protsentides). Siin saame tuumaelektrijaama = 100: 6 = 16,6 95% CI-ga -14,3 kuni 5,3. Nagu näha tabeli joonealusest märkusest "d". A1.1, see CI sisaldab NTPP väärtusi vahemikus 5,3 kuni lõpmatuseni ja NTLP väärtusi vahemikus 14,3 kuni lõpmatuseni.

CI-sid saab koostada kõige sagedamini kasutatavate statistiliste hinnangute või võrdluste jaoks. RCT-de puhul sisaldab see erinevust keskmiste proportsioonide, suhteliste riskide, koefitsientide ja NRR-ide vahel. Samamoodi saab CI-d saada kõigi peamiste hinnangute kohta, mis on tehtud diagnostiliste testide täpsuse uuringutes – tundlikkus, spetsiifilisus, positiivne ennustav väärtus (mis kõik on lihtsad proportsioonid) ja tõenäosussuhted – hinnangud, mis on saadud metaanalüüsides ja võrdluses kontrolliga. uuringud. Personaalarvuti programm, mis katab paljusid DI kasutusviise, on saadaval ajakirja Statistics with Confidence teise väljaandega. Proportsioonide CI arvutamise makrod on Exceli ning statistikaprogrammide SPSS ja Minitab jaoks vabalt saadaval aadressil http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Ravi mõju mitmekordne hindamine

Kuigi CI-de koostamine on uuringu esmaste tulemuste jaoks soovitav, ei ole need nõutavad kõigi tulemuste jaoks. CI puudutab kliiniliselt olulisi võrdlusi. Näiteks kahe rühma võrdlemisel on õige CI see, mis on loodud rühmadevahelise erinevuse jaoks, nagu on näidatud ülaltoodud näidetes, mitte CI, mille saab koostada iga rühma hinnangu jaoks. Mitte ainult ei ole kasutu anda iga rühma hinnete jaoks eraldi CI-sid, see esitlus võib olla eksitav. Samamoodi on õige lähenemisviis ravi efektiivsuse võrdlemisel erinevates alarühmades kahe (või enama) alarühma otsene võrdlemine. On vale eeldada, et ravi on efektiivne ainult ühes alarühmas, kui selle CI välistab väärtuse, mis vastab mõju puudumisele, samas kui teised seda ei tee. CI-d on kasulikud ka mitme alarühma tulemuste võrdlemisel. Joonisel fig. A1.1 näitab eklampsia suhtelist riski preeklampsiaga naistel naiste alarühmades, kes said platseebokontrolliga magneesiumsulfaadi RCT-d.

Riis. A1.2. Forest Graph näitab veiste rotaviiruse vaktsiini 11 randomiseeritud kliinilise uuringu tulemusi kõhulahtisuse ennetamiseks võrreldes platseeboga. Kõhulahtisuse suhtelise riski hindamiseks kasutati 95% usaldusvahemikku. Musta ruudu suurus on võrdeline teabe hulgaga. Lisaks on näidatud ravi efektiivsuse kokkuvõtlik hinnang ja 95% usaldusvahemik (tähistatud rombiga). Metaanalüüsis kasutati juhuslike mõjude mudelit, mis ületab mõned eelnevalt kehtestatud mudelid; näiteks võib see olla valimi suuruse arvutamisel kasutatud suurus. Rangema kriteeriumi kohaselt peab kogu CI-de vahemik näitama kasu, mis ületab eelnevalt kindlaksmääratud miinimumi.

Oleme juba arutanud ekslikkust pidada statistilise olulisuse puudumist näitajaks, et kaks ravi on võrdselt tõhusad. Sama oluline on mitte samastada statistilist olulisust kliinilise tähtsusega. Kliinilist tähtsust võib eeldada, kui tulemus on statistiliselt oluline ja ravivastuse ulatus

Uuringud võivad näidata, kas tulemused on statistiliselt olulised ja millised on kliiniliselt olulised ja millised mitte. Joonisel fig. A1.2 näitab nelja katse tulemusi, mille puhul kogu CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Enamiku lihtsate mõõtmiste puhul on nn juhuslike vigade tavaseadus üsna hästi täidetud ( Gaussi seadus), mis tuleneb järgmistest empiirilistest sätetest.

1) mõõtmisvead võivad võtta pideva väärtuste jada;

2) suure hulga mõõtmiste korral esinevad võrdselt sageli ühesuurused, kuid erineva märgiga vead,

3) mida suurem on juhuslik viga, seda väiksem on selle esinemise tõenäosus.

Gaussi normaaljaotuse graafik on näidatud joonisel 1. Kõvera võrrandil on vorm

kus on juhuslike vigade (vigade) jaotusfunktsioon, mis iseloomustab vea tõenäosust, σ on ruutkeskmine viga.

Väärtus σ ei ole juhuslik suurus ja iseloomustab mõõtmisprotsessi. Kui mõõtmistingimused ei muutu, siis σ jääb konstantseks. Selle suuruse ruutu nimetatakse mõõtmiste hajutamine. Mida väiksem on dispersioon, seda väiksem on üksikute väärtuste levik ja seda suurem on mõõtmise täpsus.

Ruutkeskmise vea σ täpne väärtus, samuti mõõdetud suuruse tegelik väärtus, pole teada. Selle parameetri kohta on olemas nn statistiline hinnang, mille järgi keskmine ruutviga võrdub aritmeetilise keskmise keskmise ruutveaga. Mille väärtus määratakse valemiga

kus on tulemus i-th mõõde; - saadud väärtuste aritmeetiline keskmine; n on mõõtmiste arv.

Mida suurem on mõõtmiste arv, seda väiksem ja rohkem see läheneb σ-le. Kui mõõdetud suuruse μ tegelik väärtus, selle mõõtmiste tulemusel saadud aritmeetiline keskmine väärtus ja juhuslik absoluutviga , siis kirjutatakse mõõtmistulemus kujul .

Väärtuste intervalli vahemikus kuni , millesse mõõdetud suuruse μ tegelik väärtus langeb, nimetatakse usaldusvahemik. Kuna tegemist on juhusliku muutujaga, langeb tegelik väärtus tõenäosusega α usaldusvahemikku, mida nimetatakse usalduse tõenäosus, või usaldusväärsus mõõdud. See väärtus on arvuliselt võrdne varjutatud kõverjoonelise trapetsi pindalaga. (vaata pilti.)

Kõik see kehtib piisavalt suure arvu mõõtmiste kohta, kui see on σ lähedal. Usaldusvahemiku ja usaldusnivoo leidmiseks väikesele arvule mõõtmistele, millega laboritööde käigus tegeleme, kasutame Õpilase tõenäosusjaotus. See on juhusliku suuruse tõenäosusjaotus nimega Üliõpilaste koefitsient, annab usaldusvahemiku väärtuse aritmeetilise keskmise ruutkeskmise vea murdosades.


Selle suuruse tõenäosusjaotus ei sõltu σ 2-st, vaid sõltub sisuliselt katsete arvust n. Eksperimentide arvu suurenemisega n Studenti jaotus kaldub Gaussi jaotusele.

Jaotusfunktsioon on tabelina (tabel 1). Studenti koefitsiendi väärtus on mõõtmiste arvule vastava sirge lõikepunktis n ja veerg, mis vastab usaldustasemele α

Oletame, et meil on suur hulk esemeid, millel on mõne tunnuse normaaljaotus (näiteks täisladu sama tüüpi köögivilju, mille suurus ja kaal on erinevad). Tahad teada kogu kaubapartii keskmisi omadusi, kuid sul pole ei aega ega tahtmist iga köögivilja mõõtmiseks ja kaalumiseks. Saate aru, et see pole vajalik. Aga mitu tükki oleks vaja pisteliseks kontrolliks võtta? Enne mõne selle olukorra jaoks kasulike valemite esitamist tuletame meelde mõningaid tähistusi. Esiteks, kui me mõõdaksime kogu köögiviljaladu (seda elementide kogumit nimetatakse üldkogumiks), siis saaksime kogu meie käsutuses oleva täpsusega teada kogu partii massi keskmise väärtuse. Nimetagem seda keskmiseks X keskmine geen. - üldine keskmine. Me juba teame, mis on täielikult määratud, kui selle keskmine väärtus ja hälve s on teada. Tõsi, me ei tea siiani ei X keskmist geeni ega üldpopulatsiooni s-i. Saame võtta ainult mõne proovi, mõõta vajalikud väärtused ja arvutada selle valimi jaoks nii keskmise väärtuse X avg. kui ka standardhälbe S vyb. On teada, et kui meie valimikontroll sisaldab suurt hulka elemente (tavaliselt n rohkem kui 30) ja need on võetud tõesti juhuslikult, siis üldkogumi s peaaegu ei erine S valimitest. normaaljaotuse korral saame kasutada järgmisi valemeid:

95% tõenäosusega

99% tõenäosusega

.

Üldiselt tõenäosusega Р(t)

Seos t väärtuse ja tõenäosuse väärtuse P(t) vahel, millega tahame teada usaldusvahemikku, saab võtta järgmisest tabelist:

P(t) 0,683 0,950 0,954 0,990 0,997
t 1,00 1,96 2,00 2,58 3,00

Seega oleme kindlaks teinud, millises vahemikus on üldkogumi keskmine väärtus (antud tõenäosusega).

Kui meil pole piisavalt suurt valimit, ei saa me väita, et populatsioonis on s = S valimid. Lisaks on sel juhul problemaatiline valimi lähedus normaaljaotusele. Sel juhul kasutage valemis s asemel ka S s:

kuid t väärtus fikseeritud tõenäosuse korral P(t) sõltub elementide arvust valimis n. Mida suurem n, seda lähemal on saadud usaldusvahemik valemiga (1) antud väärtusele. Sel juhul on t väärtused võetud teisest tabelist (õpilase t-test), mille pakume allpool:

Studenti t-testi väärtused tõenäosusele 0,95 ja 0,99 

n P n P
0.95 0.99 0.95 0.99
2 12.71 63.66 18 2.11 2.90
3 4.30 9.93 19 2.10 2.88
4 3.18 5.84 20 2.093 2.861
5 2.78 4.60 25 2.064 2.797
6 2.57 4.03 30 2.045 2.756
7 2.45 3.71 35 2.032 2.720
8 2.37 3.50 40 2.022 2.708
9 2.31 3.36 45 2.016 2.692
10 2.26 3.25 50 2.009 2.679
11 2.23 3.17 60 2.001 2.662
12 2.20 3.11 70 1.996 2.649
13 2.18 3.06 80 1.991 2.640
14 2.16 3.01 90 1.987 2.633
15 2.15 2.98 100 1.984 2.627
16 2.13 2.95 120 1.980 2.617
17 2.12 2.92 >120 1.960 2.576

Näide 3 Ettevõtte töötajate hulgast valiti juhuslikult 30 inimest. Valimi põhjal selgus, et keskmine palk (kuus) on 10 tuhat rubla keskmise ruuthälbega 3 tuhat rubla. Tõenäosusega 0,99 määrake ettevõtte keskmine palk. Lahendus: Tingimuse järgi on meil n = 30, X vrd. = 10000, S = 3000, P = 0,99. Usaldusvahemiku leidmiseks kasutame Studenti kriteeriumile vastavat valemit. Tabeli järgi n \u003d 30 ja P \u003d 0,99 leiame t \u003d 2,756, seega

need. soovitud usaldusvahemik 27484< Х ср.ген < 32516.

Seega võib tõenäosusega 0,99 väita, et intervall (27484; 32516) sisaldab ettevõtte keskmist palka.
Loodame, et kasutate seda meetodit ilma, et teil oleks iga kord arvutustabelit kaasas. Arvutused saab teha automaatselt Excelis. Kui olete Exceli failis, klõpsake ülemises menüüs nuppu fx. Seejärel valige funktsioonide hulgast tüüp "statistiline" ja kastis pakutavast loendist - STEUDRASP. Seejärel sisestage viibale kursori väljale "tõenäosus" vastastikuse tõenäosuse väärtus (see tähendab, et meie puhul peate tõenäosuse 0,95 asemel sisestama tõenäosuse 0,05). Ilmselt on tabel koostatud nii, et tulemus vastab küsimusele, kui suure tõenäosusega võime eksida. Samamoodi sisestage väljale "vabadusaste" oma valimi väärtus (n-1).

Sellest artiklist saate teada:

    Mida usaldusvahemik?

    Mis mõte sellel on 3 sigma reeglit?

    Kuidas neid teadmisi praktikas rakendada?

Tänapäeval teabe ülekülluse tõttu, mis on seotud suure tootevaliku, müügisuundade, töötajate, tegevuste jms. peamist on raske välja tuua, mille haldamiseks tasub ennekõike tähelepanu pöörata ja pingutada. Definitsioon usaldusvahemik ja tegelike väärtuste piiridest väljumise analüüs – tehnika, mis aitab teil olukordi tuvastada, trendide mõjutamine. Saate arendada positiivseid tegureid ja vähendada negatiivsete mõju. Seda tehnoloogiat kasutatakse paljudes tuntud maailma ettevõtetes.

Seal on nö hoiatused", mis teavitada juhte märkides, et järgmine väärtus teatud suunas läks kaugemale usaldusvahemik. Mida see tähendab? See on signaal, et on toimunud mõni ebastandardne sündmus, mis võib olemasolevat trendi selles suunas muuta. See on signaal sellele seda korda ajada olukorras ja mõista, mis seda mõjutas.

Näiteks kaaluge mitut olukorda. Oleme arvutanud müügiprognoosi koos prognoosipiiridega 100 kaubaartiklile 2011. aastaks kuude lõikes ja tegelik müük märtsis:

  1. "Päevalilleõli" puhul murdsid nad läbi prognoosi ülemise piiri ega langenud usaldusvahemikku.
  2. "Kuivpärmi" puhul ületas prognoosi alampiiri.
  3. Saatel "Kaerahelbepuder" murdis ülemise piiri.

Ülejäänud kaupade puhul jäi tegelik müük etteantud prognoosi piiridesse. Need. nende müük vastas ootustele. Niisiis tuvastasime 3 toodet, mis väljusid piiridest, ja hakkasime välja mõtlema, mis mõjutas piiridest väljumist:

  1. Päevalilleõliga sisenesime uude kauplemisvõrgustikku, mis andis meile täiendava müügimahu, mis viis ülempiiri ületamiseni. Selle toote puhul tasub prognoos ümber arvutada kuni aasta lõpuni, võttes arvesse selle ketti müügi prognoosi.
  2. Kuivpärmi jaoks jäi auto tollis kinni ja 5 päeva jooksul tekkis defitsiit, mis mõjutas müügi langust ja alumisest piirist kaugemale minekut. Võib-olla tasub välja selgitada, mis selle põhjuse põhjustas, ja püüda seda olukorda mitte korrata.
  3. Kaerajahu puhul käivitati müügiedendus, mille tulemusel müük kasvas oluliselt ja prognoosist ületati.

Tuvastasime 3 tegurit, mis mõjutasid prognoosi ületamist. Elus võib neid olla palju rohkem.Et parandada prognoosimise ja planeerimise täpsust, tegurid, mis viivad selleni, et tegelik müük võib prognoositust kaugemale minna, tasub nende kohta eraldi esile tõsta ja koostada prognoosid ja plaanid. Ja seejärel võtke arvesse nende mõju peamisele müügiprognoosile. Samuti saate regulaarselt hinnata nende tegurite mõju ja muuta olukorda paremaks vähendades negatiivsete mõju ja suurendades positiivsete tegurite mõju.

Usaldusvahemikuga saame:

  1. Tõstke esile sihtkohad, millele tasub tähelepanu pöörata, sest nendes piirkondades on toimunud sündmusi, mis võivad mõjutada trendi muutus.
  2. Määrake tegurid mis tegelikult muudavad.
  3. Aktsepteerima kaalutud otsus(näiteks hangete kohta, planeerimisel jne).

Nüüd vaatame, mis on usaldusvahemik ja kuidas seda näite abil Excelis arvutada.

Mis on usaldusvahemik?

Usaldusvahemik on prognoosi piirid (ülemine ja alumine), mille sees etteantud tõenäosusega (sigma) saada tegelikud väärtused.

Need. arvutame prognoosi - see on meie peamine võrdlusalus, kuid mõistame, et tegelikud väärtused ei ole tõenäoliselt 100% võrdsed meie prognoosiga. Ja tekib küsimus mil määral võib saada tegelikke väärtusi, kui praegune trend jätkub? Ja see küsimus aitab meil vastata usaldusvahemiku arvutamine, st. - prognoosi ülemine ja alumine piir.

Mis on antud tõenäosuse sigma?

Arvutamisel usaldusvahemik, mida saame määra tõenäosus tabamust tegelikud väärtused etteantud prognoosi piirides. Kuidas seda teha? Selleks määrame sigma väärtuse ja kui sigma on võrdne:

    3 sigmat- siis on tõenäosus saada usaldusvahemikus järgmine tegelik väärtus 99,7% või 300 kuni 1 või on 0,3% tõenäosus ületada piire.

    2 sigmat- siis on tõenäosus piirides järgmise väärtuse tabamiseks ≈ 95,5%, st. koefitsient on umbes 20:1 ehk on 4,5% tõenäosus piiridest välja minna.

    1 sigma- siis on tõenäosus ≈ 68,3%, s.o. tõenäosus on umbes 2:1 või on 31,7% tõenäosus, et järgmine väärtus jääb usaldusvahemikust väljapoole.

Sõnastasime 3 Sigma reegel,mis seda ütleb tabamuse tõenäosus teine ​​juhuslik väärtus usaldusvahemikku etteantud väärtusega kolm sigmat on 99,7%.

Suur vene matemaatik Tšebõšev tõestas teoreemi, et kolme sigma väärtusega prognoosi piiridest väljumise tõenäosus on 10%. Need. tõenäosus langeda 3 sigma usaldusvahemikku on vähemalt 90%, samas kui katse prognoosi ja selle piire "silma järgi" arvutada on täis palju olulisemaid vigu.

Kuidas iseseisvalt Excelis usaldusvahemikku arvutada?

Vaatleme usaldusvahemiku arvutamist Excelis (st prognoosi ülemist ja alumist piiri) näite varal. Meil on aegrida - müük kuude lõikes 5 aasta jooksul. Vaata lisatud faili.

Prognoosi piiride arvutamiseks arvutame:

  1. Müügiprognoos().
  2. Sigma – standardhälve prognoosimudelid tegelikest väärtustest.
  3. Kolm sigmat.
  4. Usaldusvahemik.

1. Müügiprognoos.

=(RC[-14] (andmed aegridades)-RC[-1] (mudeli väärtus))^2 (ruudus)


3. Summeerige iga kuu kõrvalekalded 8. etapist Sum((Xi-Ximod)^2), s.o. Võtame jaanuari, veebruari... iga aasta kohta kokku.

Selleks kasutage valemit =SUMIF()

SUMIF(massiiv tsüklis olevate perioodide arvuga (kuude jaoks 1 kuni 12); viide perioodi numbrile tsüklis; viide massiivile algandmete ja tsükli väärtuste erinevuse ruutudega perioodid)


4. Arvutage tsükli iga perioodi standardhälve vahemikus 1 kuni 12 (etapp 10 lisatud failis).

Selleks eraldame etapis 9 arvutatud väärtusest juure ja jagame selle tsükli perioodide arvuga miinus 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

Kasutame Excelis valemeid =ROOT(R8 (viide (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (viide tsüklinumbritega massiivile); O8 (viide konkreetsele tsükli numbrile, mida kaalume massiivis))-1))

Exceli valemi kasutamine = COUNTIF loeme arvu n


Arvutades prognoosimudeli tegelike andmete standardhälbe, saime iga kuu sigma väärtuse - etapp 10 lisatud failis.

3. Arvutage 3 sigmat.

11. etapis määrame sigmade arvu - meie näites "3" (etapp 11 lisatud failis):

Samuti praktilised sigma väärtused:

1,64 sigmat – 10% tõenäosus ületada piirmäära (1 võimalus 10-st);

1,96 sigmat – 5% võimalus piiridest välja tulla (1 võimalus 20-st);

2,6 sigmat – 1% tõenäosus piiridest välja minna (1 100-st).

5) Arvutame kolm sigmat, selleks korrutame iga kuu "sigma" väärtused "3-ga".

3. Määrake usaldusvahemik.

  1. Prognoosi ülempiir- kasvu ja hooajalisust arvestav müügiprognoos + (pluss) 3 sigmat;
  2. Alumine prognoosi piir- kasvu ja hooajalisust arvestav müügiprognoos - (miinus) 3 sigmat;

Usaldusintervalli pikema perioodi (vt lisatud faili) arvutamise mugavuse huvides kasutame Exceli valemit =Y8+VLOOKUP(W8;$U$8:$V$19;2;0), kus

Y8- müügiprognoos;

W8- kuu number, mille jaoks võtame 3 sigma väärtuse;

Need. Prognoosi ülempiir= "müügiprognoos" + "3 sigmat" (näites VLOOKUP(kuu number; tabel 3 sigma väärtusega; veerg, millest eraldame vastava rea ​​kuu numbriga võrdse sigma väärtuse; 0)).

Alumine prognoosi piir= "müügiprognoos" miinus "3 sigmat".

Niisiis, oleme Excelis arvutanud usaldusintervalli.

Nüüd on meil prognoos ja vahemik piiridega, millesse tegelikud väärtused antud tõenäosuse sigmaga langevad.

Selles artiklis vaatlesime, mis on sigma ja kolme sigma reegel, kuidas määrata usaldusvahemikku ja milleks saate seda tehnikat praktikas kasutada.

Täpsed prognoosid ja edu teile!

Kuidas Forecast4AC PRO võib teid aidatausaldusvahemiku arvutamisel?:

    Forecast4AC PRO arvutab automaatselt prognoosi ülemise või alumise piiri korraga rohkem kui 1000 aegrea jaoks;

    Võimalus analüüsida prognoosi piire võrreldes prognoosi, trendi ja tegeliku müügiga diagrammil ühe klahvivajutusega;

Forcast4AC PRO programmis on võimalik määrata sigma väärtus vahemikus 1 kuni 3.

Liitu meiega!

Laadige alla tasuta prognoosimise ja äriteabe rakendused:


  • Novo Forecast Lite- automaatne prognoosi arvutamine sisse excel.
  • 4analytics- ABC-XYZ analüüs ja heitkoguste analüüsi Excel.
  • Qlik Sense Töölaud ja Qlik ViewPersonal Edition – BI-süsteemid andmete analüüsiks ja visualiseerimiseks.

Testige tasuliste lahenduste funktsioone:

  • Novo Forecast PRO- prognoosimine Excelis suurte andmemassiivide jaoks.

Peamised seotud artiklid