MS EXCEL-də ortanın (dispersiya məlumdur) qiymətləndirilməsi üçün etibarlılıq intervalı. Etibar intervalı

💖 Bəyəndinizmi? Linki dostlarınızla paylaşın

Çox vaxt qiymətləndirici qiymətləndirilən əmlakın yerləşdiyi seqmentin daşınmaz əmlak bazarını təhlil etməlidir. Bazar inkişaf edərsə, təqdim olunan obyektlərin bütün dəstini təhlil etmək çətin ola bilər, buna görə də təhlil üçün obyektlərin nümunəsi istifadə olunur. Bu nümunə həmişə homojen olmur; bəzən onu həddindən artıq yüksək və ya çox aşağı bazar təkliflərindən təmizləmək lazımdır. Bu məqsədlə istifadə olunur etimad intervalı. Bu tədqiqatın məqsədi estimatica.pro sistemində müxtəlif nümunələrlə işləyərkən etibarlılıq intervalının hesablanması üçün iki metodun müqayisəli təhlilini aparmaq və optimal hesablama variantını seçməkdir.

Etibar intervalı, məlum ehtimalla ümumi əhalinin təxmin edilən parametrini ehtiva edən bir nümunə əsasında hesablanmış atribut dəyərlərinin intervalıdır.

Etibar intervalının hesablanmasının məqsədi nümunə məlumatlarına əsaslanaraq belə bir intervalın qurulmasıdır ki, təxmin edilən parametrin qiymətinin bu intervalda olması verilmiş ehtimalla ifadə olunsun. Başqa sözlə, etimad intervalı müəyyən bir ehtimalla təxmin edilən dəyərin naməlum dəyərini ehtiva edir. Aralıq nə qədər geniş olarsa, qeyri-dəqiqlik də bir o qədər yüksək olar.

Etibar intervalını təyin etmək üçün müxtəlif üsullar mövcuddur. Bu yazıda 2 üsula baxacağıq:

  • median və standart sapma vasitəsilə;
  • t-statistikanın kritik dəyəri vasitəsilə (Tələbə əmsalı).

CI hesablanması üçün müxtəlif üsulların müqayisəli təhlilinin mərhələləri:

1. məlumat nümunəsini formalaşdırmaq;

2. biz onu statistik üsullarla emal edirik: orta qiymət, medianı, dispersiyanı və s. hesablayırıq;

3. etimad intervalını iki üsulla hesablamaq;

4. təmizlənmiş nümunələri və nəticədə etimad intervallarını təhlil edin.

Mərhələ 1. Məlumatların seçilməsi

Nümunə estimatica.pro sistemindən istifadə etməklə formalaşdırılıb. Nümunəyə 3-cü qiymət zonasında “Xruşovka” tipli 1 otaqlı mənzillərin satışı üzrə 91 təklif daxil edilmişdir.

Cədvəl 1. İlkin nümunə

Qiymət 1 kv.m., vahid

Şəkil 1. İlkin nümunə



Mərhələ 2. İlkin nümunənin emalı

Statistik metodlardan istifadə edərək nümunənin işlənməsi aşağıdakı dəyərlərin hesablanmasını tələb edir:

1. Arifmetik orta

2. Median nümunəni xarakterizə edən rəqəmdir: nümunə elementlərinin tam yarısı mediandan böyük, digər yarısı mediandan kiçikdir

(tək sayda dəyərləri olan nümunə üçün)

3. Aralıq - nümunədəki maksimum və minimum dəyərlər arasındakı fərq

4. Variasiya - verilənlərin dəyişməsini daha dəqiq qiymətləndirmək üçün istifadə olunur

5. Nümunə standart sapması (bundan sonra - SD) arifmetik orta ətrafında düzəliş qiymətlərinin yayılmasının ən ümumi göstəricisidir.

6. Dəyişmə əmsalı - tənzimləmə qiymətlərinin səpilmə dərəcəsini əks etdirir

7. salınma əmsalı - nümunədə ifrat qiymət dəyərlərinin orta qiymət ətrafında nisbi dəyişməsini əks etdirir

Cədvəl 2. Orijinal nümunənin statistik göstəriciləri

Məlumatların homojenliyini xarakterizə edən variasiya əmsalı 12,29%, lakin salınım əmsalı çox yüksəkdir. Beləliklə, orijinal nümunənin homojen olmadığını söyləyə bilərik, ona görə də inam intervalının hesablanmasına keçək.

Mərhələ 3. Etibar intervalının hesablanması

Metod 1. Median və standart kənarlaşmadan istifadə edərək hesablama.

Etibar intervalı aşağıdakı kimi müəyyən edilir: minimum dəyər - standart kənarlaşma mediandan çıxarılır; maksimum dəyər - mediana standart sapma əlavə olunur.

Beləliklə, etimad intervalı (47179 CU; 60689 CU)

düyü. 2. Etibar intervalına düşən dəyərlər 1.



Metod 2. t-statistikasının kritik qiymətindən istifadə etməklə inam intervalının qurulması (Tələbə əmsalı)

S.V. Qribovski "Əmlak dəyərinin qiymətləndirilməsi üçün riyazi üsullar" kitabında Tələbə əmsalından istifadə edərək etibarlılıq intervalının hesablanması üsulunu təsvir edir. Bu metoddan istifadə edərək hesablama apararkən, qiymətləndirici özü etimad intervalının qurulacağı ehtimalını təyin edən ∝ əhəmiyyət səviyyəsini təyin etməlidir. Tipik olaraq, 0,1 əhəmiyyət səviyyələri istifadə olunur; 0,05 və 0,01. Onlar 0,9 etibarlılıq ehtimallarına uyğundur; 0,95 və 0,99. Bu üsulla riyazi gözləntilərin və dispersiyaların həqiqi dəyərlərinin praktiki olaraq məlum olmadığı qəbul edilir (bu, praktiki qiymətləndirmə məsələlərini həll edərkən demək olar ki, həmişə doğrudur).

Etibar intervalı düsturu:

n - nümunənin ölçüsü;

Xüsusi statistik cədvəllərdən və ya MS Excel-dən (→"Statistik"→ STUDIST) istifadə etməklə müəyyən edilən t-statistikanın (Tələbə paylanması) əhəmiyyət səviyyəsi ∝ ilə kritik qiyməti, sərbəstlik dərəcələrinin sayı n-1;

∝ - əhəmiyyətlilik səviyyəsi, ∝=0,01 qəbul edin.

düyü. 2. Etibar intervalına düşən dəyərlər 2.

Mərhələ 4. Etibar intervalının hesablanması üçün müxtəlif üsulların təhlili

Etibar intervalının hesablanmasının iki üsulu - median və Student əmsalı vasitəsilə - intervalların fərqli qiymətlərinə səbəb oldu. Müvafiq olaraq, iki fərqli təmizlənmiş nümunə aldıq.

Cədvəl 3. Üç nümunə üçün statistika.

indeks

İlkin nümunə

1 seçim

Seçim 2

Orta dəyər

Dispersiya

Coef. varyasyonlar

Coef. salınımlar

İstifadəyə verilmiş obyektlərin sayı, ədəd.

Görülən hesablamalara əsaslanaraq deyə bilərik ki, müxtəlif üsullarla əldə edilən inam intervalı dəyərləri kəsişir, buna görə qiymətləndiricinin istəyi ilə hesablama metodlarından hər hansı birini istifadə edə bilərsiniz.

Bununla belə, hesab edirik ki, estimatica.pro sistemində işləyərkən bazarın inkişaf dərəcəsindən asılı olaraq etimad intervalının hesablanması metodunu seçmək məsləhətdir:

  • bazar inkişaf etməmişdirsə, orta və standart kənarlaşmadan istifadə edərək hesablama metodundan istifadə edin, çünki bu vəziyyətdə təqaüdə çıxan obyektlərin sayı azdır;
  • bazar inkişaf edirsə, böyük bir ilkin nümunə yaratmaq mümkün olduğundan, hesablamanı t-statistikasının kritik dəyəri (Tələbə əmsalı) vasitəsilə tətbiq edin.

Məqalənin hazırlanmasında aşağıdakılardan istifadə edilmişdir:

1. Qribovski S.V., Sivets S.A., Levykina I.A. Əmlakın dəyərinin qiymətləndirilməsinin riyazi üsulları. Moskva, 2014

2. Sistem məlumatları estimatica.pro

Və digərləri onların nəzəri analoqlarının təxminləridir, əgər nümunə yox, ümumi əhali mövcud olsaydı. Ancaq təəssüf ki, ümumi əhali çox bahalı və çox vaxt əlçatmazdır.

Intervalların qiymətləndirilməsi anlayışı

Hər hansı bir nümunə təxmininin bəzi yayılması var, çünki müəyyən bir nümunədəki dəyərlərdən asılı olaraq təsadüfi dəyişəndir. Buna görə də, daha etibarlı statistik nəticələr əldə etmək üçün yalnız nöqtə qiymətləndirməsini deyil, həm də yüksək ehtimalı olan intervalı bilmək lazımdır. γ (qamma) qiymətləndirilən göstəricini əhatə edir θ (teta).

Formal olaraq bunlar iki belə dəyərdir (statistika) T 1 (X)T 2 (X), Nə T 1< T 2 , bunun üçün verilmiş ehtimal səviyyəsində γ şərt yerinə yetirilir:

Bir sözlə, ehtimal olunur γ və ya daha çox həqiqi göstərici ballar arasındadır T 1 (X)T 2 (X), bunlar aşağı və yuxarı sərhədlər adlanır etimad intervalı.

Etibar intervallarının qurulması şərtlərindən biri onun maksimum darlığıdır, yəni. mümkün qədər qısa olmalıdır. İstək tamamilə təbiidir, çünki... tədqiqatçı istədiyi parametrin yerini daha dəqiq lokallaşdırmağa çalışır.

Buradan belə nəticə çıxır ki, etimad intervalı paylanmanın maksimum ehtimallarını əhatə etməlidir. və qiymətləndirmənin özü mərkəzdə olmalıdır.

Yəni yuxarıya doğru kənarlaşma ehtimalı (əsl göstəricinin təxmindən aşağıya doğru sapma ehtimalına bərabərdir. Onu da qeyd etmək lazımdır ki, asimmetrik paylanmalar üçün sağdakı interval soldakı intervala bərabər deyil.

Yuxarıdakı rəqəm aydın şəkildə göstərir ki, etimad ehtimalı nə qədər böyükdürsə, interval daha genişdir - birbaşa əlaqə.

Bu, naməlum parametrlərin interval qiymətləndirilməsi nəzəriyyəsinə qısa bir giriş idi. Gəlin riyazi gözlənti üçün etimad hədlərini tapmağa davam edək.

Riyazi gözləmə üçün etimad intervalı

Əgər orijinal məlumatlar üzərində paylanmışdırsa, onda orta normal dəyər olacaqdır. Bu, normal dəyərlərin xətti birləşməsinin də normal paylanmaya malik olması qaydasından irəli gəlir. Beləliklə, ehtimalları hesablamaq üçün normal paylanma qanununun riyazi aparatından istifadə edə bilərik.

Bununla belə, bunun üçün iki parametrin - gözlənti və variasiyanın bilməsi tələb olunur, bunlar adətən məlum deyil. Siz, əlbəttə ki, parametrlər əvəzinə təxminlərdən istifadə edə bilərsiniz (arifmetik orta və ), lakin sonra orta göstəricinin paylanması tamamilə normal olmayacaq, aşağıya doğru bir az yastılaşacaq. Bu faktı irlandiyalı vətəndaş Uilyam Qosset 1908-ci il mart tarixli Biometrika jurnalında öz kəşfini dərc edərək ağıllı şəkildə qeyd etdi. Məxfilik məqsədilə Qosset özünü Tələbə imzaladı. Tələbə t-paylanması belə ortaya çıxdı.

Bununla belə, K.Qaussun astronomik müşahidələrdəki səhvləri təhlil edərkən istifadə etdiyi məlumatların normal paylanması yer həyatında olduqca nadirdir və müəyyən etmək olduqca çətindir (yüksək dəqiqlik üçün təxminən 2 min müşahidə lazımdır). Buna görə də, normallıq fərziyyəsindən imtina etmək və ilkin məlumatların paylanmasından asılı olmayan üsullardan istifadə etmək daha yaxşıdır.

Sual yaranır: naməlum paylanmanın məlumatlarından hesablanırsa, arifmetik ortanın paylanması nədir? Cavab ehtimal nəzəriyyəsində məşhur olanlar tərəfindən verilir Mərkəzi limit teoremi(CPT). Riyaziyyatda bunun bir neçə variantı var (təkliflər illər ərzində təkmilləşib), lakin onların hamısı, kobud desək, çoxlu sayda müstəqil təsadüfi dəyişənlərin cəminin normal paylanma qanununa tabe olduğu ifadəsinə qədər qaynayır.

Arifmetik orta hesablanarkən təsadüfi dəyişənlərin cəmindən istifadə edilir. Buradan belə çıxır ki, arifmetik orta normal paylanmaya malikdir, burada gözlənti ilkin verilənlərin gözləntisidir, dispersiya isə .

Ağıllı insanlar CLT-ni necə sübut etməyi bilirlər, lakin biz bunu Excel-də aparılan təcrübənin köməyi ilə yoxlayacağıq. Gəlin 50 bərabər paylanmış təsadüfi dəyişən nümunəsini simulyasiya edək (Excel RANDBETWEEN funksiyasından istifadə etməklə). Sonra 1000 belə nümunə düzəldəcəyik və hər birinin arifmetik ortasını hesablayacağıq. Onların paylanmasına baxaq.

Ortanın paylanmasının normal qanuna yaxın olduğunu görmək olar. Nümunə ölçüsü və sayı daha da böyük olarsa, oxşarlıq daha da yaxşı olar.

İndi biz CLT-nin etibarlılığını öz gözlərimizlə gördükdən istifadə edərək, həqiqi orta və ya verilmiş ehtimalla riyazi gözləntiləri əhatə edən arifmetik orta üçün etimad intervallarını hesablaya bilərik.

Yuxarı və aşağı hədləri təyin etmək üçün normal paylanmanın parametrlərini bilmək lazımdır. Bir qayda olaraq, heç biri yoxdur, buna görə təxminlər istifadə olunur: arifmetik ortanümunə fərqi. Təkrar edirəm, bu üsul yalnız böyük nümunələrlə yaxşı yaxınlaşma verir. Nümunələr kiçik olduqda, çox vaxt Tələbə paylanmasından istifadə etmək tövsiyə olunur. Buna inanma! Orta üçün Tələbə paylanması yalnız orijinal verilənlər normal şəkildə paylandıqda baş verir, yəni demək olar ki, heç vaxt. Buna görə də, dərhal tələb olunan məlumatların miqdarı üçün minimum bar təyin etmək və asimptotik olaraq düzgün üsullardan istifadə etmək daha yaxşıdır. Deyirlər ki, 30 müşahidə kifayətdir. 50 götürün - səhv etməyəcəksiniz.

T 1.2– etimad intervalının aşağı və yuxarı hədləri

– nümunə arifmetik orta

s 0– nümunənin standart sapması (qərəzsiz)

n - nümunə ölçüsü

γ - etibarlılıq ehtimalı (adətən 0,9, 0,95 və ya 0,99-a bərabərdir)

c γ =Φ -1 ((1+γ)/2)– standart normal paylanma funksiyasının tərs qiyməti. Sadəcə olaraq, bu arifmetik ortadan aşağı və ya yuxarı həddə qədər standart səhvlərin sayıdır (bu üç ehtimal 1.64, 1.96 və 2.58 dəyərlərinə uyğundur).

Düsturun mahiyyəti ondan ibarətdir ki, arifmetik orta alınır və sonra ondan müəyyən məbləğ kənara qoyulur ( γ ilə) standart xətalar ( s 0 /√n). Hər şey məlumdur, götürün və düşünün.

Fərdi kompüterlərdən geniş istifadə olunmazdan əvvəl onlar normal paylanma funksiyasının qiymətlərini və onun tərsini almaq üçün istifadə edirdilər. Onlar bu gün də istifadə olunur, lakin hazır Excel formullarından istifadə etmək daha effektivdir. Yuxarıdakı düsturdan ( , və ) bütün elementləri Excel-də asanlıqla hesablamaq olar. Ancaq etimad intervalını hesablamaq üçün hazır bir düstur var - TRUST.NORM. Onun sintaksisi aşağıdakı kimidir.

CONFIDENCE.NORM(alfa;standart_off;ölçü)

alfa– yuxarıda qəbul edilmiş qeyddə 1- γ-a bərabər olan əhəmiyyət səviyyəsi və ya etimad səviyyəsi, yəni. riyazi olması ehtimalıgözlənti etimad intervalından kənarda olacaq. Etibar səviyyəsi 0,95, alfa 0,05 və s.

standart_off– nümunə məlumatlarının standart sapması. Standart xətanı hesablamağa ehtiyac yoxdur, Excel özü n-in kökünə bölünəcəkdir.

ölçüsü– nümunə ölçüsü (n).

Etibarlılıq NORM funksiyasının nəticəsi etibar intervalının hesablanması düsturundan ikinci termindir, yəni. yarım interval Müvafiq olaraq, aşağı və yuxarı nöqtələr orta ± alınan dəyərdir.

Beləliklə, ilkin məlumatların paylanmasından asılı olmayan arifmetik orta üçün etibarlılıq intervallarının hesablanması üçün universal alqoritm qurmaq mümkündür. Universallığın qiyməti onun asimptotik təbiətidir, yəni. nisbətən böyük nümunələrdən istifadə zərurəti. Lakin müasir texnologiya əsrində tələb olunan miqdarda məlumat toplamaq adətən çətin deyil.

Etibar intervallarından istifadə edərək statistik fərziyyələrin sınaqdan keçirilməsi

(modul 111)

Statistikada həll olunan əsas problemlərdən biri də budur. Onun mahiyyəti qısaca belədir. Məsələn, ümumi əhalinin gözləntisinin hansısa dəyərə bərabər olduğu fərziyyəsi irəli sürülür. Sonra müəyyən bir gözlənti üçün müşahidə edilə bilən nümunə vasitələrinin paylanması qurulur. Sonra, bu şərti bölgüdə real ortanın harada yerləşdiyinə baxırlar. Əgər məqbul hədləri aşarsa, onda belə bir ortalamanın görünməsi ehtimalı çox azdır və təcrübə bir dəfə təkrarlanırsa, demək olar ki, mümkün deyil, irəli sürülən fərziyyə ilə ziddiyyət təşkil edir və uğurla rədd edilir. Orta kritik səviyyədən kənara çıxmazsa, fərziyyə rədd edilmir (lakin həm də sübut olunmur!).

Beləliklə, etimad intervallarının köməyi ilə gözləmə vəziyyətimizdə bəzi fərziyyələri də sınaqdan keçirə bilərsiniz. Bunu etmək çox asandır. Tutaq ki, müəyyən bir nümunə üçün arifmetik orta 100-ə bərabərdir. Fərziyyə yoxlanılır ki, gözlənilən dəyər, deyək ki, 90-dır. Yəni sualı primitiv şəkildə qoysaq, belə səslənir: doğru ilə belə ola bilərmi? orta dəyəri 90-a bərabərdir, müşahidə edilən orta 100 oldu?

Bu suala cavab vermək üçün sizə standart sapma və nümunə ölçüsü haqqında əlavə məlumat lazımdır. Fərz edək ki, standart kənarlaşma 30, müşahidələrin sayı isə 64 (kökü asanlıqla çıxarmaq üçün). Sonra ortanın standart səhvi 30/8 və ya 3.75-dir. 95% etimad intervalını hesablamaq üçün ortanın hər tərəfinə iki standart xəta əlavə etməlisiniz (daha dəqiq desək, 1.96). Etibar intervalı təxminən 100±7,5 və ya 92,5-dən 107,5-ə qədər olacaq.

Əlavə əsaslandırma aşağıdakı kimidir. Əgər yoxlanılan dəyər etimad intervalına düşürsə, bu, fərziyyə ilə ziddiyyət təşkil etmir, çünki təsadüfi dalğalanmalar həddinə düşür (ehtimal 95%). Əgər yoxlanılan nöqtə etimad intervalından kənara düşürsə, o zaman belə bir hadisənin baş vermə ehtimalı çox azdır, istənilən halda məqbul səviyyədən aşağıdır. Bu o deməkdir ki, fərziyyə müşahidə edilən məlumatlara zidd olduğu üçün rədd edilir. Bizim vəziyyətimizdə gözlənilən dəyər haqqında fərziyyə etimad intervalından kənardadır (sınaq edilmiş 90 dəyəri 100±7,5 intervalına daxil edilmir), ona görə də rədd edilməlidir. Yuxarıdakı ibtidai suala cavab verərək demək lazımdır: yox, ola bilməz, heç bir halda bu, çox nadir hallarda olur. Çox vaxt onlar fərziyyənin səhvən rədd edilməsinin xüsusi ehtimalını (p-səviyyəsi) göstərir və etimad intervalının qurulduğu müəyyən səviyyəni deyil, daha çox başqa vaxt.

Gördüyünüz kimi, orta (və ya riyazi gözlənti) üçün etimad intervalı qurmaq çətin deyil. Əsas odur ki, mahiyyəti dərk edin, sonra işlər davam edəcək. Təcrübədə əksər hallarda 95% etimad intervalı istifadə olunur ki, bu da ortanın hər iki tərəfində təxminən iki standart xətanın genişliyidir.

Hələlik bu qədər. Hər vaxtınız xeyir!

Qoy CB X ümumi populyasiya təşkil etsin və β naməlum parametr CB X olsun. Əgər *-dəki statistik qiymətləndirmə uyğundursa, seçmənin ölçüsü nə qədər böyükdürsə, β-nin qiymətini bir o qədər dəqiq alırıq. Bununla belə, praktikada bizdə çox böyük nümunələr yoxdur, ona görə də daha yüksək dəqiqliyə zəmanət verə bilmərik.

b* c üçün statistik qiymətləndirmə olsun. Dəyər |in* - in| qiymətləndirmə dəqiqliyi adlanır. β* təsadüfi dəyişən olduğundan dəqiqliyin CB olduğu aydındır. Kiçik müsbət 8 rəqəmini göstərək və qiymətləndirmənin düzgünlüyünü tələb edək |в* - в| 8-dən az idi, yəni | in* - in |< 8.

Etibarlılıq g və ya inam ehtimalı * ilə təxmin edilən ehtimal g bərabərsizliyi ilə |in * - in|< 8, т. е.

Tipik olaraq, etibarlılıq g əvvəlcədən müəyyən edilir və g 1-ə yaxın bir ədəd kimi qəbul edilir (0,9; 0,95; 0,99; ...).

|in * - in| bərabərsizliyindən bəri< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

İnterval (* - 8-də, * + 5-də) etimad intervalı adlanır, yəni etimad intervalı y ehtimalı ilə in naməlum parametri əhatə edir. Qeyd edək ki, etimad intervalının ucları təsadüfi olur və nümunədən nümunəyə dəyişir, ona görə də intervalın (* - 8-də, * + 8-də) naməlum parametri əhatə etdiyini söyləmək daha doğrudur, in deyil, in. interval.

Əhali normal qanuna uyğun olaraq paylanmış X təsadüfi dəyişən ilə müəyyən edilsin və standart sapma a məlum olsun. Naməlum a = M (X) riyazi gözləntisidir. Verilmiş etibarlılıq y üçün a üçün inam intervalını tapmaq tələb olunur.

Nümunə orta

xr = a üçün statistik təxmindir.

Teorem. X-in normal paylanması və M (XB) = a olduğu halda xB təsadüfi dəyişəni normal paylanmaya malikdir,

A (XB) = a, burada a = y/B (X), a = M (X). l/i

a üçün etimad intervalı formaya malikdir:

8 tapırıq.

Nisbətdən istifadə

F(r) Laplas funksiyasıdır, bizdə:

P ( | XB - a |<8} = 2Ф

Laplas funksiyasının qiymətlər cədvəlində t-nin qiymətini tapırıq.

təyin edərək

T, biz F(t) = g alırıq, çünki g verilir, onda by

Bərabərlikdən biz hesablamanın düzgün olduğunu görürük.

Bu o deməkdir ki, a üçün etimad intervalı formaya malikdir:

X populyasiyasından bir nümunə verilmişdir

ng üçün" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, onda etimad intervalı olacaq:

Misal 6.35. Seçmənin orta Xb = 10,43, seçmə ölçüsü n = 100 və standart kənarlaşma s = 5 olduğunu bilməklə, etibarlılığı 0,95 olan normal paylanmanın a riyazi gözləntisini qiymətləndirmək üçün inam intervalını tapın.

Düsturdan istifadə edək

Riyazi gözləmə üçün inam intervalı - bu, məlum ehtimalla ümumi əhalinin riyazi gözləntilərini ehtiva edən məlumatlardan hesablanmış intervaldır. Riyazi gözlənti üçün təbii qiymətləndirmə onun müşahidə edilən qiymətlərinin arifmetik ortasıdır. Buna görə də, dərs boyu “orta” və “orta dəyər” terminlərindən istifadə edəcəyik. Etibar intervalının hesablanması problemlərində ən çox tələb olunan cavab “Orta qiymətin [müəyyən bir problemdə dəyərin] etibarlılıq intervalı [kiçik dəyərdən] [daha böyük dəyərə]” kimi bir şeydir. Etibar intervalından istifadə edərək, yalnız orta dəyərləri deyil, həm də ümumi əhalinin müəyyən bir xüsusiyyətinin nisbətini qiymətləndirə bilərsiniz. Dərsdə yeni təriflərə və düsturlara çatacağımız orta dəyərlər, dispersiya, standart sapma və səhvlər müzakirə olunur. Nümunə və populyasiyanın xüsusiyyətləri .

Ortanın nöqtə və interval təxminləri

Əgər populyasiyanın orta qiyməti ədədlə (nöqtə ilə) qiymətləndirilirsə, onda əhalinin naməlum orta qiymətinin qiymətləndirilməsi kimi müşahidələr seçməsindən hesablanan xüsusi orta qiymət götürülür. Bu halda, seçmənin orta dəyəri - təsadüfi dəyişən - ümumi əhalinin orta dəyəri ilə üst-üstə düşmür. Buna görə də, nümunə ortalamasını göstərərkən, eyni zamanda seçmə xətasını da göstərməlisiniz. Nümunə götürmə xətasının ölçüsü orta ilə eyni vahidlərlə ifadə edilən standart xətadır. Buna görə də tez-tez aşağıdakı qeydlərdən istifadə olunur: .

Ortanın qiymətləndirilməsini müəyyən bir ehtimalla əlaqələndirmək lazımdırsa, əhaliyə maraq parametri bir rəqəmlə deyil, intervalla qiymətləndirilməlidir. Etibar intervalı müəyyən bir ehtimala malik olan intervaldır P təxmini əhali göstəricisinin qiyməti tapılır. Ehtimal olunduğu etimad intervalı P = 1 - α təsadüfi dəyişən tapılır, aşağıdakı kimi hesablanır:

,

α = 1 - P, bunu statistikaya dair demək olar ki, hər hansı bir kitaba əlavədə tapmaq olar.

Təcrübədə ümumi orta və dispersiya məlum deyildir, ona görə də ümumi dispersiya seçmə dispersiya ilə, ümumi orta göstərici isə seçmə ortası ilə əvəz olunur. Beləliklə, əksər hallarda etimad intervalı aşağıdakı kimi hesablanır:

.

Etibar intervalı düsturu, əgər populyasiyanın ortalamasını qiymətləndirmək üçün istifadə edilə bilər

  • əhalinin standart sapması məlumdur;
  • və ya əhalinin standart sapması naməlumdur, lakin nümunənin ölçüsü 30-dan çoxdur.

Nümunə ortalaması əhali ortasının qərəzsiz qiymətləndirilməsidir. Öz növbəsində, nümunə variasiyası populyasiya fərqinin qərəzsiz qiymətləndirilməsi deyil. Nümunə dispersiya düsturunda əhali fərqinin qərəzsiz qiymətləndirilməsini əldə etmək üçün seçmə ölçüsü n ilə əvəz edilməlidir n-1.

Misal 1. Müəyyən bir şəhərdə təsadüfi seçilmiş 100 kafedən məlumat toplanmışdır ki, onlardakı işçilərin orta sayı 4,6 standart sapma ilə 10,5 nəfərdir. Kafe işçilərinin sayı üçün 95% etimad intervalını müəyyən edin.

burada əhəmiyyətlilik səviyyəsi üçün standart normal paylanmanın kritik qiyməti α = 0,05 .

Belə ki, kafe işçilərinin orta sayı üçün 95%-lik inam intervalı 9,6-11,4 arasında dəyişib.

Misal 2. 64 müşahidə populyasiyasından təsadüfi bir nümunə üçün aşağıdakı ümumi dəyərlər hesablandı:

müşahidələrdəki dəyərlərin cəmi,

dəyərlərin ortadan kvadrat sapmalarının cəmi .

Riyazi gözlənti üçün 95% etimad intervalını hesablayın.

Standart kənarlaşmanı hesablayaq:

,

Orta dəyəri hesablayaq:

.

Etibar intervalı üçün dəyərləri ifadə ilə əvəz edirik:

burada əhəmiyyətlilik səviyyəsi üçün standart normal paylanmanın kritik qiyməti α = 0,05 .

Biz əldə edirik:

Beləliklə, bu seçmənin riyazi gözləntisi üçün 95% inam intervalı 7,484 ilə 11,266 arasında dəyişdi.

Misal 3. 100 müşahidədən ibarət təsadüfi populyasiya nümunəsi üçün hesablanmış orta göstərici 15,2, standart kənarlaşma isə 3,2-dir. Gözlənilən dəyər üçün 95% etimad intervalını, sonra isə 99% etimad intervalını hesablayın. Nümunə gücü və onun dəyişməsi dəyişməz qalsa və etimad əmsalı artarsa, etimad intervalı daralacaq, yoxsa genişlənəcək?

Bu dəyərləri etimad intervalı üçün ifadə ilə əvəz edirik:

burada əhəmiyyətlilik səviyyəsi üçün standart normal paylanmanın kritik qiyməti α = 0,05 .

Biz əldə edirik:

.

Beləliklə, bu nümunənin orta dəyəri üçün 95% etimad intervalı 14,57 ilə 15,82 arasında dəyişdi.

Yenidən bu dəyərləri etimad intervalının ifadəsi ilə əvəz edirik:

burada əhəmiyyətlilik səviyyəsi üçün standart normal paylanmanın kritik qiyməti α = 0,01 .

Biz əldə edirik:

.

Beləliklə, bu nümunənin orta dəyəri üçün 99% inam intervalı 14.37 ilə 16.02 arasında dəyişdi.

Gördüyümüz kimi etimad əmsalı artdıqca standart normal paylanmanın kritik qiyməti də artır və deməli, intervalın başlanğıc və son nöqtələri ortadan daha uzaqda yerləşir və beləliklə, riyazi gözlənti üçün inam intervalı artır. .

Xüsusi çəkisinin nöqtə və interval təxminləri

Bəzi nümunə atributunun payı payın nöqtə qiymətləndirilməsi kimi şərh edilə bilər səhümumi əhali üçün eyni xüsusiyyətə malikdir. Əgər bu dəyəri ehtimalla əlaqələndirmək lazımdırsa, onda xüsusi çəkisinin etibarlılıq intervalı hesablanmalıdır. səh ehtimalı olan əhali üçün xarakterikdir P = 1 - α :

.

Misal 4. Bəzi şəhərlərdə iki namizəd var AB bələdiyyə sədrliyinə namizədliyini irəli sürürlər. 200 şəhər sakini arasında təsadüfi sorğu keçirilib, onlardan 46%-i namizədə səs verəcəklərini bildirib. A, 26% - namizəd üçün B 28%-i isə kimə səs verəcəyini bilmir. Namizədi dəstəkləyən şəhər sakinlərinin nisbəti üçün 95% etimad intervalını müəyyən edin A.

Bu paylanmanın dispersiyasının və standart kənarlaşmalarının s məlum olduğunu nəzərə alaraq, əhalinin X təsadüfi kəmiyyəti normal paylansın. Seçim ortasından istifadə edərək naməlum riyazi gözləntiləri qiymətləndirmək tələb olunur. Bu halda, vəzifə etibarlılıq ilə riyazi gözlənti üçün inam intervalının tapılmasına gəlir b. Etibarlılıq ehtimalının (etibarlılığın) b qiymətini təyin etsəniz, (6.9a) düsturundan istifadə edərək naməlum riyazi gözlənti üçün intervala düşmə ehtimalını tapa bilərsiniz:

burada Ф(t) Laplas funksiyasıdır (5.17a).

Nəticədə, D = s 2 dispersiya məlum olarsa, riyazi gözlənti üçün etimad intervalının sərhədlərini tapmaq üçün alqoritm tərtib edə bilərik:

  1. Etibarlılıq dəyərini təyin edin - b.
  2. (6.14)-dən Ф(t) = 0,5× b ifadə edin. F(t) dəyəri əsasında Laplas funksiyası üçün cədvəldən t-nin qiymətini seçin (bax. Əlavə 1).
  3. (6.10) düsturu ilə e sapmasını hesablayın.
  4. (6.12) düsturundan istifadə edərək etimad intervalını yazın ki, b ehtimalı ilə bərabərsizlik əməl etsin:

.

Misal 5.

X təsadüfi dəyişəni normal paylanmaya malikdir. Əgər verilmişdirsə, naməlum riyazi gözlənti a-nın etibarlılığı b = 0,96 olan qiymətləndirmə üçün inam intervallarını tapın:

1) ümumi standart kənarlaşma s = 5;

2) orta nümunə;

3) nümunə ölçüsü n = 49.

Riyazi gözləntinin interval qiymətləndirilməsi üçün (6.15) düsturunda A etibarlılığı ilə b t-dən başqa bütün kəmiyyətlər məlumdur. t-nin qiymətini (6.14) istifadə etməklə tapmaq olar: b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Laplas funksiyası Ф(t) = 0.48 üçün Əlavə 1-dəki cədvəldən istifadə edərək, müvafiq t = 2.06 qiymətini tapın. Beləliklə, . e-nin hesablanmış qiymətini (6.12) düsturu ilə əvəz etməklə, etimad intervalı əldə edə bilərsiniz: 30-1,47< a < 30+1,47.

Naməlum riyazi gözləntinin etibarlılığı b = 0,96 olan qiymətləndirmə üçün tələb olunan inam intervalı bərabərdir: 28,53< a < 31,47.



dostlara deyin