信頼区間 di。 信頼区間

💖 好きですか?リンクを友達と共有する

信頼区間の推定

学習目標

統計では次のことが考慮されます 2つの主なタスク:

    サンプル データに基づいた推定値があり、推定されたパラメータの真の値がどこにあるかについて確率論的な記述を行いたいと考えています。

    サンプル データを使用してテストする必要がある特定の仮説があります。

このトピックでは、最初のタスクについて検討します。 信頼区間の定義も紹介しましょう。

信頼区間は、パラメータの推定値を中心に構築される区間であり、推定されたパラメータの真の値が事前に指定された確率でどこに位置するかを示します。

このトピックに関する資料を学習した後、次のことを行います。

    推定値の信頼区間とは何かを学びます。

    統計的問題を分類する方法を学びます。

    統計公式とソフトウェアツールの両方を使用して、信頼区間を構築するテクニックを習得します。

    統計的推定の精度に関する特定のパラメーターを達成するために必要なサンプル サイズを決定する方法を学びます。

サンプル特性の分布

T 分布

上で説明したように、確率変数の分布はパラメーター 0 と 1 の標準化正規分布に近似しています。σ の値がわからないため、σ の推定値で置き換えます。 数量はすでに異なる分布を持っています。つまり、または 学生の分布、パラメータ n -1 (自由度の数) によって決定されます。 この分布は正規分布に近くなります (n が大きいほど、分布は近づきます)。

図では、 95
30 自由度の Student 分布が表示されます。 ご覧のとおり、正規分布に非常に近いことがわかります。

正規分布 NORMIDIIST および NORMINV を操作する関数と同様に、t 分布を操作する関数 STUDIST (TDIST) および ストゥドラソブル (TINV)。 これらの関数の使用例は、ファイル STUDRASP.XLS (テンプレートとソリューション) および図に示されています。 96
.

他の特性の分布

すでにご存知のとおり、数学的期待値の推定精度を決定するには、t 分布が必要です。 分散などの他のパラメータを推定するには、異なる分布が必要です。 そのうちの 2 つは F 分布と × 2 - 配布.

平均値の信頼区間

信頼区間- これは、パラメーターの推定値を中心に構築される間隔であり、推定されたパラメーターの真の値が事前に指定された確率でどこに位置するかを示します。

平均値の信頼区間の構築が行われます。 次の方法で:

そのファーストフードレストランは、新しいタイプのサンドイッチの品揃えを拡大する予定です。 マネージャーは、その需要を推定するために、すでに試用した訪問者から 40 人をランダムに選択し、新製品に対する態度を 1 から 10 のスケールで評価してもらう予定です。マネージャーは、期待される需要を推定したいと考えています。新製品が受け取るポイント数を計算し、この推定値に対して 95% 信頼区間を構築します。 これを行う方法? (ファイル SANDWICH1.XLS (テンプレートとソリューション) を参照してください。

解決

この問題を解決するには、 を使用できます。 結果を図に示します。 97
.

合計値の信頼区間

場合によっては、サンプル データを使用して、数学的な期待値ではなく、値の合計を推定する必要があります。 たとえば、監査人がいる状況では、平均口座規模ではなく、すべての口座の合計を見積もることに関心があるかもしれません。

N を要素の総数、n をサンプルサイズ、T 3 をサンプル内の値の合計、T" を母集団全体の合計の推定値とします。 であり、信頼区間は次の式で計算されます。ここで、 s はサンプルの標準偏差の推定値、 はサンプルの平均値の推定値です。

税務当局が 10,000 人の納税者の還付総額を見積もろうとしているとします。 納税者は還付を受けるか、追加の税金を支払います。 サンプルサイズを 500 人と仮定して、返金額の 95% 信頼区間を求めます (ファイル AMOUNT OF REFUND.XLS (テンプレートとソリューション) を参照してください)。

解決

StatPro にはこの場合の特別な手順はありませんが、上記の式に基づいて平均の境界から境界を取得できることに注意してください (図 98)
).

割合の信頼区間

p をクライアントのシェアの数学的期待値とし、p b をサイズ n のサンプルから得られたこのシェアの推定値とします。 十分に大きい場合には、 評価分布は数学的期待値 p と標準偏差により正規に近くなります。 。 この場合の推定の標準誤差は次のように表されます。 、信頼区間は次のようになります。 .

そのファーストフードレストランは、新しいタイプのサンドイッチの品揃えを拡大する予定です。 その需要を評価するために、マネージャーは、既に試用した訪問者から 40 人をランダムに選択し、新製品に対する態度を 1 から 10 のスケールで評価してもらいました。マネージャーは、期待される割合を推定したいと考えています。新製品を少なくとも 6 ポイント以上評価する顧客 (彼は、これらの顧客が新製品の消費者になることを期待しています)。

解決

最初に、クライアントの評価が 6 ポイント以上の場合は属性 1 に基づいて新しい列を作成し、それ以外の場合は 0 に基づいて新しい列を作成します (SANDWICH2.XLS ファイル (テンプレートとソリューション) を参照)。

方法 1

1 の数を数えることによってシェアを推定し、式を使用します。

zcr 値は、特別な正規分布テーブルから取得されます (たとえば、95% 信頼区間の場合は 1.96)。

このアプローチと特定のデータを使用して 95% 間隔を構築すると、次の結果が得られます (図 99)
)。 パラメータ zcr の臨界値は 1.96 です。 推定値の標準誤差は 0.077 です。 信頼区間の下限は 0.475 です。 信頼区間の上限は 0.775 です。 したがって、管理者は、新製品を 6 ポイント以上評価する顧客の割合が 47.5 ~ 77.5 であると 95% の信頼を持って信じる権利があります。

方法 2

この問題は、標準の StatPro ツールを使用して解決できます。 これを行うには、この場合のシェアが Type 列の平均値と一致することに注意するだけで十分です。 次に申請してみます StatPro/統計的推論/ワンサンプル分析 Type 列の平均値の信頼区間 (数学的期待値の推定値) を構築します。 この場合に得られる結果は、最初の方法の結果に非常に近いものになります (図 99)。

標準偏差の信頼区間

s は標準偏差の推定値として使用されます (式はセクション 1 に記載されています)。 推定値 s の密度関数はカイ二乗関数で、t 分布と同様に n-1 の自由度を持ちます。 このディストリビューション CHIDIST および CHINV を操作するための特別な関数があります。

この場合の信頼区間は対称ではなくなります。 従来の境界線図を図に示します。 100 。

機械では直径10cmの部品を生産しなければなりませんが、諸事情により誤差が生じます。 品質管理者は 2 つの状況を懸念しています。まず、平均値は 10 cm である必要があります。 第二に、この場合でも、偏差が大きい場合、多くの部品が不合格になります。 彼は毎日 50 個の部品のサンプルを作成します (ファイル QUALITY CONTROL.XLS (テンプレートとソリューション) を参照してください。そのようなサンプルからどのような結論が得られるでしょうか?

解決

次を使用して、平均と標準偏差の 95% 信頼区間を構築しましょう。 StatPro/統計的推論/ワンサンプル分析(図101)
).

次に、直径の正規分布を仮定して、最大偏差を 0.065 として不良品の割合を計算します。 置換テーブルの機能 (2 つのパラメーターの場合) を使用して、欠陥の割合の平均値と標準偏差への依存性をプロットします (図 102)。
).

2 つの平均間の差の信頼区間

これは統計手法の最も重要な応用の 1 つです。 状況の例。

    衣料品店のマネージャーは、平均的な女性顧客が平均的な男性顧客と比べて店内で支出する金額がどのくらい多いか少ないかを知りたいと考えています。

    この 2 つの航空会社は同様の路線を運航しています。 消費者団体は、両航空会社の平均予想フライト遅延時間の差を比較したいと考えています。

    同社は、特定の種類の商品のクーポンをある都市では送信し、別の都市では送信しません。 マネージャーは、今後 2 か月間のこれらの製品の平均購入量を比較したいと考えています。

    自動車ディーラーは、プレゼンテーションで夫婦を扱うことがよくあります。 プレゼンテーションに対する個人的な反応を理解するために、カップルは別々にインタビューされることがよくあります。 管理人は男性と女性による評価の違いを評価したいと考えています。

独立したサンプルの場合

平均間の差は、n 1 + n 2 - 2 自由度の t 分布になります。 μ 1 - μ 2 の信頼区間は次の関係で表されます。

この問題は、上記の公式を使用するだけでなく、標準の StatPro ツールを使用しても解決できます。 これを行うには、次を使用するだけで十分です

比率の差の信頼区間

株式の数学的期待値を とします。 それぞれサイズ n 1 と n 2 のサンプルから構築されたサンプル推定値を とします。 次に、その差の推定値です。 したがって、この差の信頼区間は次のように表されます。

ここで、z cr は特別なテーブルを使用して正規分布から取得された値です (たとえば、95% 信頼区間の場合は 1.96)。

この場合、推定の標準誤差は次の関係で表されます。

.

この店は大セールの準備をしており、次のようなマーケティング調査を実施しました。 上位 300 人の購入者が選ばれ、それぞれ 150 人のメンバーからなる 2 つのグループにランダムに分けられました。 選ばれた購入者全員にセールに参加するための招待状が送られましたが、最初のグループのメンバーのみが 5% 割引のクーポンを受け取りました。 セール期間中、選ばれた 300 人の購入者全員の購入が記録されました。 マネージャーは結果をどのように解釈し、クーポンの有効性を判断できるでしょうか? (ファイル COUPONS.XLS (テンプレートとソリューション) を参照)。

解決

私たちの特定のケースでは、割引クーポンを受け取った 150 人の顧客のうち 55 人がセールで購入し、クーポンを受け取らなかった 150 人のうち購入したのは 35 人だけでした (図 103)。
)。 この場合、サンプル比率の値はそれぞれ 0.3667 と 0.2333 になります。 そして、それらの間のサンプル差はそれぞれ 0.1333 に等しくなります。 95% 信頼区間を仮定すると、正規分布表から z cr = 1.96 がわかります。 サンプル差の標準誤差の計算は 0.0524 です。 最終的に、95% 信頼区間の下限は 0.0307、上限は 0.2359 であることがそれぞれわかります。 得られた結果は、割引クーポンを受け取った 100 人の顧客ごとに 3 ~ 23 人の新規顧客が期待できると解釈できます。 ただし、この結論自体はクーポンの使用の有効性を意味するものではないことに留意する必要があります(割引を提供すると利益が失われるため)。 これを具体的なデータで実証してみましょう。 平均購入サイズが 400 ルーブルで、そのうち 50 ルーブルであると仮定します。 店には利益がある。 この場合、クーポンを受け取らなかった 100 人の顧客の予想利益は次のようになります。

50 0.2333 100 = 1166.50 こすります。

クーポンを受け取った 100 人の顧客について同様に計算すると、次のようになります。

30 0.3667 100 = 1100.10 こすります。

平均利益が 30 ルーブルに減少したのは、クーポンを受け取った顧客が割引を利用して平均 380 ルーブルで購入するという事実によって説明されます。

したがって、最終的な結論は、この特定の状況ではそのようなクーポンを使用することは無効であることを示しています。

コメント。 この問題は、標準の StatPro ツールを使用して解決できます。 これを行うには、この問題を、次の方法を使用して 2 つの平均間の差を推定する問題に還元し、次を適用するだけで十分です。 StatPro/統計的推論/2サンプル分析 2 つの平均値の差の信頼区間を構築します。

信頼区間の長さの制御

信頼区間の長さは次の条件に依存します。 以下の条件:

    データを直接(標準偏差);

    重要性のレベル。

    サンプルサイズ。

平均を推定するためのサンプルサイズ

まず、一般的な場合の問題を考えてみましょう。 与えられた信頼区間の長さの半分の値を B と表します (図 104)
)。 ある確率変数 X の平均値の信頼区間は次のように表されることがわかっています。 、 どこ 。 信じること:

n を表現すると、 が得られます。

残念ながら、確率変数 X の分散の正確な値はわかりません。 さらに、tcr の値は自由度の数によって n に依存するため、わかりません。 この状況では、次のことができます。 分散の代わりに、研究対象の確率変数の利用可能な実装に基づいた分散の推定値を使用します。 正規分布には t cr 値の代わりに z cr 値を使用します。 正規分布と t 分布の分布密度関数が非常に近いため (n が小さい場合を除く)、これはまったく許容できます。 したがって、必要な式は次の形式になります。

.

一般に、この式では非整数の結果が得られるため、結果の超過による四捨五入が目的のサンプル サイズとして採用されます。

そのファーストフードレストランは、新しいタイプのサンドイッチの品揃えを拡大する予定です。 マネージャーは、その需要を評価するために、すでに試したことがある訪問者から無作為に数名を選択し、新製品に対する態度を 1 から 10 のスケールで評価してもらう予定です。マネージャーは推定したいと考えています。新製品が製品を受け取り、この推定値に対して 95% の信頼区間を構築する予想ポイント数。 同時に、信頼区間の半値幅が 0.3 を超えないようにする必要があります。 何人の訪問者にインタビューする必要がありますか?

次のように:

ここ 腐るは比率 p の推定値、B は信頼区間の長さの所定の半分です。 n の過大評価は、次の値を使用して取得できます。 腐る= 0.5。 この場合、信頼区間の長さは、p のどの真の値に対しても指定された値 B を超えることはありません。

前の例のマネージャーが、新しいタイプの製品を好む顧客の割合を推定する計画を立てたとします。 彼は、半値の長さが 0.05 を超えない 90% 信頼区間を構築したいと考えています。 無作為サンプルには何人のクライアントを含める必要がありますか?

解決

この場合、z cr の値は 1.645 です。 したがって、必要量は次のように計算されます。 .

マネージャーが、必要な p 値がたとえば約 0.3 であると信じる理由がある場合、この値を上記の式に代入すると、より小さなランダム サンプル値、つまり 228 が得られます。

決定式 2つの平均値に差がある場合のランダムなサンプルサイズ次のように書かれます:

.

一部のコンピュータ会社にはカスタマー サービス センターがあります。 最近、サービスの質が悪いという顧客からの苦情が増えています。 サービスセンターでは主に、経験が浅いが特別準備講座を修了した人材と、実務経験は豊富だが特別講座を修了していない人材の2種類の従業員を採用しています。 同社は、過去 6 か月間の顧客からの苦情を分析し、2 つの従業員グループごとの平均苦情数を比較したいと考えています。 両方のグループのサンプルの数値は同じであると想定されます。 半分の長さが 2 以下で 95% の間隔を得るには、サンプルに何人の従業員を含める必要がありますか?

解決

ここで、 σ ots は、両方の確率変数が近いと仮定した場合の、両方の確率変数の標準偏差の推定値です。 したがって、私たちの問題では、何らかの方法でこの推定値を取得する必要があります。 これは、例えば次のように行うことができる。 過去 6 か月間の顧客からの苦情に関するデータを確認したマネージャーは、各従業員が通常 6 ~ 36 件の苦情を受けていることに気づくかもしれません。 正規分布では、ほとんどすべての値が平均値から 3 標準偏差以内にあることがわかっているため、次のように合理的に信じることができます。

, ここで、σ ots = 5 となります。

この値を式に代入すると、次のようになります。 .

決定式 比率の差を推定する場合のランダムなサンプルサイズの形式は次のとおりです。

ある会社では、2 つの工場で同様の製品を生産しています。 会社のマネージャーは、両方の工場の不良品の割合を比較したいと考えています。 入手可能な情報によると、両工場の不良率は 3 ~ 5% の範囲です。 これは、半値の長さが 0.005 (または 0.5%) 以下の 99% 信頼区間を構築することを目的としています。 各工場からいくつの製品を選択する必要がありますか?

解決

ここで、p 1ots と p 2ots は、第 1 工場と第 2 工場における 2 つの未知の欠陥シェアの推定値です。 p 1ots = p 2ots = 0.5 とすると、n の値が過大評価されます。 しかし、私たちの場合、これらの株式に関する先験的な情報があるため、これらの株式の上限推定値、つまり 0.05 を採用します。 我々が得る

標本データから一部の母集団パラメータを推定する場合、パラメータの点推定値を与えるだけでなく、推定されるパラメータの正確な値がどこにあるかを示す信頼区間も提供すると便利です。

この章では、さまざまなパラメーターに対してそのような間隔を構築できる定量的な関係についても説明しました。 信頼区間の長さを制御する方法を学びました。

サンプル サイズの推定の問題 (実験計画の問題) は、標準の StatPro ツールを使用して解決できることにも注意してください。 StatPro/統計的推論/サンプルサイズの選択.

MS EXCEL で信頼区間を構築して、既知の分散値の場合の分布の平均値を推定してみましょう。

もちろん選択 信頼のレベルそれは解決する問題に完全に依存します。 したがって、飛行機の信頼性に対する航空乗客の信頼度は、電球の信頼性に対する購入者の信頼度よりも間違いなく高いはずです。

問題の定式化

からだと仮定しましょう 人口取られて サンプルサイズn。 と仮定されます 標準偏差この分布は既知です。 これを踏まえて必要となるのが サンプル未知のものを評価する 分布平均(μ, ) を作成し、対応する 両面 信頼区間.

ポイント推定

から知られているように、 統計(それを表しましょう X 平均) は 平均の不偏推定値これ 人口分布 N(μ;σ 2 /n) を持ちます。

注記: ビルドする必要がある場合はどうすればよいですか 信頼区間というディストリビューションの場合、 ではありません 普通?この場合、十分に大きなサイズがあると述べた助けになります。 サンプルディストリビューションからのn いない 普通, 統計量 X 平均のサンプル分布意思 対応する 正規分布パラメータ N(μ;σ 2 /n) を使用します。

それで、 ポイント推定 平均 分布値私たちはこれを持っています 標本平均、つまり X 平均。 さあ始めましょう 信頼区間。

信頼区間の構築

通常、分布とそのパラメータがわかれば、確率変数が指定した間隔から値を取る確率を計算できます。 では、その逆を行ってみましょう。ランダム変数が指定された確率に該当する間隔を見つけます。 たとえば、プロパティから 正規分布確率変数は 95% の確率で次の範囲に分布することが知られています。 通常の法律、から約 +/- 2 の範囲内になります。 平均値(に関する記事を参照)。 この間隔は私たちのプロトタイプとして機能します 信頼区間.

分布がわかるかどうか見てみましょう , この間隔を計算するには? 質問に答えるには、分布の形状とそのパラメータを示す必要があります。

私たちは配布の形式を知っています - これは 正規分布(私たちが話していることを忘れないでください 標本分布 統計 X 平均).

パラメータ μ は私たちには不明です (次を使用して推定する必要があるだけです) 信頼区間)ですが、推定値はあります X 平均、に基づいて計算されます サンプル、使用できるもの。

2 番目のパラメータ - サンプル平均の標準偏差 それは既知であるとみなします、σ/√nに等しい。

なぜなら μがわからないので、間隔+/- 2を構築します 標準偏差からではありません 平均値、そしてその既知の推定値から X 平均。 それらの。 計算するとき 信頼区間私たちはそれを想定しません X 平均+/- 2 の範囲内に収まります 標準偏差μ からの確率は 95% であり、間隔は +/- 2 であると仮定します。 標準偏差から X 平均 95%の確率でμをカバーします – 一般人口の平均、そこから取られるもの サンプル。 これら 2 つのステートメントは同等ですが、2 番目のステートメントを使用して次のように構築できます。 信頼区間.

さらに、間隔を明確にしてみましょう: に分布する確率変数 通常の法律、95% の確率で +/- 1.960 の範囲内に収まります。 標準偏差、+/- 2 ではない 標準偏差。 これは次の式を使用して計算できます。 =NORM.ST.REV((1+0.95)/2)、 cm。 ファイル例 シート間隔.

これで、以下を形成するのに役立つ確率的ステートメントを定式化できます。 信頼区間:
「その確率は、 母集団の平均から位置する サンプル平均 1,960インチ以内 サンプル平均の標準偏差」、95%に等しい。」

ステートメントで言及されている確率値には特別な名前が付いています に関連付けられています。簡単な式で有意水準α(アルファ)を​​求める 信頼レベル =1 . 私たちの場合には 重要なレベル α =1-0,95=0,05 .

さて、この確率的ステートメントに基づいて、計算するための式を書きます。 信頼区間:

ここで、Z α/2 標準 正規分布(この確率変数の値は z, P(z>=Zα/2 )=α/2).

注記: 上位 α/2 分位数幅を定義します 信頼区間 V 標準偏差 標本平均。 上位 α/2 分位数 標準 正規分布常に 0 より大きいため、非常に便利です。

私たちの場合、α=0.05で、 上位 α/2 分位数 1.960に相当します。 他の有意水準の場合 α (10%; 1%) 上位 α/2 分位数 Zα/2 式 =NORM.ST.REV(1-α/2) を使用して計算できます。または、既知の場合は、 信頼レベル, =NORM.ST.OBR((1+信頼レベル)/2).

通常、建物を建てるとき 平均を推定するための信頼区間のみを使用する アッパーα/2-分位数そして使わないでください 下α/2-分位数。 これが可能なのは、 標準 正規分布 x 軸に関して対称 ( その分布密度対称的な 平均的、つまり 0). したがって、計算する必要はありません 下位α/2分位数(単にαと呼びます) /2分位数)、 なぜなら それは等しいです アッパーα/2-分位数マイナス記号付き。

値 x の分布の形状にかかわらず、対応する確率変数は X 平均配布された 大丈夫 N(μ;σ 2 /n) (に関する記事を参照)。 したがって、一般に、上記の式は、 信頼区間は単なる近似値です。 値 x が分布している場合 通常の法律 N(μ;σ 2 /n) の場合、次の式が得られます。 信頼区間正確です。

MS EXCEL での信頼区間の計算

問題を解決しましょう。
入力信号に対する電子部品の応答時間は、デバイスの重要な特性です。 エンジニアは、平均応答時間の信頼区間を 95% の信頼水準で構築したいと考えています。 これまでの経験から、エンジニアは応答時間の標準偏差が 8 ミリ秒であることを知っています。 応答時間を評価するために、エンジニアは 25 回の測定を行い、平均値は 78 ミリ秒であったことが知られています。

解決: エンジニアは電子デバイスの応答時間を知りたいと考えていますが、応答時間は固定値ではなく、独自の分布を持つ確率変数であることを理解しています。 したがって、彼が望むことができる最善のことは、この分布のパラメータと形状を決定することです。

残念ながら、問題の状況からは、応答時間の分布の形状はわかりません (必ずしもそうである必要はありません)。 普通)。 、この分布も不明です。 彼だけが知っている 標準偏差σ=8。 したがって、確率を計算して構築することはできませんが、 信頼区間.

しかし、分布が分からないにもかかわらず、 時間 個別の対応によると、私たちはそれを知っています CPT, 標本分布 平均応答時間およそです 普通(条件は次のように仮定します) CPTが実行されるため、 サイズ サンプルかなり大きい (n=25)) .

さらに、 平均この分布は次と等しい 平均値単一の応答の分布、つまり μ。 あ 標準偏差この分布の値 (σ/√n) は、式 =8/ROOT(25) を使用して計算できます。

エンジニアが受け取ったことも知られています ポイント推定パラメータ μ は 78 ミリ秒 (X 平均) に等しい。 したがって、確率を計算できるようになりました。 私たちは配布の形式を知っています ( 普通) とそのパラメータ (X avg および σ/√n)。

エンジニアが知りたいこと 期待値μ応答時間分布。 上で述べたように、このμは次の値に等しい。 平均応答時間のサンプル分布の数学的期待値。 使用する場合 正規分布 N(X avg; σ/√n) の場合、目的の μ は、約 95% の確率で +/-2*σ/√n の範囲になります。

重要なレベル 1-0.95=0.05に相当します。

最後に左右の境界線を見つけてみましょう 信頼区間.
左枠: =78-NORM.ST.REV(1-0.05/2)*8/ROOT(25) = 74,864
右枠: =78+NORM.ST.INV(1-0.05/2)*8/ROOT(25)=81.136

左枠: =NORM.REV(0.05/2; 78; 8/ROOT(25))
右枠: =NORM.REV(1-0.05/2; 78; 8/ROOT(25))

答え: 信頼区間95% 信頼水準と σ=8ミリ秒等しい 78+/-3.136ミリ秒。

シグマシート上のサンプルファイル既知、計算と構築のためのフォームを作成 両面 信頼区間任意の サンプル与えられた σ と 重要性のレベル.

CONFIDENCE.NORM() 関数

値が サンプル範囲内にあります B20:B79 、A 重要なレベル 0.05に等しい。 次に、MS EXCEL の式:
=AVERAGE(B20:B79)-CONFIDENCE.NORM(0.05;σ; COUNT(B20:B79))
左の境界線を返します 信頼区間.

同じ制限は次の式を使用して計算できます。
=AVERAGE(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

注記: CONFIDENCE.NORM() 関数は MS EXCEL 2010 で登場しました。MS EXCEL の以前のバージョンでは、TRUST() 関数が使用されていました。

この記事では次のことを学びます:

    どうしたの 信頼区間?

    ポイントは何ですか 3 シグマの法則?

    この知識を実際にどのように適用できるでしょうか?

現在、多種多様な製品、販売方向、従業員、活動分野などに関連する情報が過剰に存在しているため、 重要なことを強調するのは難しいかもしれません、まず第一に、これに注意を払い、管理する努力をする価値があります。 意味 信頼区間そしてその限界を超えた実際の値の分析 - 技術 状況を強調するのに役立ちます, 変化するトレンドに影響を与える。ポジティブな要素を開発し、ネガティブな要素の影響を軽減できるようになります。 このテクノロジーは多くの有名な世界的企業で使用されています。

いわゆる「」があります。 アラート」、 どれの マネージャーに知らせる次の値が特定の方向にあること 超えた 信頼区間。 これはどういう意味ですか? これは、既存の傾向をこの方向に変える可能性のある、何らかの異常な出来事が発生したことを示しています。 これは信号ですそれに対して を解決する状況を把握し、何が影響したのかを理解します。

たとえば、いくつかの状況を考えてみましょう。 2011 年の月ごとの 100 製品アイテムの予測制限と 3 月の実際の売上高を計算して、売上予測を計算しました。

  1. 「ひまわり油」については、予測の上限を突破し、信頼区間に収まりませんでした。
  2. 「ドライイースト」は予想の下限を上回りました。
  3. 「オートミール粥」が上限突破しました。

その他の製品については、実際の売上高は所定の予測範囲内にありました。 それらの。 彼らの売上は予想の範囲内でした。 そこで、私たちは国境を越える 3 つの製品を特定し、何がそれらに国境を越える影響を与えたのかを把握し始めました。

  1. ひまわり油については、新たな販売網に参入したことにより販売量が増加し、上限を超える結果となりました。 この製品については、このネットワークの販売予測を考慮して、年末までの予測を再計算する価値があります。
  2. 「ドライイースト」は税関で車が詰まり、5日以内に品薄となり、売上減少に影響し下限値を超えた。 原因を突き止めて、この状況を繰り返さないように努めることは価値があるかもしれません。
  3. 「オートミールポリッジ」の販売促進イベントを実施したことにより売上が大幅に増加し、計画を上回りました。

予測限界を超えることに影響を与える 3 つの要因を特定しました。 予測と計画の精度を高めるために、実際の売上が予測を上回る可能性があるという事実につながる要因を強調し、それらの予測と計画を個別に構築することは価値があります。 次に、主要な売上予測への影響を検討します。 これらの要因の影響を定期的に評価し、状況をより良い方向に変えることもできます。 ネガティブな要因の影響を減らし、ポジティブな要因の影響を増やすことによって.

信頼区間を使用すると、次のことが可能になります。

  1. ルートを選択してください、これは注目に値します。 これらの方向で影響を与える可能性のあるイベントが発生しました トレンドの変化.
  2. 要因を特定する、それは状況の変化に大きな影響を与えます。
  3. 受け入れる 情報に基づいた決定(例: 購入、計画など)。

ここで、例を使用して信頼区間とは何か、Excel で信頼区間を計算する方法を見てみましょう。

信頼区間とは何ですか?

信頼区間は予測の境界 (上限と下限) であり、その範囲内では 与えられた確率 (シグマ)実際の値が表示されます。

それらの。 当社は予測を計算します - これが当社の主なガイドラインですが、実際の値が当社の予測と 100% 一致する可能性は低いことを理解しています。 そして疑問が生じます、 どの範囲内で実際の値は下がる可能性がありますが、 現在の傾向が続く場合? この質問は答えに役立ちます 信頼区間の計算、つまり - 予測の上限と下限。

与えられた確率シグマとは何ですか?

計算するときできる信頼区間 確率を設定する ヒット実際の値 与えられた予測限界内で。 どうやってするの? これを行うには、シグマの値を設定し、シグマが以下に等しい場合は次のようにします。

    3シグマ- その場合、次の実際の値が信頼区間に入る確率は 99.7%、つまり 300 対 1 になります。または、境界を超える確率は 0.3% です。

    2シグマ- その場合、次の値が境界内に収まる確率は ≈ 95.5%、つまり オッズは約 20 対 1、つまり 4.5% の確率でオーバーアウトする可能性があります。

    1シグマ- その場合、確率は ≈ 68.3%、つまり オッズは約 2 対 1、つまり、次の値が信頼区間の外に入る確率は 31.7% です。

私たちは策定しました 3シグマの法則、それはそれを言う 命中確率別のランダムな値 信頼区間に入れる与えられた値で スリーシグマは99.7%.

ロシアの偉大な数学者チェビシェフは、3 シグマの与えられた値で予測限界を超える確率が 10% であるという定理を証明しました。 それらの。 3 シグマ信頼区間内に収まる確率は少なくとも 90% ですが、予測とその境界を「目で」計算しようとすると、はるかに重大なエラーが発生します。

Excel で信頼区間を自分で計算するにはどうすればよいですか?

例を使用して、Excel での信頼区間 (つまり、予測の上限と下限) の計算を見てみましょう。 5 年間の月ごとの売上という時系列があります。 添付ファイルを参照してください。

予測限界を計算するには、次のように計算します。

  1. 販売予測().
  2. シグマ - 標準偏差実際の値からモデルを予測します。
  3. スリーシグマ。
  4. 信頼区間。

1. 売上予測。

=(RC[-14] (時系列データ)- ラジコン[-1] (型式値))^2(二乗)


3. 月ごとに、ステージ 8 からの偏差値 Sum((Xi-Ximod)^2) を合計しましょう。 1月、2月…を各年ごとにまとめてみましょう。

これを行うには、数式 =SUMIF() を使用します。

SUMIF(サイクル内の期間番号を含む配列 (1 から 12 までの月)、サイクル内の期間番号へのリンク、ソース データと期間値の差の 2 乗を含む配列へのリンク)


4. 1 から 12 までのサイクルの各期間の標準偏差を計算します (ステージ 10) 添付ファイルにある).

これを行うには、ステージ 9 で計算された値から根を抽出し、このサイクルの期間の数から 1 を引いた値で割ります = SQRT((Sum(Xi-Ximod)^2/(n-1))

Excelの数式を使ってみましょう =ROOT(R8 ((Sum(Xi-Ximod)^2 へのリンク)/(COUNTIF($O$8:$O$67 (サイクル番号を含む配列へのリンク); O8 (配列内でカウントされる特定のサイクル番号へのリンク))-1))

Excel の数式 = COUNTIF を使用する数nを数えます


予測モデルから実際のデータの標準偏差を計算し、各月のシグマ値を取得しました - ステージ 10 添付ファイルにあります。

3. 3 シグマを計算してみましょう。

ステージ 11 で、シグマの数を設定します。この例では「3」です (ステージ 11 添付ファイルにある):

シグマ値の練習にも便利です。

1.64 シグマ - 制限を超える確率が 10% (10 分の 1)。

1.96 シグマ - 限界を超える確率は 5% (20 分の 1)。

2.6 シグマ - 制限を超える確率は 1% (100 分の 1)。

5) スリーシグマの計算, このために、各月の「シグマ」値に「3」を掛けます。

3. 信頼区間を決定します。

  1. 予測上限- 成長と季節性 + (プラス) 3 シグマを考慮した売上予測。
  2. 予測下限値- 成長と季節性を考慮した売上予測 - (マイナス) 3 シグマ。

長期間の信頼区間を計算するのに便利なように (添付ファイルを参照)、Excel の式を使用します。 =Y8+VLOOKUP(W8,$U$8:$V$19,2,0)、 どこ

Y8- 販売予測;

W8- 3 シグマ値を取得する月の番号。

それらの。 予測上限= 「売上予測」 + 「3 シグマ」 (例では、VLOOKUP(月番号; 3 シグマ値を含むテーブル; 対応する行の月番号に等しいシグマ値を抽出する列; 0))。

予測下限値=「売上予測」マイナス「3シグマ」。

そこで、Excel で信頼区間を計算しました。

これで、予測と、実際の値が所定のシグマ確率に該当する範囲の境界が得られました。

この記事では、シグマとスリーシグマ ルールとは何か、信頼区間を決定する方法、およびこの手法が実際に使用できる理由について説明しました。

正確な予測と成功を祈っています。

どうやって Forecast4AC PRO がお手伝いします信頼区間を計算するとき?:

    Forecast4AC PRO は、1000 を超える時系列の予測の上限または下限を同時に自動的に計算します。

    キーストローク 1 回でチャート上の予測、傾向、実際の売上高と比較して予測の境界を分析する機能。

Forcast4AC PRO プログラムでは、シグマ値を 1 から 3 まで設定できます。

参加しませんか!

無料の予測およびビジネス分析アプリをダウンロード:


  • Novo Forecast Lite- 自動 予測計算 V エクセル.
  • 4アナリティクス - ABC-XYZ分析および排出ガス分析 エクセル。
  • Qlik Senseデスクトップ と QlikViewPersonal Edition - データ分析と視覚化のための BI システム。

有料ソリューションの機能をテストします。

  • ノボ・フォーキャスト・プロ- 大規模なデータセットに対する Excel での予測。

周波数と分数の信頼区間

© 2008

国立公衆衛生研究所、オスロ、ノルウェー

この記事では、Wald、Wilson、Clopper - Pearson 法、角度変換、および Agresti - Coull 補正を備えた Wald 法を使用した、周波数と比率の信頼区間の計算について説明および説明します。 提示された資料は、頻度と割合の信頼区間を計算する方法に関する一般的な情報を提供し、ジャーナルの読者が自分の研究結果を発表するときに信頼区間を使用することだけでなく、作業を開始する前に専門文献を読むことにも興味を喚起することを目的としています。今後の出版物について。

キーワード: 信頼区間、頻度、割合

以前の出版物の 1 つでは、質的データの説明について簡単に言及し、母集団における研究対象の特性の発生頻度を説明するには、点推定よりも区間推定の方が好ましいと報告しました。 実際、調査はサンプルデータを使用して行われるため、結果の母集団への投影にはサンプリングの不正確さの要素が含まれているはずです。 信頼区間は、推定されるパラメーターの精度の尺度です。 興味深いことに、医師向けの基本統計に関する書籍によっては、度数の信頼区間の話題が完全に無視されていることがあります。 この記事では、頻度の信頼区間を計算するいくつかの方法を見ていき、非反復性や代表性、観測値相互の独立性などのサンプル特性を暗示します。 この記事では、頻度は、特定の値が合計で何回発生するかを示す絶対数としてではなく、研究対象の特性が発生する研究参加者の割合を決定する相対値として理解されます。

生物医学研究では、95% 信頼区間が最も一般的に使用されます。 この信頼区間は、真の割合が 95% の範囲内に収まる領域です。 言い換えれば、母集団における形質の出現頻度の真の値は 95% の信頼区間内にあると 95% の信頼性で言えます。

医学研究者向けの統計マニュアルのほとんどは、周波数誤差が次の式を使用して計算されると報告しています。

ここで、p はサンプル内の特性の出現頻度 (0 から 1 までの値) です。 国内の科学論文のほとんどは、サンプル内の形質の出現頻度 (p) とその誤差 (s) を p ± s の形式で示します。 ただし、集団における形質の出現頻度について 95% 信頼区間を提示する方が適切です。これには、以下の値が含まれます。

前に。

一部のマニュアルでは、サンプルが小さい場合、1.96 の値を N – 1 自由度の t の値に置き換えることを推奨しています。ここで、N はサンプル内の観測値の数です。 t 値は、ほぼすべての統計学の教科書に記載されている t 分布の表から求められます。 Wald 法での t 分布の使用には、以下で説明する他の方法と比べて目に見える利点がないため、一部の著者は推奨していません。

度数または比率の信頼区間を計算するための上記の方法は、1939 年の Wald と Wolfowitz の出版後に広く使用され始めたため、Abraham Wald (1902 ~ 1950 年) にちなんで Wald と名付けられました。 ただし、この方法自体は 1812 年にピエール シモン ラプラス (1749 ~ 1827) によって提案されました。

Wald 法は非常に人気がありますが、その適用には重大な問題が伴います。 この方法は、サンプル サイズが小さい場合や、特性の発生頻度が 0 または 1 (0% または 100%) になる傾向があり、0 と 1 の頻度では単純に不可能な場合にはお勧めできません。誤差を計算するときに使用される正規分布の近似は、n · p の場合には「機能しません」。< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

新しい変数は正規分布しているため、変数 φ の 95% 信頼区間の下限と上限は φ-1.96 および φ+1.96left">

小さなサンプルの場合は 1.96 の代わりに、N – 1 自由度の t 値を代用することをお勧めします。 この方法では負の値が生成されず、Wald 法よりも周波数の信頼区間をより正確に推定できます。 また、国内の多くの医療統計参考書にも記載されていますが、医学研究における普及には至っていません。 角度変換を使用した信頼区間の計算は、周波数が 0 または 1 に近づく場合には推奨されません。

医学研究者向けの統計学の基礎に関するほとんどの書籍では、信頼区間の推定方法の説明はここで終わることが多く、この問題は国内だけでなく海外の文献でもよく見られます。 どちらの方法も中心極限定理に基づいており、サンプルが大きいことを意味します。

上記の方法を使用した信頼区間の推定の欠点を考慮して、Clopper と Pearson は 1934 年に、研究対象の形質の二項分布を考慮して、いわゆる正確な信頼区間を計算する方法を提案しました。 この方法は多くのオンライン計算機で利用できますが、この方法で得られる信頼区間はほとんどの場合広すぎます。 同時に、この方法は保守的な評価が必要な場合の使用をお勧めします。 サンプルサイズが減少するにつれて、特に N の場合、方法の保守性の度合いは増加します。< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

多くの統計学者によると、頻度の信頼区間の最適な評価は、1927 年に提案されたウィルソン法によって実行されますが、国内の生物医学研究では実際には使用されていません。 この方法では、非常に小さい周波数と非常に大きい周波数の両方の信頼区間を推定できるだけでなく、少数の観測値にも適用できます。 一般に、ウィルソンの公式による信頼区間は次の形式になります。



ここで、 は 95% 信頼区間を計算するときに値 1.96 をとり、N は観測値の数、p はサンプル内の特性の発生頻度です。 この方法はオンライン計算機で利用できるため、問題なく使用できます。 また、n p に対してこの方法を使用することはお勧めしません。< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Wilson 法に加えて、Agresti-Coll 補正を備えた Wald 法も、周波数の信頼区間の最適な推定値を提供すると考えられています。 Agresti-Coll 補正は、分子に 2 を加算し、分母に 4 を加算することを計算する際に、サンプル (p) における特性の発生頻度を Wald の公式で p` に置き換えることです。 p` = (X + 2) / (N + 4)、ここで、X は研究対象の特性を持つ研究参加者の数、N はサンプルサイズです。 この変更により、イベント頻度が 0% または 100% に近づき、サンプルが小さい場合を除いて、ウィルソンの式に非常に似た結果が得られます。 周波数の信頼区間を計算するための上記の方法に加えて、小さなサンプルに対する Wald 法と Wilson 法の両方に対して連続性補正が提案されていますが、それらの使用は不適切であることが研究で示されています。

2 つの例を使用して、信頼区間を計算するための上記の方法の適用を考えてみましょう。 最初のケースでは、ランダムに選択された 1,000 人の研究参加者から成る大規模なサンプルを研究します。そのうち 450 人が研究対象の特性 (これは危険因子、結果、またはその他の特性である可能性があります) を持っており、頻度は 0.45、つまり 45 です。 %。 2 番目のケースでは、研究は少数のサンプル、たとえばわずか 20 人を使用して実行され、研究対象の特性を持つ研究参加者は 1 人 (5%) だけです。 Wald 法、Agresti-Coll 補正を使用した Wald 法、および Wilson 法を使用した信頼区間は、Jeff Sauro によって開発されたオンライン計算機 (http://www./wald.htm) を使用して計算されました。 ウィルソンの連続性補正信頼区間は、Wassar Stats: 統計計算の Web サイト (http://faculty.vassar.edu/lowry/prop1.html) によって提供される計算機を使用して計算されました。 角度フィッシャー変換計算は、それぞれ 19 および 999 自由度の臨界 t 値を使用して手動で実行されました。 両方の例の計算結果を表に示します。

本文で説明されている 2 つの例について、6 つの異なる方法で計算された信頼区間

信頼区間の計算方法

P=0.0500、または 5%

X=450、N=1000、P=0.4500、または 45% の 95% CI

–0,0455–0,2541

アグレスティ=コル補正を施したヴァルト

<,0001–0,2541

連続性補正付きウィルソン

クロッパー・ピアソンの「正確な方法」

角度変換

<0,0001–0,1967

表からわかるように、最初の例では、「一般的に受け入れられている」Wald 法を使用して計算された信頼区間は負の領域に入りますが、頻度の場合はこのようなことはあり得ません。 残念なことに、ロシア文学ではこのような事件は珍しいことではない。 頻度とその誤差に関してデータを表現する従来の方法では、この問題が部分的に隠蔽されます。 たとえば、ある形質の発生頻度(パーセンテージ)が 2.1 ± 1.4 と示されている場合、これは 2.1%(95% CI: -0.7; 4.9)ほど「目に不快」ではありませんが、同じこと。 Agresti-Coll 補正と角度変換を使用した計算を備えた Wald 法では、ゼロに近づく下限が得られます。 ウィルソンの連続性補正方法と「正確な方法」では、ウィルソンの方法よりも広い信頼区間が生成されます。 2 番目の例では、すべての方法でほぼ同じ信頼区間が得られます (違いは 1000 分の 1 でのみ表示されます)。この例のイベントの発生頻度は 50% とそれほど変わらず、サンプル サイズは次のとおりであるため、これは驚くべきことではありません。かなり大きい。

この問題に興味のある読者には、R. G. Newcombe と Brown、Cai と Dasgupta の著作をお勧めします。これらの著作では、信頼区間を計算するためにそれぞれ 7 種類と 10 種類の異なる方法を使用する場合の長所と短所が示されています。 国内のマニュアルの中では、理論の詳細な説明に加えて、Wald と Wilson の方法、二項頻度分布を考慮した信頼区間の計算方法が紹介されている、およびという本をお勧めします。 無料のオンライン計算ツール (http://www./wald.htm および http://faculty.vassar.edu/lowry/prop1.html) に加えて、度数の信頼区間 (それだけではありません!) は、 CIA プログラム (信頼区間分析)。http://www からダウンロードできます。 医大。 ソトン。 交流。 英国/シア/ 。

次の記事では、定性データを比較する単変量の方法について説明します。

参考文献

バネルジ A.明確な言語での医療統計: 入門コース / A. Banerjee。 – M.: 実践医学、2007. – 287 p. 医療統計 / 。 – M.: Medical Information Agency、2007. – 475 p. グランツ S.医学および生物学的統計 / S. Glanz。 – M.: プラクティカ、1998 年。 データの種類、分布テスト、記述統計 // 人間の生態学 – 2008. – No. 1. – P. 52–58. ジジン K.S.。 医療統計: 教科書 / 。 – ロストフ n/d: フェニックス、2007. – 160 p. 応用医療統計 / 、 。 - サンクトペテルブルク。 : Foliot、2003. – 428 p. レイキン G.F。 生体認証 / 。 – M.: 高校、1990年。 – 350 p. メディック V.A。 医学における数学的統計 / 、 。 – M.: 財務と統計、2007. – 798 p. 臨床研究における数学的統計 / 、 。 – M.: GEOTAR-MED、2001. – 256 p. ユンケロフ 5 世. そして。 医学研究データの医学的および統計的処理 / 、 。 - サンクトペテルブルク。 : VmedA、2002. – 266 p. アグレスティ A.二項比率の区間推定では、正確より近似の方が優れています / A. アグレスティ、B. クール // アメリカの統計学者。 – 1998. – N 52. – P. 119–126。 アルトマン D.信頼できる統計 // D. Altman、D. Machinen、T. Bryant、M. J. Gardner。 – ロンドン: BMJ Books、2000. – 240 p. ブラウン L.D.二項比率の区間推定 / L. D. Brown、T. T. Cai、A. Dasgupta // 統計科学。 – 2001. – N 2. – P. 101–133。 クロッパー C.J.二項分布の場合に示される信頼限界または基準限界の使用 / C. J. Clopper、E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413。 ガルシア ペレス M.A。 二項パラメータの信頼区間について / M. A. Garcia-Perez // 質と量。 – 2005. – N 39. – P. 467–481。 モトゥルスキー H.直感的な生物統計学 // H. Motulsky。 – オックスフォード: オックスフォード大学出版局、1995。 – 386 p. ニューカム R.G.単一比率の両側信頼区間: 7 つの方法の比較 / R. G. Newcombe // Statistics in Medicine. – 1998. – N. 17. – P. 857–872。 サウロ J.二項信頼区間を使用した小さなサンプルからの完了率の推定: 比較と推奨事項 / J. Sauro、J. R. Lewis // ヒューマンファクターおよび人間工学学会年次総会の議事録。 – フロリダ州オーランド、2005 年。 ヴァルド A.連続分布関数の信頼限界 // A. Wald、J. Wolfovitz // 数学統計年報。 – 1939. – N 10. – P. 105–118。 ウィルソン E.B.。 確率的推論、継承の法則、および統計的推論 / E. B. ウィルソン // 米国統計協会ジャーナル。 – 1927. – N 22. – P. 209–212。

割合の信頼区間

A. M. グリボフスキー

国立公衆衛生研究所、オスロ、ノルウェー

この記事では、二項比例の信頼区間を計算するためのいくつかの方法、つまり、Wald 法、Wilson 法、arcsine 法、Agresti-Coull 法、および正確な Clopper-Pearson 法を紹介します。 この論文は、二項比率の信頼区間推定の問題について一般的な紹介をしているだけであり、その目的は、読者が自身の実証研究の結果を提示する際に信頼区間を使用するよう刺激するだけでなく、統計の本を参照するよう奨励することです。自分のデータを分析して原稿を準備する前に。

キーワード: 信頼区間、割合

連絡先:

ノルウェー、オスロの国立公衆衛生研究所上級顧問

前のサブセクションでは、未知のパラメータを推定する問題について検討しました。 1 つの数字。 これは「点」推定と呼ばれます。 多くのタスクでは、パラメータを見つけるだけでなく、 適切な数値を設定するだけでなく、その精度と信頼性を評価することもできます。 パラメータの置換によってどのようなエラーが発生する可能性があるかを知る必要があります その推定点 そして、これらの誤差が既知の制限を超えないことはどの程度の信頼度で期待できるのでしょうか?

この種の問題は、点推定が行われる場合、少数の観測値に特に関連します。 そしてではほとんどがランダムであり、a を a に近似的に置き換えると、重大なエラーが発生する可能性があります。

見積もりの​​正確性と信頼性を把握するため ,

数学的統計では、いわゆる信頼区間と信頼確率が使用されます。

パラメータを見てみましょう 経験から得られた不偏推定値 A.この場合に起こり得る誤差を推定したいと考えています。 確率 p のイベントが実質的に信頼できるとみなせるように、十分に大きな確率 p (たとえば、p = 0.9、0.95、または 0.99) を割り当てて、次の値 s を見つけてみましょう。

次に、交換中に発生する誤差の実際に起こり得る値の範囲 の上 、±sになります。 絶対値における大きな誤差は、低い確率 a = 1 - p でのみ発生します。 (14.3.1) を次のように書き換えてみましょう。

等式 (14.3.2) は、確率 p でパラメータの未知の値が得られることを意味します。 間隔内に収まる

1 つの状況に注意する必要があります。 これまで、ランダム変数が特定の非ランダム区間に該当する確率を繰り返し検討してきました。 ここでは状況が異なります。 はランダムではありませんが、間隔 / p はランダムです。 X 軸上の位置はランダムであり、中心によって決まります。 ; 一般に、s の値は原則として実験データから計算されるため、間隔 2s の長さもランダムです。 したがって、この場合、p 値をポイントに「当たる」確率として解釈するのではなく、 間隔 / p 内で、ランダムな間隔 / p が点をカバーする確率として (図14.3.1)。

米。 14.3.1

確率 p は通常、 信頼確率、および間隔 / p - 信頼区間。間隔の境界 もし。 a x =a-a 2 = a +そして呼ばれます 信頼の境界線。

信頼区間の概念に別の解釈を加えてみましょう。信頼区間はパラメータ値の区間と考えることができます。 あ、実験データと互換性があり、矛盾しないこと。 確かに、確率 a = 1-p のイベントを考えることに同意すると、実際には不可能になります。その場合、パラメータ a の値は、 ああ> s は矛盾する実験データとして認識されなければなりません。また、 |a - あたな 2 。

パラメータを見てみましょう 不偏推定値がある A.量の分布の法則を知っていたら の場合、信頼区間を見つけるタスクは非常に簡単です。次の値 s を見つけるだけで十分です。

問題は、推定値の分布の法則です。 量の分布法則に依存する バツしたがって、その未知のパラメーター (特にパラメーター自体) A)。

この問題を回避するには、次のおおよその近似手法を使用できます。s の式内の未知のパラメーターを点推定値に置き換えます。 比較的多くの実験を行った結果、 P(約 20...30) この手法では通常、精度の点で満足のいく結果が得られます。

例として、数学的期待値の信頼区間の問題を考えてみましょう。

生産させてください P バツ、その特性は数学的期待値です Tと分散 D- 未知。 これらのパラメータについて次の推定値が得られました。

数学的期待の信頼確率 p に対応する信頼区間 / p を構築する必要があります。 Tバツ。

この問題を解くとき、量が次のとおりであるという事実を利用します。 T合計を表します P独立した同一分布の確率変数 X時間そして中心極限定理によれば、十分に大きい場合、 Pその分布則は正常に近いです。 実際には、項の数が比較的少ない場合 (約 10 ~ 20)、合計の分布法則はほぼ正規であると考えることができます。 値を仮定します T通常の法律に従って配布されます。 この法則の特性、つまり数学的な期待値と分散はそれぞれ等しい Tそして

(第 13 章、サブセクション 13.3 を参照)。 値を仮定しましょう D私たちは値 Ep を知っており、それを見つけるつもりです。

第6章の式(6.3.5)を用いて、(14.3.5)の左辺の確率を正規分布関数で表現します。

推定値の標準偏差はどこですか T.

式から

Sp の値を求めます。

ここで、arg Ф* (х) は Ф* の逆関数です。 (バツ)、それらの。 正規分布関数が次と等しい引数の値 バツ。

分散 D、それを通して量が表現される 1P、正確にはわかりません。 おおよその値として、推定値を使用できます。 D(14.3.4) そしておよそ次のように入力します。

したがって、信頼区間を構築する問題はほぼ解決され、次のようになります。

ここで、gp は式 (14.3.7) によって決定されます。

s p を計算するときに関数 Ф* (l) のテーブルでの逆補間を回避するには、量の値を与える特別なテーブル (表 14.3.1) をコンパイルすると便利です。

rに応じて。 値 (p は、正規法則において、結果の領域に入る確率が p に等しくなるように、分散の中心から左右にプロットする必要がある標準偏差の数を決定します。

値 7 p を使用すると、信頼区間は次のように表されます。

表14.3.1

例 1. 量に関して 20 の実験が行われました。 バツ;結果を表に示します。 14.3.2.

表14.3.2

数量の数学的期待から推定値を見つけることが必要です バツそして、信頼確率 p = 0.8 に対応する信頼区間を構築します。

解決。我々は持っています:

参照点として l: = 10 を選択し、3 番目の式 (14.2.14) を使用して不偏推定値を求めます。 D :

表によると 14.3.1 私たちが見つけたもの

信頼限界:

信頼区間:

パラメータ値 Tさんこの間隔内にあるものは、表に示した実験データと一致します。 14.3.2.

分散の信頼区間も同様の方法で構築できます。

生産させてください P確率変数に関する独立した実験 バツ A と分散の両方のパラメータが不明 D不偏推定値が得られました。

分散の信頼区間を近似的に構築する必要があります。

式 (14.3.11) から、次の量が明らかです。 Dを表します

Pの形式の確率変数。 これらの値はそうではありません

それらのいずれかに数量が含まれるため、独立しています。 Tさん他の人に依存しています。 ただし、増加するにつれて、 Pそれらの合計の分布法則も正規に近づきます。 もうすぐ P= 20...30 はすでに正常であると考えられます。

これがそうだと仮定して、この法則の特徴である数学的期待値と分散を見つけてみましょう。 評価以来 D- 偏見のないものであれば M[D] = D。

分散の計算 D Dは比較的複雑な計算に関連付けられているため、導出せずにその式を示します。

ここで、q 4 は大きさの 4 番目の中心モーメントです。 バツ。

この式を使用するには、\u003d 4 と 4 の値を置き換える必要があります。 D(少なくとも近いものは)。 の代わりに D彼の評価を利用することができます D.原則として、4 番目の中心モーメントは、次の形式の値などの推定値で置き換えることもできます。

しかし、一般に限られた数の実験では高次モーメントが大きな誤差を伴って決定されるため、このような置き換えでは精度が非常に低くなります。 しかし、実際には、量分布の法則の種類によって次のようなことがよく起こります。 バツ事前にわかっています: パラメータのみが不明です。 次に、μ 4 を次のように表現してみることができます。 D.

最も一般的なケースを考えてみましょう。 バツ通常の法律に従って配布されます。 次に、その 4 番目の中心モーメントは分散の観点から表現されます (第 6 章、サブセクション 6.2 を参照)。

式 (14.3.12) は次のようになります。 または

(14.3.14) の不明な部分を置き換える D彼の評価 D、どこから得られますか

モーメントμ 4 は次のように表すことができます。 D他の場合でも、値の分布が バツは正常ではありませんが、その外観は知られています。 たとえば、一様密度の法則 (第 5 章を参照) については、次のようになります。

ここで、(a, P) は、法則が指定される間隔です。

したがって、

式 (14.3.12) を使用すると、次のようになります。 およそどこで見つけますか

数量 26 の分配法則の種類が不明な場合でも、値 a/) の近似推定を行うときは、この法則を信じる特別な理由がない限り、式 (14.3.16) を使用することをお勧めします。正常なものとは大きく異なります (顕著な正または負の尖度があります)。

近似値 a/) が何らかの方法で得られた場合、数学的期待に対して構築したのと同じ方法で分散の信頼区間を構築できます。

ここで、与えられた確率 p に応じた値はテーブルに従って求められます。 14.3.1.

例 2. 確率変数の分散の約 80% 信頼区間を求める バツ例 1 の条件下で、値が既知である場合 バツ通常に近い法律に従って配布されています。

解決。値は表と同じままです。 14.3.1:

式(14.3.16)によると

式 (14.3.18) を使用して信頼区間を求めます。

標準偏差値の対応する範囲: (0.21; 0.29)。

14.4. 正規法則に従って分布する確率変数のパラメータの信頼区間を構築するための正確な方法

前のサブセクションでは、数学的な期待値と分散の信頼区間を構築するための大まかな近似方法を検討しました。 ここでは、同じ問題を解決するための正確な方法のアイデアを示します。 信頼区間を正確に求めるためには、量の分布法則の形式を事前に知ることが絶対に必要であることを強調します。 バツ、一方、近似法の適用ではこれは必要ありません。

信頼区間を構築するための正確な方法の考え方は、次のようになります。 信頼区間は、特定の不等式を満たす確率を表す条件から求められます。これには、関心のある推定値が含まれます。 A.評価分布の法則 一般的な場合、量の未知のパラメータに依存します バツ。ただし、確率変数から不等式を渡すことができる場合があります。 観測値の他の関数に XpX2、 ..., ×p.その分布法則は未知のパラメータには依存せず、実験の数と量の分布法則の種類にのみ依存します。 バツ。これらの種類の確率変数は、数学的統計において重要な役割を果たします。 それらは量の正規分布の場合について最も詳細に研究されています。 バツ。

たとえば、値の正規分布では、 バツランダムな値

いわゆるものに従います 学生分配法P- 1 自由度; この法則の密度は次のような形になります。

ここで、G(x) は既知のガンマ関数です。

確率変数が

には「%2 ディストリビューション」があります P- 1 自由度 (第 7 章を​​参照)、その密度は次の式で表されます。

分布 (14.4.2) と (14.4.4) の導出にはこだわらずに、パラメーターの信頼区間を構築するときにそれらをどのように適用できるかを示します。 Dさん

生産させてください P確率変数に関する独立した実験 バツ、パラメータが不明な正規分布 に。これらのパラメータについて、推定値が得られました。

信頼確率 p に対応する両方のパラメーターの信頼区間を構築する必要があります。

まず数学的期待値の信頼区間を構築しましょう。 この区間を次の点に対して対称にとるのが自然です。 T; s p が区間の長さの半分を表すものとします。 値 s p は条件が満たされるように選択する必要があります

確率変数から等式 (14.4.5) の左辺に移動してみます。 T確率変数に Tさん学生法に従って配布されます。 これを行うには、不等式 |m-w?| の両辺を掛けます。

正の値で指定すると: または、表記法 (14.4.1) を使用すると、

条件から値 / p が見つかるような数値 / p を見つけてみましょう

式 (14.4.2) から、(1) が偶関数であることは明らかです。したがって、(14.4.8) は次のようになります。

等式 (14.4.9) は、p に応じて値 / p を決定します。 整数値の表を自由に使える場合

/p の値はテーブル内の逆補間によって見つけることができます。 ただし、 /p 値のテーブルを事前に作成しておくと便利です。 このような表は付録 (表 5) に記載されています。 この表は、信頼水準 p と自由度の数に応じた値を示しています P- 1. 表から / p を決定します。 5と仮定すると

信頼区間の幅の半分 / p と区間自体を求めます。

例 1. 確率変数に対して 5 つの独立した実験を実行しました。 バツ、パラメータが不明な正規分布 Tそしてについて。 実験結果を表に示す。 14.4.1.

表14.4.1

評価を探す T数学的期待値に対して 90% 信頼区間 / p (つまり、信頼確率 p = 0.9 に対応する区間) を構築します。

解決。我々は持っています:

申請書の表5によると、 P - 1 = 4 および p = 0.9 が得られます。 どこ

信頼区間は次のようになります。

例 2. セクション 14.3 の例 1 の条件について、次の値を仮定します。 バツ正規分布している場合は、正確な信頼区間を見つけます。

解決。付録の表 5 によると、次のことがわかります。 P - 1 = 19ir =

0.8 / p = 1.328; ここから

セクション 14.3 の例 1 の解法 (e p = 0.072) と比較すると、その矛盾は非常にわずかであることがわかります。 小数点第 2 位までの精度を維持すると、正確な方法と近似的な方法で求められた信頼区間は一致します。

分散の信頼区間の構築に進みましょう。 不偏分散推定量を検討する

そして確率変数を表現します D大きさを通して V(14.4.3)、分布 x 2 (14.4.4) を持つ:

量の分布の法則を知る V、指定された確率 p で該当する区間 /(1) を見つけることができます。

分配の法則 kn_x(v)マグニチュード I 7 は図に示す形になります。 14.4.1.

米。 14.4.1

疑問が生じます: 間隔 / p をどのように選択するか? 大きさの分布の法則がある場合 V対称であった場合 (正規法則やスチューデント分布のように)、区間 /p が数学的期待に関して対称であると考えるのは自然です。 この場合、法律は k p_x (v)非対称。 値の確率が以下になるように間隔 /p を選択することに同意しましょう。 V左右の間隔を越えた部分(図 14.4.1 の斜線部分)は同じで等しい

このプロパティを使用して間隔 /p を構築するには、テーブルを使用します。 4 つのアプリケーション: 数字が含まれています や)そのような

価値のために V、 r 自由度の x 2 分布を持ちます。 私たちの場合には r = n- 1. 修正しましょう r = n- 1 を選択し、テーブルの対応する行を検索します。 4 2つの意味 ×2 - 1 つは確率に対応し、もう 1 つは確率に対応します。

価値観 2時にそして XL?間隔は y2、あなたの左手で、そして や〜右端。

ここで、区間 / p から、境界 D の分散に対する望ましい信頼区間 /| を見つけてみましょう。 D2、それは要点をカバーします D確率 p で:

点をカバーする区間 / (, = (?> ь А) を作成しましょう D値がその場合に限り V区間 /r に入ります。 間隔が

この条件を満たします。 確かに、不平等は、 は不等式と等価です

そしてこれらの不等式は確率 p で満たされます。 したがって、分散の信頼区間が求まり、式 (14.4.13) で表されます。

例 3. 値が既知の場合、サブセクション 14.3 の例 2 の条件の下で分散の信頼区間を求めます。 バツ通常配布されます。

解決。我々は持っています 。 付録の表 4 によると

で見つけます r = n - 1 = 19

式 (14.4.13) を使用して、分散の信頼区間を求めます。

標準偏差に対応する区間は (0.21; 0.32) です。 この間隔は、近似法を使用してセクション 14.3 の例 2 で得られた間隔 (0.21; 0.29) をわずかに超えるだけです。

  • 図 14.3.1 は、a に関して対称な信頼区間を考慮しています。 後で説明するように、一般に、これは必要ありません。