>> 自然の科学 >  >> 地学

数学で平均を定義する

算術平均 一連の数値の合計は、その一連の数値の合計をそのセット内の要素の数で割った値に等しくなります。例として、セット S ={1, 3, 5, 7, 9} の場合、S の算術平均は (1+3+5+7+9)/5 =5 に等しくなります。

一連の数値の算術平均は、平均と呼ばれることがあります。 その数のセットの。一般に、一連の数値 S の算術平均の式は次のとおりです。

A =ΣS/n

ここで、∑S はそのセット内の数値と n の合計です そのセット内の要素の数です。

多くの基本的な数学的概念と同様に、人間が最初に算術平均の概念を使い始めた時期を正確に言うことは困難ですが、天文学データの観測誤差を減らす手段として古代の天文学者によって最初に開発された可能性があります。算術平均の概念の最初の正式な表現は 16 世紀に提供されましたが、歴史的なテキストは少なくとも紀元前 7 世紀にさかのぼります。一連の数値の平均を求める手法を参照してください。

平均、中央値、最頻値

算術平均の概念は、一連の数値の中央値と最頻値の概念と密接に関連しています。平均、中央値、最頻値はすべて、中心傾向の尺度と見なされます。 ある意味で、平均値、中央値、最頻値は、データセット内の情報を「要約」し、そのデータセットの「典型的な」値を与えるさまざまな方法と見なすことができます。

中央値

数値セットの中央値は、そのセットの中央に位置する要素と考えることができます。セットの中央値は、その要素よりも大きい要素と小さい要素が同量含まれる要素として定義されます。たとえば、セット S ={2, 4, 6, 8, 10, 12, 14} では、中央値は 8 です 8 より小さい 3 つの値 (2、4、および 6) がある一方で、8 より大きい 3 つの要素 (10、12、および 14) があるためです。したがって、8 はセットの 4 番目に大きく、4 番目に小さい要素です。

セットに奇数の数がある場合、中央値は、数値を最小から最大に並べたときにちょうど真ん中にある数値です。メンバーの数が均等なセットでは、単一の中心値はありません。このような場合、中央値は通常、最も中央にある 2 つの値の平均として計算されます。したがって、セット S ={1, 3, 5, 7, 9, 11} では、中央値は 2 つの中心値の平均 (5+7)/2 =6 です .

モード

数値セットのモードは、そのセットで最も頻繁に繰り返される要素に対応します。セット S ={1, 2, 2, 2, 3, 4, 7, 7} の場合、モードは 2 です 2 はセットの中で最も繰り返し発生する要素 (3 回) です。言い換えれば、セットのモードは、セットからランダムに選択した場合に得られる可能性が最も高い値です。セット内の要素の値の確率分布をグラフ化すると、モードはその分布の「ピーク」に対応します。

数値のセットが複数のモードを持つことは完全に可能です。セット S ={2, 2, 2, 4, 5, 6, 6, 6, 7, 7, 8} では、2 つのモードは 2 と 6 です これらの 2 つの要素は両方とも最も頻繁に繰り返されるためです。 2 つの異なるモードを持つセットは bimodal と呼ばれます . 2 つ以上の異なるモードを持つセットは マルチモーダルと呼ばれます .セット S ={12, 12, 15, 23, 23, 26, 27, 28, 28} には、12、23、および 28 の 3 つのモードがあるため、マルチモーダルです。

このモードの定義の結果として、空でない finite を持つことは不可能です。 モードなしで設定します。すべての要素が異なるセットでは、一見モードがないように見えるかもしれません。ただし、すべての要素が異なるセットは、実際にはマルチモーダルです。これは、各要素が異なるセットでは、すべて 各要素は同じ頻度 (つまり、1 回) で繰り返されるため、要素はモードです。集合 S ={1, 2, 3, 4, 5, 6} では、各要素が同じ頻度で繰り返されるため、すべての要素がモードです。ただし、実数の集合などの一部の無限集合には、明確に定義されたモードがありません。

さらに、モードの概念は、数値以外の文脈で意味のある中心傾向の数少ない尺度の 1 つです。たとえば、米国の姓のセットを取得すると、「Smith」がデータセットのモードであることがわかる場合があります。つまり、一連の米国の姓の中で、Smith は最も頻繁に使用される名前です。

平均値、中央値、最頻値をまとめて

これらの概念をすべて組み合わせると、ある数値セット S の平均値、中央値、最頻値を個別に求めることができます。S ={3, 7, 14, 14, 14, 14, 22, 22 36, 38, 56, 56, 63}.

  • 平均 セットの内、(3+7+14+14+14+14+22+22+36+38+56+56+63)/13 =27.62
  • 中央値 セットの中心値に等しい。この場合、中心値は 22 です 22 は 7 番目に大きく、7 番目に小さい要素です。
  • モード セットの中で最も頻繁に使用される要素であるため、この場合は 14 です。

したがって、セット S ={3, 7, 14, 14, 14, 14, 22, 22 36, 38, 56, 56, 63} の場合、平均、中央値、モード 27.62、22、 そして 14 、それぞれ。

多数のデータセットの場合、これらのメジャーの複数が一致する可能性があります。集合 S ={3, 3, 3, 3, 3, 3, 3} では、平均値、中央値、最頻値はすべて同じ値 3 です。

たとえば、上のグラフは、ベル カーブとも呼ばれるさまざまなガウス確率分布を表しています。 .正規分布は、クラス内の確率変数の予想される分布を表します。正規分布では、データセットの平均、中央値、最頻値はすべて同じです。確率分布のピークと一致する値。母集団における IQ スコアの分布、身長、血圧、標準化されたテストのスコアなど、多くのデータセットは正規分布の形をとっており、統計分析に役立つツールとなっています。

平均値、中央値、最頻値の使用

平均、中央値、最頻値は基本的な数学的概念であるため、これらが何らかの形で適用されない状況を見つけるのは困難です。

平均の使用

算術平均の最も一般的な用途の 1 つは、一定期間にわたるオブジェクトの平均速度を計算することです。時間の経過に伴うオブジェクトの速度が集合 {3, 7, 9, 15, 18, 20} であるとしましょう。個々の速度を合計し、要素の数で割ることによって、その時間のオブジェクトの平均速度を計算できます。したがって、この場合、平均速度は (3+7+9+15+18+20)/6 =12 m/s です .同様のプロセスを使用して、時間の経過に伴う物体の平均加速度を決定できます。一定期間にわたる個々の加速度値を合計することにより、その期間におけるオブジェクトの平均加速度を決定できます。

算術平均が使用されるもう 1 つのコンテキストは、国の 1 人あたりの国内総生産を計算するための経済学です。 1 人あたりの GDP は、人口の 1 人あたりの平均経済生産量の尺度です。一人当たりの GDP は、各個人の総経済生産高を合計し、個人の総数で割ることによって計算されます。仮想的な国に 5 人の個人がいて、各個人の経済生産量が集合 {$24,000, $36,000, $36,000, $49,000, $63,000} で与えられるとします。その人口の 1 人あたりの GDP は、(24,000+36,000+36,000+49,000+63,000)/5 =$ になります。 41,600 .通常、1 人あたりの GDP の計算値は、一定期間のインフレまたは金銭的価値を考慮して修正されます。

中央値の使用

中央値の最も一般的な用途は、異常に高い値または低い値によって算術平均がゆがめられる可能性がある場合に、セットの「典型的な」メンバーの特性を判断することです。年齢 S ={11, 13, 17, 22, 25, 92} の集合 S があるとします。これらの年齢の平均は (11+13+17+22+25+92)/6 =30 です。他の値。実際、30 歳以上のメンバーは 1 人だけであるため、平均年齢 30 歳をそのセットの代表と見なすべきではありません。この場合、そのセットの典型的なメンバーをより代表する値は中央値で、(17+22)/2 =19.5 です。 .

中央値が使用される場所の 1 つは、人口の平均所得の計算です。経済的不平等が大きい国では、他の人よりもはるかに高い所得を持つ個人の存在が平均計算をゆがめる可能性があります。このような場合、平均的な人の収入を決定するには、非常に高いまたは低い異常値によって歪められる可能性がある平均よりも、中央値の収入測定の方が適している可能性があります。

モードの使用

このモードの最も明白な用途は、ランダムに選択された要素がセットのどのメンバーである可能性が高いかを判断することです。モードはセット内で最も頻繁に発生する要素であるため、セットのランダムなメンバーはモード (またはモード) である可能性が最も高くなります。

中央値と同様に、最頻値は、平均値が異常に高い値または低い値によって歪められている場合に、データセットの「典型的な」メンバーを表すのに役立つメトリックです。セット S ={2, 2, 2, 2, 2, 2, 7, 18, 29, 54} では、平均計算は、セットの最後にあるより高い値によって歪められます。代わりに、セットの典型的なメンバーの指標としてモード 2 を使用できます。セットのランダムなメンバーは、そのセットのモードである可能性が最も高くなります。


  1. ポンペイを保存するために何が行われていますか?
  2. トコジラミは飛んだり、ジャンプしたり、かゆくなったりしますか?
  3. 砂漠の砂の色が違うのはなぜ?
  4. 中規模の動物集団に対する観光と人間の存在の影響
  5. 犬は猫よりも賢いですか?
  6. 蝉はどうしてこんなにうるさいの?