データの操作中にデータ値がどの程度密接にグループ化されているかを測定するさまざまな手法があります。平均偏差が最も一般的です。ほとんどの人は、学校で平均偏差計算機を使用して、すべてのデータ値を足し合わせ、セット内の項目数で割ることによって計算する方法を学びます。ただし、平均付近の平均偏差は、より複雑な計算です。この計算により、数値が平均にどれだけ近いかが決まります。これを見つけるには、データセットの平均を見つけ、その平均から各データポイントの差を見つけ、それらの差の平均を取ることで構成されます。
中心点からのデータ ポイントの絶対平均偏差は、絶対偏差です。平均点、中央値、最頻値、またはランダム点を中心点として使用できます。平均は軸としてよく使用されます。絶対平均偏差式は、データ セットの平均からのデータ ポイントの絶対偏差 (距離) の平均である平均絶対偏差 (MAD) を計算するために使用されます。中心傾向メトリックと比較して、平均偏差は系列内のすべてのデータ項目の分散を決定します。中央値または平均は、中心傾向の一般的な指標です。グループ化されたデータとグループ化されていないデータの両方の平均偏差を計算できます。
この記事では、グループ化されていないデータの絶対平均偏差を調べます。
平均偏差は?
中心傾向の尺度は平均偏差です。算術平均、中央値、またはモードを使用してそれを把握できます。これは、すべての観測値が平均して中央からどれだけ離れているかを示しています。これは絶対値であるため、負の符号を無視して、各偏差は絶対偏差です。さらに、平均の両側の偏差は同じでなければなりません。
グループ化されていないデータとは?
グループ化されたデータとグループ化されていないデータの主な違いは、グループ化されていないデータは構造化されておらず、ランダムな形式であることです。この種のデータは生データとも呼ばれますが、グループ化されたデータは、グループに配置されたデータ、または度数分布に従って分類されたデータです。クラス間隔は、これらのグループに付けられた名前です。
グループ化されていないデータは、各情報がそのままの形で表示される一種の分布です。たとえば、生徒の最後の 5 つのテスト結果は 65、94、85、77、および 80 です。このデータから範囲と平均偏差を推測することで、生徒の成績を結論付けることができます。
範囲とその偏差は?
範囲は、分布の最大値と最小値の差です。観測数に対する絶対分散値の合計は、技術的には平均偏差として定義されます。
グループ化されていないデータの絶対平均偏差を数式で計算する方法
サンプル平均は、グループ化されていないデータの平均偏差を計算するために使用されます。まず、分布 (データ セット) の各項目と平均値の差を絶対値で求めます。次に、正負の符号を無視して、データ コレクションの各数値から平均を引きます (すべてを正と見なします)。
最後に、すべての差の合計をサンプルの項目数で割ります。
平均偏差は、観測値または値の妥当な平均からの最終的な逸脱の平均です。適切な平均は、平均、中央値、または最頻値です。平均絶対偏差は別の名前です。今日のこの段落では、離散系列または連続系列の平均偏差式など、特定の重要な式について詳しく学習します。
使用する必要がある公式は次のとおりです:
ここで、X は観測値、y は母平均です。
N は、サンプル内の観測の総数です。 X は標本平均です。
文字 n は、サンプル内の観測数を示します。
グループ化されていないデータの絶対平均偏差を導き出すために従うべき手順
各データ値と平均の間の平均距離は、データ セットの平均絶対偏差 (MAD) です。データセットの分散の尺度は、平均絶対偏差です。平均絶対偏差は、データ セット内の値がどの程度「分散」しているかを示します。
グループ化されていないデータの平均偏差を計算するには、次の手順を使用します。
データ セットを構成する観測を許可する:データ セットを観測 x 1、x2、x 3 … … … で構成するとします。 .
ステップ i) 平均偏差の計算に使用される中心傾向の尺度を決定します。これを「a」とします。
ステップ ii) ステップで計算された中心傾向の尺度から、各観測値の絶対偏差を計算します。つまり、|x1−a|、|x2−a|、|x3−a|………..|xn−a |
ステップ iii) すべての絶対分散の平均を計算します。これにより、グループ化されていないデータの「a」付近の平均絶対偏差 (M.A.D.) が得られます。ここで、M.A.D (a) =∑ n i =| x i – a |/ n
平均値を尺度として使用する場合:
平均が中心傾向の尺度として使用される場合、上記の式は次のように書き換えることができます:
M.A.D(¯x)=∑ni=|xi–¯x|/n
¯x =平均
中央値を尺度として使用する場合:
中央値付近も同様です:
M.A.D(a) =∑ n i =| x i – M |/ n
M は中央値です。
これをよりよく理解するために、この例を見てみましょう:
- Arjun は、自分のギターのビデオをオンラインに投稿することを楽しんでいます。過去 5 つの動画が受け取った「いいね」の数は次のとおりです:10、15、15、17、18、21。絶対平均偏差を見つけるには、平均を計算する必要があります。
したがって、平均は次のようになります。データの合計は合計 96 の「いいね」であり、6 つの写真があります。
これは 96/6 =16 です。
各データ ポイントと平均値の間の距離を計算する必要があります。
<オール>次に、これらの数値を足し合わせて、データ ポイントの数で割ります:6 + 1 + 1 + 1 + 2 + 5 =16 / 6 =2.67
したがって、平均して、各写真は平均から 3 いいね! 離れていました。
まとめ:
絶対平均偏差は、計算が簡単で、一連の観測すべてに基づいており、データのさまざまな項目の分散または散布を示すため、一連のデータを理解して分析するための最良の方法の 1 つです。シリーズの極端なアイテムの値の影響を受けません。この記事で平均偏差について理解を深めていただければ幸いです。