統計検定2級

【統計検定2級】公的統計

公的統計行政機関や地方公共団体、国際機関などの公的機関が作成・公表する統計です。厳格なルールのもと作成されて信頼性が高く、客観的な情報でもあります。各分野における公的統計は、重要な意思決定の土台となります。統計学活用の歴史統計学の活用の歴史...
統計検定2級

【統計検定2級】データソース

データソース何かを調査する際のデータソースとは、データの出所のことを言います。例えば、論文、ニュース、SNSの投稿などが該当します。他方、IT分野におけるデータソースは、システムが参照するデータベース的な意味合いが強いため、少しだけニュアン...
統計検定2級

【統計検定2級】ローレンツ曲線・ジニ係数

ローレンツ曲線ローレンツ曲線は、分布の不平等さを表すグラフです。平等であれば45°の直線を示しますが、不平等であるほど、下方に湾曲していきます。ここでは例として、架空の500世帯の月収について作成してみます。作成手順は、次のとおりです。①世...
統計検定2級

【統計検定2級】箱ひげ図

箱ひげ図箱ひげ図は、データの散らばりを視覚的に把握するための図です。その名の通り、箱(四角形)と、ひげ(直線)から成ります。データの散らばりは、分散、標準偏差、四分位数などで表されますが、箱ひげ図は、四分位数の散らばりを視覚化します。四分位...
統計検定2級

【統計検定2級】正規分布

正規分布正規分布は、最も一般的な確率分布で、多くの統計手法の前提ともなる重要な分布です。様々な場面で目にするので、統計学を学ぶ上で、避けては通れない分布と言えます。また、実際のデータでも正規分布に従うものが多くあるので、実用的でもあります。...
統計検定2級

【統計検定2級】中心極限定理

中心極限定理中心極限定理は、「母集団の分布の形状によらず、そこから抽出した標本の平均値は正規分布に従う。」という定理です。平均値算出時のデータ数(標本サイズ)は、大きいほど正規分布に従います。母集団が、平均μ、分散σ^2の確率分布に従う場合...
統計検定2級

【統計検定2級】相関係数

相関係数相関係数は、2変数間の線形関係の程度を表す係数です。相関係数の値の範囲は-1から+1で、符号が「+」であれば正の相関(片方が大きくなれば、他方も大きくなる関係)、符号が「-」であれば負の相関(片方が大きくなれば、他方は小さくなる関係...
統計検定2級

【統計検定2級】分散

分散分散は、データのバラツキ具合を表現する統計量です。データが、平均値から遠くまで散らばっているほど大きな値となります。後述の計算式からも分かるとおり、分散の単位は、元の単位の2乗になります。単位が変わると分かりづらいので、データの要約の際...
統計検定2級

【統計検定2級】標準偏差

標準偏差標準偏差は、データのバラツキ具合を表現する統計量です。データが、平均値から遠くまで散らばっているほど大きな値となります。標準偏差の求め方標準偏差の計算式は、次のとおりです。母集団の標準偏差(σ)も標本の標準偏差(s)も同様の式で算出...
統計検定2級

【統計検定2級】四分位範囲

四分位範囲は、第1四分位数から第3四分位数の範囲であり、値は、第3四分位数から第1四分位数を引いた値になります。まずは、四分位数について確認していきます。四分位数四分位数は、データを小さい順に並べてデータ数で四等分した時、境界部分に位置する...