目次
はじめに
numpyはPythonで数値計算を行うための強力なライブラリです。統計解析では、データセットからさまざまな統計量を求める必要があります。この記事では、numpyの統計関数を使ってデータセットから平均値、中央値、標準偏差、および分散を求める方法について説明します。
平均値
データセットの平均値はその要素の合計を要素数で割ることで求められます。numpyのmean()
関数を使用すると簡単に平均値を求めることができます。
import numpy as np data = np.array([1, 2, 3, 4, 5]) mean_value = np.mean(data) print("平均値:", mean_value)
出力結果:
平均値: 3.0
中央値
データセットの中央値は、データを昇順または降順に並べたときに中央に位置する値です。numpyのmedian()
関数を使用して中央値を求めることができます。
import numpy as np data = np.array([1, 2, 3, 4, 5]) median_value = np.median(data) print("中央値:", median_value)
出力結果:
中央値: 3.0
標準偏差
標準偏差は、データのばらつき具合を表す指標です。numpyのstd()
関数を使用して標準偏差を求めることができます。
import numpy as np data = np.array([1, 2, 3, 4, 5]) std_value = np.std(data) print("標準偏差:", std_value)
出力結果:
標準偏差: 1.4142135623730951
分散
分散は、データのばらつき具合を表す指標であり、標準偏差の2乗として求めることができます。numpyのvar()
関数を使用して分散を求めることができます。
import numpy as np data = np.array([1, 2, 3, 4, 5]) var_value = np.var(data) print("分散:", var_value)
出力結果:
分散: 2.0
以上がnumpyの統計関数についての説明です。これらの関数を使うことで、データセットからさまざまな統計量を簡単に求めることができます。
参考リンク: - numpyドキュメンテーション