pandasのread_frameとdescribeでできることまとめ

pythonのライブラリpandasを使ってみたい、ということで導入してみました。本記事では、簡単な使い方をまとめていきたいと思います。

環境

  • Django: 3.0
  • Python: 3.6
  • django-pandas: 0.6.1

read_frame()

read_frameを使うことでDBから取得したデータをDataFrameという形式に変換することができます。

すると下記のように出力されます。

ではこのデータを分析してみましょう

describe()

describeメソッドでは8つの項目が出力されます。1つ1つ見てみましょう。

  • count: データの数
  • mean: 各項目の平均値
  • std: 各項目の標準偏差
  • min: 各項目の最低値
  • 25%: パーセンタイルの25%位置のデータ
  • 50%: パーセンタイルの50%位置のデータ
  • 75%: パーセンタイルの75%位置のデータ
  • max: 各項目の最大値

メソッド1つでこんな分析ができるのは便利ですね。

さらに、出力データを見てみると、数値データのみが分析対象になっていますね。自動的に文字列は分析対象から外れるようになっているようです。

以上、最後までお読みいただきありがとうございました。