[pandas][describe] 要約統計量を一括表示

Python in Excel 入門 - describe1 コアライブラリ
この記事は約3分で読めます。

pandas の describeメソッドを使って、要約統計量を取得するサンプルコードを紹介します。

2023年10月現在、Python in Excel は Microsoft 365 Insider Program のベータチャネルを選択することによって使用できるベータ版のExcelでのみ利用可能です。
ベータ版のExcelのインストール・初期設定方法は以下で詳しく紹介しています。

出力結果例

以下のような結果がスピルして表示されます。

Python in Excel 入門 - describe1

describeメソッドの構文

DataFrame.describe([percentiles, include, exclude]) 
戻り値Series or DataFrame
引数説明
percentiles
(任意)
List[float]出力に含めるパーセンタイル
0から1の間の数値をリストで指定する
デフォルトは [0.25, 0.5, 0.75](25、50、75パーセンタイルを返す)
include
(任意)
dtype計算対象とするデータ列の型
リストでの指定も可能
例)[object, bool] 、”all”
exclude
(任意)
dtype計算対象外のデータ列の型
リストでの指定も可能
例)[float, int]、”number”

dtypeとは、pandasで定義されている「データ型」のことです。

サンプルコード

サンプルデータ
データが150件、名称が「IrisDataSet2」のテーブルを使用して説明します。

Python in Excel 入門 - describe4
サンプルデータを取得する方法は、ここを展開してください。
サンプルデータを取得する手順
  • 1
    「数式」タブ→「Pythonの挿入」ボタン→「Pythonサンプルを試す」をクリック
    Python in Excel 入門 - sample1
  • 2
    Excelウィンドウ右側に表示されたペーンの「サンプルの挿入」をクリック
    Python in Excel 入門 - sample2
  • 3
    サンプルデータのシートが追加されます
    Python in Excel 入門 - sample3

引数なし

sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe() 

結果 要約統計量がスピルして表示されます。

Python in Excel 入門 - describe1

処理結果が表示されない場合は、Python出力の種類を「Excelの値」に変更してください。

Python in Excel 入門 - kihon7

引数 percentiles(出力に含めるパーセンタイルを指定)

sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe(percentiles=[0.2,0.8])

結果

Python in Excel 入門 - describe5

引数 include(処理対象列の型を指定)

sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe(include="all") # allとnumberは引用符で囲む

結果

Python in Excel 入門 - describe2

引数 exclude(処理対象外の列の型を指定)

sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe(exclude=float)

結果

Python in Excel 入門 - describe3

参考

コメント

タイトルとURLをコピーしました