[pandas][describe] 要約統計量を一括表示

pandas の describeメソッドを使って、要約統計量を取得するサンプルコードを紹介します。

2023年10月現在、Python in Excel は Microsoft 365 Insider Program のベータチャネルを選択することによって使用できるベータ版のExcelでのみ利用可能です。
ベータ版のExcelのインストール・初期設定方法は以下で詳しく紹介しています。

出力結果例

以下のような結果がスピルして表示されます。

DataFrame.describe([percentiles, include, exclude])

戻り値

Series or DataFrame

引数	型	説明
percentiles （任意）	List[float]	出力に含めるパーセンタイル 0から1の間の数値をリストで指定するデフォルトは [0.25, 0.5, 0.75]（25、50、75パーセンタイルを返す）
include （任意）	dtype	計算対象とするデータ列の型リストでの指定も可能例）[object, bool] 、”all”
exclude （任意）	dtype	計算対象外のデータ列の型リストでの指定も可能例）[float, int]、”number”

dtypeとは、pandasで定義されている「データ型」のことです。

サンプルデータ
データが150件、名称が「IrisDataSet2」のテーブルを使用して説明します。

サンプルデータを取得する方法は、ここを展開してください。

サンプルデータを取得する手順

Pythonの入力方法や出力種類、DataFrameの定義方法については、以下の記事で詳しく紹介しています。

sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe()

結果　要約統計量がスピルして表示されます。

処理結果が表示されない場合は、Python出力の種類を「Excelの値」に変更してください。

sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe(percentiles=[0.2,0.8])

結果

sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe(include="all") # allとnumberは引用符で囲む

結果

sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe(exclude=float)

結果