pandas の describeメソッドを使って、要約統計量を取得するサンプルコードを紹介します。
出力結果例
以下のような結果がスピルして表示されます。
describeメソッドの構文
DataFrame.describe([percentiles, include, exclude])
戻り値 | Series or DataFrame |
引数 | 型 | 説明 |
---|---|---|
percentiles (任意) | List[float] | 出力に含めるパーセンタイル 0から1の間の数値をリストで指定する デフォルトは [0.25, 0.5, 0.75](25、50、75パーセンタイルを返す) |
include (任意) | dtype | 計算対象とするデータ列の型 リストでの指定も可能 例)[object, bool] 、”all” |
exclude (任意) | dtype | 計算対象外のデータ列の型 リストでの指定も可能 例)[float, int]、”number” |
サンプルコード
サンプルデータ
データが150件、名称が「IrisDataSet2」のテーブルを使用して説明します。
サンプルデータを取得する方法は、ここを展開してください。
サンプルデータを取得する手順
- 1「数式」タブ→「Pythonの挿入」ボタン→「Pythonサンプルを試す」をクリック
- 2Excelウィンドウ右側に表示されたペーンの「サンプルの挿入」をクリック
- 3サンプルデータのシートが追加されます
Pythonの入力方法や出力種類、DataFrameの定義方法については、以下の記事で詳しく紹介しています。
【超基本】Python in Excel の使い方とルール
Python in Excel の入力方法は難しくはありませんが、Excelのワークシート関数の入力の仕方とは少し勝手が違います。この記事では、Python in Excel の入力の仕方と出力の種類、計算順序やパフォーマンスを向上させるた...
[DataFrame] xl関数の指定方法いろいろ
この記事では、DataFrameの定義、xl関数の使い方や注意点について説明します。DataFrameを使うと、Excelのセル範囲や名前、テーブル、Power Queryのデータを Python in Excel で扱えるようになります。...
引数なし
sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe()
結果 要約統計量がスピルして表示されます。
処理結果が表示されない場合は、Python出力の種類を「Excelの値」に変更してください。
引数 percentiles(出力に含めるパーセンタイルを指定)
sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe(percentiles=[0.2,0.8])
結果
引数 include(処理対象列の型を指定)
sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe(include="all") # allとnumberは引用符で囲む
結果
引数 exclude(処理対象外の列の型を指定)
sample_df = xl("IrisDataSet2[#すべて]", headers=True)
sample_df.describe(exclude=float)
結果
コメント