seaborn.ecdfplot#

seaborn.ecdfplot(data=None, *, x=None, y=None, hue=None, weights=None, stat='proportion', complementary=False, palette=None, hue_order=None, hue_norm=None, log_scale=None, legend=True, ax=None, **kwargs)#

経験累積分布関数をプロットします。

ECDFは、データセット内の各一意の値より小さい観測値の割合または数を表します。ヒストグラムや密度プロットと比較して、各観測値が直接視覚化されるため、調整が必要なビニングや平滑化のパラメーターがないという利点があります。また、複数の分布間の直接比較にも役立ちます。欠点としては、プロットの外観と分布の基本的な特性(中心傾向、分散、二峰性の有無など)の関係が直感的ではない場合があります。

詳細については、ユーザーガイドを参照してください。

パラメーター:
datapandas.DataFrame, numpy.ndarray、マッピング、またはシーケンス

入力データ構造。名前付き変数に割り当てることができるベクトルのロングフォームコレクション、または内部でリシェイプされるワイドフォームデータセットのいずれか。

x, ydata内のベクトルまたはキー

x軸とy軸の位置を指定する変数。

huedata内のベクトルまたはキー

プロット要素の色を決定するためにマッピングされるセマンティック変数。

weightsdata内のベクトルまたはキー

指定した場合、これらの値を使用して、累積分布に対する対応するデータポイントの寄与に重み付けします。

stat{{“proportion”, “percent”, “count”}}

計算する分布統計。

complementarybool

Trueの場合、相補CDF(1 - CDF)を使用します。

palette文字列、リスト、辞書、またはmatplotlib.colors.Colormap

hueセマンティックをマッピングするときに使用する色を選択する方法。文字列値はcolor_palette()に渡されます。リストまたは辞書の値はカテゴリカルマッピングを意味し、カラーマップオブジェクトは数値マッピングを意味します。

hue_order文字列のベクトル

hueセマンティックのカテゴリレベルの処理とプロットの順序を指定します。

hue_normタプルまたはmatplotlib.colors.Normalize

データ単位で正規化範囲を設定する値のペア、またはデータ単位から[0、1]の間隔にマッピングするオブジェクトのいずれか。使用法は数値マッピングを意味します。

log_scaleブール値または数値、またはブール値または数値のペア

軸スケールをログに設定します。単一の値は、プロット内の任意の数値軸のデータ軸を設定します。値のペアは、各軸を独立して設定します。数値は、必要なベース(デフォルトは10)として解釈されます。NoneまたはFalseの場合、seabornは既存の軸スケールに従います。

legendbool

Falseの場合、セマンティック変数の凡例を抑制します。

axmatplotlib.axes.Axes

プロットに使用する既存の軸。それ以外の場合は、内部でmatplotlib.pyplot.gca()を呼び出します。

kwargs

その他のキーワード引数は、matplotlib.axes.Axes.plot()に渡されます。

戻り値:
matplotlib.axes.Axes

プロットを含むmatplotlibの軸。

参考

displot

分布プロット関数への図レベルのインターフェース。

histplot

オプションの正規化または平滑化を使用して、ビン化されたカウントのヒストグラムをプロットします。

kdeplot

カーネル密度推定を使用して、一変量または二変量分布をプロットします。

rugplot

x軸および/またはy軸に沿って各観測値に目盛りをプロットします。

x軸に沿って一変量分布をプロットします

penguins = sns.load_dataset("penguins")
sns.ecdfplot(data=penguins, x="flipper_length_mm")
../_images/ecdfplot_1_0.png

データ変数をy軸に割り当てることで、プロットを反転させます

sns.ecdfplot(data=penguins, y="flipper_length_mm")
../_images/ecdfplot_3_0.png

xyも割り当てられていない場合、データセットはワイド形式として扱われ、各数値列に対してヒストグラムが描画されます

sns.ecdfplot(data=penguins.filter(like="bill_", axis="columns"))
../_images/ecdfplot_5_0.png

色分けマッピングを使用して、ロング形式のデータセットから複数のヒストグラムを描画することもできます

sns.ecdfplot(data=penguins, x="bill_length_mm", hue="species")
../_images/ecdfplot_7_0.png

デフォルトの分布統計は、割合を示すように正規化されていますが、代わりに絶対カウントまたはパーセントを表示できます

sns.ecdfplot(data=penguins, x="bill_length_mm", hue="species", stat="count")
../_images/ecdfplot_9_0.png

経験的相補累積分布関数(1-CDF)をプロットすることも可能です

sns.ecdfplot(data=penguins, x="bill_length_mm", hue="species", complementary=True)
../_images/ecdfplot_11_0.png