seaborn.ecdfplot#

seaborn.ecdfplot(data=None, *, x=None, y=None, hue=None, weights=None, stat='proportion', complementary=False, palette=None, hue_order=None, hue_norm=None, log_scale=None, legend=True, ax=None, **kwargs)#

経験累積分布関数をプロットします。

ECDFは、データセット内の各一意の値より小さい観測値の割合または数を表します。ヒストグラムや密度プロットと比較して、各観測値が直接視覚化されるため、調整が必要なビニングや平滑化のパラメーターがないという利点があります。また、複数の分布間の直接比較にも役立ちます。欠点としては、プロットの外観と分布の基本的な特性（中心傾向、分散、二峰性の有無など）の関係が直感的ではない場合があります。

詳細については、ユーザーガイドを参照してください。

パラメーター:

datapandas.DataFrame, numpy.ndarray、マッピング、またはシーケンス: 入力データ構造。名前付き変数に割り当てることができるベクトルのロングフォームコレクション、または内部でリシェイプされるワイドフォームデータセットのいずれか。
x, ydata内のベクトルまたはキー: x軸とy軸の位置を指定する変数。
huedata内のベクトルまたはキー: プロット要素の色を決定するためにマッピングされるセマンティック変数。
weightsdata内のベクトルまたはキー: 指定した場合、これらの値を使用して、累積分布に対する対応するデータポイントの寄与に重み付けします。
stat{{“proportion”, “percent”, “count”}}: 計算する分布統計。
complementarybool: Trueの場合、相補CDF（1 - CDF）を使用します。
palette文字列、リスト、辞書、またはmatplotlib.colors.Colormap: hueセマンティックをマッピングするときに使用する色を選択する方法。文字列値はcolor_palette()に渡されます。リストまたは辞書の値はカテゴリカルマッピングを意味し、カラーマップオブジェクトは数値マッピングを意味します。
hue_order文字列のベクトル: hueセマンティックのカテゴリレベルの処理とプロットの順序を指定します。
hue_normタプルまたはmatplotlib.colors.Normalize: データ単位で正規化範囲を設定する値のペア、またはデータ単位から[0、1]の間隔にマッピングするオブジェクトのいずれか。使用法は数値マッピングを意味します。
log_scaleブール値または数値、またはブール値または数値のペア: 軸スケールをログに設定します。単一の値は、プロット内の任意の数値軸のデータ軸を設定します。値のペアは、各軸を独立して設定します。数値は、必要なベース（デフォルトは10）として解釈されます。NoneまたはFalseの場合、seabornは既存の軸スケールに従います。
legendbool: Falseの場合、セマンティック変数の凡例を抑制します。
axmatplotlib.axes.Axes: プロットに使用する既存の軸。それ以外の場合は、内部でmatplotlib.pyplot.gca()を呼び出します。
kwargs: その他のキーワード引数は、matplotlib.axes.Axes.plot()に渡されます。

戻り値:

matplotlib.axes.Axes: プロットを含むmatplotlibの軸。

参考

displot: 分布プロット関数への図レベルのインターフェース。
histplot: オプションの正規化または平滑化を使用して、ビン化されたカウントのヒストグラムをプロットします。
kdeplot: カーネル密度推定を使用して、一変量または二変量分布をプロットします。
rugplot: x軸および/またはy軸に沿って各観測値に目盛りをプロットします。

例

x軸に沿って一変量分布をプロットします

penguins = sns.load_dataset("penguins")
sns.ecdfplot(data=penguins, x="flipper_length_mm")

データ変数をy軸に割り当てることで、プロットを反転させます

sns.ecdfplot(data=penguins, y="flipper_length_mm")

xもyも割り当てられていない場合、データセットはワイド形式として扱われ、各数値列に対してヒストグラムが描画されます

sns.ecdfplot(data=penguins.filter(like="bill_", axis="columns"))

色分けマッピングを使用して、ロング形式のデータセットから複数のヒストグラムを描画することもできます

sns.ecdfplot(data=penguins, x="bill_length_mm", hue="species")

デフォルトの分布統計は、割合を示すように正規化されていますが、代わりに絶対カウントまたはパーセントを表示できます

sns.ecdfplot(data=penguins, x="bill_length_mm", hue="species", stat="count")

経験的相補累積分布関数（1-CDF）をプロットすることも可能です

sns.ecdfplot(data=penguins, x="bill_length_mm", hue="species", complementary=True)