seaborn.ecdfplot#
- seaborn.ecdfplot(data=None, *, x=None, y=None, hue=None, weights=None, stat='proportion', complementary=False, palette=None, hue_order=None, hue_norm=None, log_scale=None, legend=True, ax=None, **kwargs)#
経験累積分布関数をプロットします。
ECDFは、データセット内の各一意の値より小さい観測値の割合または数を表します。ヒストグラムや密度プロットと比較して、各観測値が直接視覚化されるため、調整が必要なビニングや平滑化のパラメーターがないという利点があります。また、複数の分布間の直接比較にも役立ちます。欠点としては、プロットの外観と分布の基本的な特性(中心傾向、分散、二峰性の有無など)の関係が直感的ではない場合があります。
詳細については、ユーザーガイドを参照してください。
- パラメーター:
- data
pandas.DataFrame
,numpy.ndarray
、マッピング、またはシーケンス 入力データ構造。名前付き変数に割り当てることができるベクトルのロングフォームコレクション、または内部でリシェイプされるワイドフォームデータセットのいずれか。
- x, y
data
内のベクトルまたはキー x軸とy軸の位置を指定する変数。
- hue
data
内のベクトルまたはキー プロット要素の色を決定するためにマッピングされるセマンティック変数。
- weights
data
内のベクトルまたはキー 指定した場合、これらの値を使用して、累積分布に対する対応するデータポイントの寄与に重み付けします。
- stat{{“proportion”, “percent”, “count”}}
計算する分布統計。
- complementarybool
Trueの場合、相補CDF(1 - CDF)を使用します。
- palette文字列、リスト、辞書、または
matplotlib.colors.Colormap
hue
セマンティックをマッピングするときに使用する色を選択する方法。文字列値はcolor_palette()
に渡されます。リストまたは辞書の値はカテゴリカルマッピングを意味し、カラーマップオブジェクトは数値マッピングを意味します。- hue_order文字列のベクトル
hue
セマンティックのカテゴリレベルの処理とプロットの順序を指定します。- hue_normタプルまたは
matplotlib.colors.Normalize
データ単位で正規化範囲を設定する値のペア、またはデータ単位から[0、1]の間隔にマッピングするオブジェクトのいずれか。使用法は数値マッピングを意味します。
- log_scaleブール値または数値、またはブール値または数値のペア
軸スケールをログに設定します。単一の値は、プロット内の任意の数値軸のデータ軸を設定します。値のペアは、各軸を独立して設定します。数値は、必要なベース(デフォルトは10)として解釈されます。
None
またはFalse
の場合、seabornは既存の軸スケールに従います。- legendbool
Falseの場合、セマンティック変数の凡例を抑制します。
- ax
matplotlib.axes.Axes
プロットに使用する既存の軸。それ以外の場合は、内部で
matplotlib.pyplot.gca()
を呼び出します。- kwargs
その他のキーワード引数は、
matplotlib.axes.Axes.plot()
に渡されます。
- data
- 戻り値:
matplotlib.axes.Axes
プロットを含むmatplotlibの軸。
参考
例
x軸に沿って一変量分布をプロットします
penguins = sns.load_dataset("penguins") sns.ecdfplot(data=penguins, x="flipper_length_mm")
データ変数をy軸に割り当てることで、プロットを反転させます
sns.ecdfplot(data=penguins, y="flipper_length_mm")
x
もy
も割り当てられていない場合、データセットはワイド形式として扱われ、各数値列に対してヒストグラムが描画されますsns.ecdfplot(data=penguins.filter(like="bill_", axis="columns"))
色分けマッピングを使用して、ロング形式のデータセットから複数のヒストグラムを描画することもできます
sns.ecdfplot(data=penguins, x="bill_length_mm", hue="species")
デフォルトの分布統計は、割合を示すように正規化されていますが、代わりに絶対カウントまたはパーセントを表示できます
sns.ecdfplot(data=penguins, x="bill_length_mm", hue="species", stat="count")
経験的相補累積分布関数(1-CDF)をプロットすることも可能です
sns.ecdfplot(data=penguins, x="bill_length_mm", hue="species", complementary=True)