seaborn.lmplot#
- seaborn.lmplot(data, *, x=None, y=None, hue=None, col=None, row=None, palette=None, col_wrap=None, height=5, aspect=1, markers='o', sharex=None, sharey=None, hue_order=None, col_order=None, row_order=None, legend=True, legend_out=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, ) #
FacetGrid にデータと回帰モデルの適合をプロットします。
この関数は、
regplot()
とFacetGrid
を組み合わせたものです。データセットの条件付きサブセット全体に回帰モデルを適合させるための便利なインターフェースとして意図されています。変数を異なるファセットに割り当てる方法を考える際の一般的なルールは、最も重要な比較に
hue
を使用し、次にcol
とrow
を使用することです。ただし、常に特定のデータセットと作成しようとしている視覚化の目標について考えてください。回帰モデルを推定するための相互に排他的なオプションが多数あります。詳細については、チュートリアル を参照してください。
この関数の parameters は、
FacetGrid
のほとんどのオプションに及びますが、そのクラスとregplot()
を直接使用したい場合もあるでしょう。- パラメータ:
- dataデータフレーム
各列が変数で各行が観測値である、整然とした(「ロングフォーム」の)データフレーム。
- x, y文字列、オプション
入力変数。これらは
data
の列名である必要があります。- hue, col, row文字列
データのサブセットを定義する変数。グリッド内の個別のファセットに描画されます。この変数のレベルの順序を制御するには、
*_order
パラメータを参照してください。- paletteパレット名、リスト、または辞書
hue
変数の異なるレベルに使用する色。color_palette()
で解釈できるもの、または色相レベルを matplotlib 色にマッピングする辞書である必要があります。- col_wrap整数
列変数をこの幅で「ラップ」して、列ファセットが複数の行にまたがるようにします。
row
ファセットと互換性がありません。- heightスカラー
各ファセットの高さ(インチ単位)。
aspect
も参照してください。- aspectスカラー
各ファセットの縦横比。
aspect * height
は、各ファセットの幅(インチ単位)を示します。- markersmatplotlib マーカーコードまたはマーカーコードのリスト(オプション)
散布図のマーカー。リストの場合、リスト内の各マーカーは、
hue
変数の各レベルに使用されます。- share{x,y}bool、'col'、または 'row'(オプション)
true の場合、ファセットは列全体で y 軸を、行全体で x 軸を共有します。
バージョン 0.12.0 以降非推奨:
facet_kws
辞書を使用して渡してください。- {hue,col,row}_orderリスト(オプション)
ファセット変数のレベルの順序。デフォルトでは、これはレベルが
data
に表示される順序、または変数が pandas のカテゴリカルな場合はカテゴリの順序になります。- legendbool(オプション)
True
で、hue
変数がある場合、凡例を追加します。- legend_outbool
True
の場合、図のサイズが拡張され、凡例はプロットの外側、中央右に描画されます。バージョン 0.12.0 以降非推奨:
facet_kws
辞書を使用して渡してください。- x_estimatorベクトル -> スカラーをマッピングする呼び出し可能オブジェクト(オプション)
この関数を
x
の一意の値ごとに適用し、結果の推定値をプロットします。これは、x
が離散変数の場合に便利です。x_ci
が指定されている場合、この推定値はブートストラップされ、信頼区間が描画されます。- x_binsint またはベクトル(オプション)
x
変数を離散ビンに分割し、中心傾向と信頼区間を推定します。このビニングは、散布図の描画方法にのみ影響します。回帰は依然として元のデータに適合します。このパラメータは、均等なサイズ(必ずしも等間隔ではない)のビンの数、またはビンの中心の位置として解釈されます。このパラメータが使用される場合、x_estimator
のデフォルトはnumpy.mean
であることを意味します。- x_ci”ci”、”sd”、[0, 100] の int、または None(オプション)
x
の離散値の中心傾向をプロットするときに使用される信頼区間のサイズ。"ci"
の場合、ci
パラメータの値に従います。"sd"
の場合、ブートストラップをスキップし、各ビンでの観測値の標準偏差を表示します。- scatterbool(オプション)
True
の場合、基礎となる観測値(またはx_estimator
値)を使用して散布図を描画します。- fit_regbool(オプション)
True
の場合、x
変数とy
変数の関係を表す回帰モデルを推定してプロットします。- ci[0, 100] の int または None(オプション)
回帰推定値の信頼区間のサイズ。これは、回帰線の周りの半透明の帯を使用して描画されます。信頼区間はブートストラップを使用して推定されます。大規模なデータセットの場合、このパラメータを None に設定して計算を回避することをお勧めします。
- n_bootint(オプション)
ci
を推定するために使用されるブートストラップリサンプリングの数。デフォルト値は、時間と安定性のバランスをとることを試みます。”最終”版のプロットの場合は、この値を増やすことをお勧めします。- units
data
内の変数名(オプション) x
とy
の観測値がサンプリング単位内にネストされている場合、ここで指定できます。これは、ユニットと観測値(ユニット内)の両方をリサンプリングする多レベルブートストラップを実行することにより、信頼区間を計算するときに考慮されます。これは、回帰の推定または描画方法に影響を与えません。- seedint、numpy.random.Generator、または numpy.random.RandomState(オプション)
再現可能なブートストラップのためのシードまたは乱数ジェネレータ。
- orderint(オプション)
order
が 1 より大きい場合、numpy.polyfit
を使用して多項式回帰を推定します。- logisticbool(オプション)
True
の場合、y
はバイナリ変数であると想定し、statsmodels
を使用してロジスティック回帰モデルを推定します。これは線形回帰よりも計算コストが大幅に高いため、ブートストラップリサンプリングの数(n_boot
)を減らすか、ci
を None に設定することをお勧めします。- lowessbool(オプション)
True
の場合、statsmodels
を使用してノンパラメトリック LOWESS モデル(局所重み付け線形回帰)を推定します。現在、この種のモデルの信頼区間を描画することはできません。- robustbool(オプション)
True
の場合、statsmodels
を使用してロバスト回帰を推定します。これは外れ値の重みを軽減します。これは標準の線形回帰よりも計算コストが大幅に高いため、ブートストラップリサンプリングの数(n_boot
)を減らすか、ci
を None に設定することをお勧めします。- logxbool(オプション)
True
の場合、y ~ log(x) 形式の線形回帰を推定しますが、散布図と回帰モデルを入力空間でプロットします。これが機能するには、x
は正でなければなりません。- {x,y}_partial
data
内の文字列または行列 プロットする前に
x
またはy
変数から回帰する交絡変数。- truncatebool(オプション)
True
の場合、回帰線はデータの制限によって制限されます。False
の場合、x
軸の制限まで延長されます。- {x,y}_jitter浮動小数点数(オプション)
このサイズの均一なランダムノイズを
x
またはy
変数に追加します。ノイズは、回帰を当てはめた後、データのコピーに追加され、散布図の外観にのみ影響します。これは、離散値をとる変数をプロットする場合に役立ちます。- {scatter,line}_kws辞書
plt.scatter
およびplt.plot
に渡す追加のキーワード引数。- facet_kws辞書
FacetGrid
のキーワード引数の辞書。
参照
注記
regplot()
関数とlmplot()
関数は密接に関連していますが、前者は軸レベルの関数であり、後者はregplot()
とFacetGrid
を組み合わせた図レベルの関数です。例
回帰モデルを指定するためのさまざまなオプションのデモについては、
regplot()
のドキュメントを参照してください。これらのオプションはここでも使用できます。散布図上に回帰適合をプロットする
sns.lmplot(data=penguins, x="bill_length_mm", y="bill_depth_mm")
別の変数に基づいて回帰適合を調整し、色を使用して表す
sns.lmplot(data=penguins, x="bill_length_mm", y="bill_depth_mm", hue="species")
別の変数に基づいて回帰適合を調整し、サブプロットに分割する
sns.lmplot( data=penguins, x="bill_length_mm", y="bill_depth_mm", hue="species", col="sex", height=4, )
列と行の両方を使用して、2 つの変数にわたって調整する
sns.lmplot( data=penguins, x="bill_length_mm", y="bill_depth_mm", col="species", row="sex", height=3, )
サブプロット間で軸の制限を変更できるようにする
sns.lmplot( data=penguins, x="bill_length_mm", y="bill_depth_mm", col="species", row="sex", height=3, facet_kws=dict(sharex=False, sharey=False), )