seaborn.lmplot#

seaborn.lmplot(data, *, x=None, y=None, hue=None, col=None, row=None, palette=None, col_wrap=None, height=5, aspect=1, markers='o', sharex=None, sharey=None, hue_order=None, col_order=None, row_order=None, legend=True, legend_out=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, ) #

FacetGrid にデータと回帰モデルの適合をプロットします。

この関数は、regplot()FacetGrid を組み合わせたものです。データセットの条件付きサブセット全体に回帰モデルを適合させるための便利なインターフェースとして意図されています。

変数を異なるファセットに割り当てる方法を考える際の一般的なルールは、最も重要な比較に hue を使用し、次に colrow を使用することです。ただし、常に特定のデータセットと作成しようとしている視覚化の目標について考えてください。

回帰モデルを推定するための相互に排他的なオプションが多数あります。詳細については、チュートリアル を参照してください。

この関数の parameters は、FacetGrid のほとんどのオプションに及びますが、そのクラスと regplot() を直接使用したい場合もあるでしょう。

パラメータ:
dataデータフレーム

各列が変数で各行が観測値である、整然とした(「ロングフォーム」の)データフレーム。

x, y文字列、オプション

入力変数。これらは data の列名である必要があります。

hue, col, row文字列

データのサブセットを定義する変数。グリッド内の個別のファセットに描画されます。この変数のレベルの順序を制御するには、*_order パラメータを参照してください。

paletteパレット名、リスト、または辞書

hue 変数の異なるレベルに使用する色。color_palette() で解釈できるもの、または色相レベルを matplotlib 色にマッピングする辞書である必要があります。

col_wrap整数

列変数をこの幅で「ラップ」して、列ファセットが複数の行にまたがるようにします。row ファセットと互換性がありません。

heightスカラー

各ファセットの高さ(インチ単位)。 aspect も参照してください。

aspectスカラー

各ファセットの縦横比。 aspect * height は、各ファセットの幅(インチ単位)を示します。

markersmatplotlib マーカーコードまたはマーカーコードのリスト(オプション)

散布図のマーカー。リストの場合、リスト内の各マーカーは、 hue 変数の各レベルに使用されます。

share{x,y}bool、'col'、または 'row'(オプション)

true の場合、ファセットは列全体で y 軸を、行全体で x 軸を共有します。

バージョン 0.12.0 以降非推奨: facet_kws 辞書を使用して渡してください。

{hue,col,row}_orderリスト(オプション)

ファセット変数のレベルの順序。デフォルトでは、これはレベルが data に表示される順序、または変数が pandas のカテゴリカルな場合はカテゴリの順序になります。

legendbool(オプション)

True で、 hue 変数がある場合、凡例を追加します。

legend_outbool

True の場合、図のサイズが拡張され、凡例はプロットの外側、中央右に描画されます。

バージョン 0.12.0 以降非推奨: facet_kws 辞書を使用して渡してください。

x_estimatorベクトル -> スカラーをマッピングする呼び出し可能オブジェクト(オプション)

この関数を x の一意の値ごとに適用し、結果の推定値をプロットします。これは、 x が離散変数の場合に便利です。 x_ci が指定されている場合、この推定値はブートストラップされ、信頼区間が描画されます。

x_binsint またはベクトル(オプション)

x 変数を離散ビンに分割し、中心傾向と信頼区間を推定します。このビニングは、散布図の描画方法にのみ影響します。回帰は依然として元のデータに適合します。このパラメータは、均等なサイズ(必ずしも等間隔ではない)のビンの数、またはビンの中心の位置として解釈されます。このパラメータが使用される場合、 x_estimator のデフォルトは numpy.mean であることを意味します。

x_ci”ci”、”sd”、[0, 100] の int、または None(オプション)

x の離散値の中心傾向をプロットするときに使用される信頼区間のサイズ。 "ci" の場合、 ci パラメータの値に従います。 "sd" の場合、ブートストラップをスキップし、各ビンでの観測値の標準偏差を表示します。

scatterbool(オプション)

True の場合、基礎となる観測値(または x_estimator 値)を使用して散布図を描画します。

fit_regbool(オプション)

True の場合、 x 変数と y 変数の関係を表す回帰モデルを推定してプロットします。

ci[0, 100] の int または None(オプション)

回帰推定値の信頼区間のサイズ。これは、回帰線の周りの半透明の帯を使用して描画されます。信頼区間はブートストラップを使用して推定されます。大規模なデータセットの場合、このパラメータを None に設定して計算を回避することをお勧めします。

n_bootint(オプション)

ci を推定するために使用されるブートストラップリサンプリングの数。デフォルト値は、時間と安定性のバランスをとることを試みます。”最終”版のプロットの場合は、この値を増やすことをお勧めします。

units data 内の変数名(オプション)

xy の観測値がサンプリング単位内にネストされている場合、ここで指定できます。これは、ユニットと観測値(ユニット内)の両方をリサンプリングする多レベルブートストラップを実行することにより、信頼区間を計算するときに考慮されます。これは、回帰の推定または描画方法に影響を与えません。

seedint、numpy.random.Generator、または numpy.random.RandomState(オプション)

再現可能なブートストラップのためのシードまたは乱数ジェネレータ。

orderint(オプション)

order が 1 より大きい場合、 numpy.polyfit を使用して多項式回帰を推定します。

logisticbool(オプション)

True の場合、 y はバイナリ変数であると想定し、 statsmodels を使用してロジスティック回帰モデルを推定します。これは線形回帰よりも計算コストが大幅に高いため、ブートストラップリサンプリングの数( n_boot )を減らすか、 ci を None に設定することをお勧めします。

lowessbool(オプション)

True の場合、 statsmodels を使用してノンパラメトリック LOWESS モデル(局所重み付け線形回帰)を推定します。現在、この種のモデルの信頼区間を描画することはできません。

robustbool(オプション)

True の場合、 statsmodels を使用してロバスト回帰を推定します。これは外れ値の重みを軽減します。これは標準の線形回帰よりも計算コストが大幅に高いため、ブートストラップリサンプリングの数( n_boot )を減らすか、 ci を None に設定することをお勧めします。

logxbool(オプション)

True の場合、y ~ log(x) 形式の線形回帰を推定しますが、散布図と回帰モデルを入力空間でプロットします。これが機能するには、 x は正でなければなりません。

{x,y}_partial data 内の文字列または行列

プロットする前に x または y 変数から回帰する交絡変数。

truncatebool(オプション)

True の場合、回帰線はデータの制限によって制限されます。 False の場合、 x 軸の制限まで延長されます。

{x,y}_jitter浮動小数点数(オプション)

このサイズの均一なランダムノイズを x または y 変数に追加します。ノイズは、回帰を当てはめた後、データのコピーに追加され、散布図の外観にのみ影響します。これは、離散値をとる変数をプロットする場合に役立ちます。

{scatter,line}_kws辞書

plt.scatter および plt.plot に渡す追加のキーワード引数。

facet_kws辞書

FacetGrid のキーワード引数の辞書。

参照

regplot

データと条件付きモデルの適合をプロットします。

FacetGrid

条件付き関係をプロットするためのサブプロットグリッド。

pairplot

regplot()PairGridkind="reg" と共に使用する場合)を組み合わせます。

注記

regplot() 関数と lmplot() 関数は密接に関連していますが、前者は軸レベルの関数であり、後者は regplot()FacetGrid を組み合わせた図レベルの関数です。

回帰モデルを指定するためのさまざまなオプションのデモについては、 regplot() のドキュメントを参照してください。これらのオプションはここでも使用できます。

散布図上に回帰適合をプロットする

sns.lmplot(data=penguins, x="bill_length_mm", y="bill_depth_mm")
../_images/lmplot_2_0.png

別の変数に基づいて回帰適合を調整し、色を使用して表す

sns.lmplot(data=penguins, x="bill_length_mm", y="bill_depth_mm", hue="species")
../_images/lmplot_4_0.png

別の変数に基づいて回帰適合を調整し、サブプロットに分割する

sns.lmplot(
    data=penguins, x="bill_length_mm", y="bill_depth_mm",
    hue="species", col="sex", height=4,
)
../_images/lmplot_6_0.png

列と行の両方を使用して、2 つの変数にわたって調整する

sns.lmplot(
    data=penguins, x="bill_length_mm", y="bill_depth_mm",
    col="species", row="sex", height=3,
)
../_images/lmplot_8_0.png

サブプロット間で軸の制限を変更できるようにする

sns.lmplot(
    data=penguins, x="bill_length_mm", y="bill_depth_mm",
    col="species", row="sex", height=3,
    facet_kws=dict(sharex=False, sharey=False),
)
../_images/lmplot_10_0.png