演習 - Seaborn でデータを分析する

完了

Azure Notebooks (および Python 全般) の優れた点の 1 つは、複雑なタスクを実行するのに利用できる数千のオープン ソース ライブラリがあり、大量のコードを記述する必要がないことです。 このユニットでは、Seaborn (統計の視覚化のためのライブラリ) を使用して、読み込んだ 2 つのデータ セットの 2 番目 (1882 年から 2014 年までをカバー) をプロットします。 Seaborn では、1 つの単純な関数呼び出しで回帰に基づいてデータ ポイントが降下すべき場所を示すプロジェクションを伴う回帰直線を作成できます。

  1. ノートブックの下部にある空のセルにカーソルを置きます。 セルの種類を Markdown に変更し、"Perform linear regression with Seaborn" (Seaborn を使用して線形回帰を実行する) をテキストとして入力します。

  2. コード セルを追加し、次のコードを貼り付けます。

    plt.scatter(years, mean)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    sns.regplot(yearsBase, meanBase)
    plt.show()
    
  3. コード セルを実行して回帰直線がある散布図データ ポイントが降下すると予想されるデータ ポイントの範囲の視覚表現を生成します。

    Comparison of actual values and predicted values generated with Seaborn.

    実際の値と Seaborn で生成された予測値の比較

最初の 100 年間のデータ ポイントは予測された値とほぼ一致していますが、概ね 1980 年以降はそうでないことに注目してください。 このようなモデルが、科学者に気候変動が加速していることを信じさせることにつながっています。