画像の完成 | 機械学習 | オリベッティ顔

はじめに

この実験では、画像を完成させるために多出力推定器をどのように使用するかを示します。目的は、顔の上半分を与えられたときに下半分を予測することです。極端にランダム化された木、k 近傍法、線形回帰、およびリッジ回帰などのさまざまなアルゴリズムを使用して、顔の下半分を完成させます。完成した顔を元の顔と比較して、アルゴリズムの性能を評価します。

VM のヒント

VM の起動が完了したら、左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。

場合によっては、Jupyter Notebook が読み込み終わるまで数秒待つ必要があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。

学習中に問題に遭遇した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。

データの読み込み

最初のステップは、オリベッティ顔データセットを読み込むことです。このデータセットには、それぞれ 64x64 ピクセルの 400 枚のグレースケール画像が含まれています。データは訓練用とテスト用に分割されています。訓練用セットには 30 人の顔が含まれ、テスト用セットには残りの人の顔が含まれます。この実験では、5 人のサブセットでアルゴリズムをテストします。

## Load the faces datasets
data, targets = fetch_olivetti_faces(return_X_y=True)

train = data[targets < 30]
test = data[targets >= 30]  ## Test on independent people

## Test on a subset of people
n_faces = 5
rng = check_random_state(4)
face_ids = rng.randint(test.shape[0], size=(n_faces,))
test = test[face_ids, :]

n_pixels = data.shape[1]
## Upper half of the faces
X_train = train[:, : (n_pixels + 1) // 2]
## Lower half of the faces
y_train = train[:, n_pixels // 2 :]
X_test = test[:, : (n_pixels + 1) // 2]
y_test = test[:, n_pixels // 2 :]

推定器の適合

2 番目のステップは、訓練データに対して多出力推定器を適合させることです。4 つの異なるアルゴリズムを使用します。極端にランダム化された木、k 近傍法、線形回帰、およびリッジ回帰。推定器は、上半分に基づいて顔の下半分を予測します。

## Fit estimators
ESTIMATORS = {
    "Extra trees": ExtraTreesRegressor(
        n_estimators=10, max_features=32, random_state=0
    ),
    "K-nn": KNeighborsRegressor(),
    "Linear regression": LinearRegression(),
    "Ridge": RidgeCV(),
}

y_test_predict = dict()
for name, estimator in ESTIMATORS.items():
    estimator.fit(X_train, y_train)
    y_test_predict[name] = estimator.predict(X_test)

完成した顔を描画する

最後のステップは、各アルゴリズムに対して完成した顔を描画し、元の顔と比較することです。元の顔は最初の列に表示され、完成した顔は各アルゴリズムに対してその後の列に表示されます。完成した顔と元の顔を比較することで、アルゴリズムの性能を評価することができます。

## Plot the completed faces
image_shape = (64, 64)

n_cols = 1 + len(ESTIMATORS)
plt.figure(figsize=(2.0 * n_cols, 2.26 * n_faces))
plt.suptitle("Face completion with multi-output estimators", size=16)

for i in range(n_faces):
    true_face = np.hstack((X_test[i], y_test[i]))

    if i:
        sub = plt.subplot(n_faces, n_cols, i * n_cols + 1)
    else:
        sub = plt.subplot(n_faces, n_cols, i * n_cols + 1, title="true faces")

    sub.axis("off")
    sub.imshow(
        true_face.reshape(image_shape), cmap=plt.cm.gray, interpolation="nearest"
    )

    for j, est in enumerate(sorted(ESTIMATORS)):
        completed_face = np.hstack((X_test[i], y_test_predict[est][i]))

        if i:
            sub = plt.subplot(n_faces, n_cols, i * n_cols + 2 + j)

        else:
            sub = plt.subplot(n_faces, n_cols, i * n_cols + 2 + j, title=est)

        sub.axis("off")
        sub.imshow(
            completed_face.reshape(image_shape),
            cmap=plt.cm.gray,
            interpolation="nearest",
        )

plt.show()

まとめ

この実験では、画像を完成させるために多出力推定器をどのように使用するかを示しました。上半分に基づいて顔の下半分を予測するために、4 つの異なるアルゴリズムを使用しました。完成した顔と元の顔を比較することで、アルゴリズムの性能を評価しました。

多出力推定器を用た顔の完成

はじめに

VM のヒント

データの読み込み

推定器の適合

完成した顔を描画する

まとめ