MongoDB 인덱스 생성 및 최적화

소개

이 랩에서는 MongoDB 에서 인덱스를 생성하고 관리하는 기본적인 기술을 배우게 됩니다. 인덱스는 데이터베이스 성능을 최적화하는 데 매우 중요합니다. 인덱스를 사용하면 컬렉션의 모든 문서를 스캔하는 것보다 훨씬 빠르게 데이터를 찾고 검색할 수 있습니다. 단일 필드 인덱스, 복합 인덱스, 고유 인덱스를 생성하고, 쿼리 성능에 미치는 영향을 분석하며, 인덱스의 수명 주기를 관리하는 연습을 하게 됩니다. 이 랩이 끝나면 MongoDB 쿼리를 더 효율적으로 만들기 위해 인덱스를 사용하는 방법에 대한 확실한 이해를 갖게 될 것입니다.

단일 필드 인덱스 생성

첫 번째 단계에서는 MongoDB 에 연결하고, 샘플 컬렉션이 있는 데이터베이스를 생성한 다음, 단일 필드에 첫 번째 인덱스를 생성합니다. 단일 필드 인덱스는 특정 필드를 기준으로 필터링하거나 정렬하는 쿼리의 성능을 향상시킵니다.

먼저 터미널에 mongosh를 입력하여 MongoDB Shell 을 엽니다. 그러면 현재 환경에서 실행 중인 MongoDB 서버에 연결됩니다.

mongosh

MongoDB Shell 에 접속하면 > 프롬프트가 표시됩니다. 이제 indexlab이라는 새 데이터베이스를 생성하고 해당 데이터베이스로 전환합니다. 이 랩의 후속 명령은 별도로 명시되지 않는 한 이 셸 내에서 실행됩니다.

use indexlab

이제 users라는 새 컬렉션에 샘플 문서를 삽입해 보겠습니다. 이 데이터는 랩 전체에서 사용됩니다.

db.users.insertMany([
  { name: "Alice", age: 28, email: "alice@example.com" },
  { name: "Bob", age: 35, email: "bob@example.com" },
  { name: "Charlie", age: 42, email: "charlie@example.com" }
]);

데이터가 준비되었으므로 name 필드에 인덱스를 생성해 보겠습니다. 단일 필드에 대한 인덱스는 해당 필드로 문서를 검색하는 쿼리의 속도를 높이는 데 도움이 됩니다.

db.users.createIndex({ name: 1 });

위 명령에서 { name: 1 }은 name 필드에 오름차순으로 인덱스를 생성하도록 지정합니다. -1을 사용하면 내림차순 인덱스가 생성됩니다.

인덱스가 생성되었는지 확인하려면 users 컬렉션의 모든 인덱스를 나열할 수 있습니다.

db.users.getIndexes();

출력에서 두 개의 인덱스를 볼 수 있습니다. 하나는 MongoDB 가 모든 컬렉션에 생성하는 기본 _id 인덱스이고, 다른 하나는 방금 생성한 name_1 인덱스입니다.

[
  { "v": 2, "key": { "_id": 1 }, "name": "_id_" },
  { "v": 2, "key": { "name": 1 }, "name": "name_1" }
]

복합 인덱스 빌드

단일 필드 인덱스도 유용하지만, 많은 쿼리가 여러 필드를 기준으로 필터링합니다. 이러한 경우 여러 필드를 포함하는 복합 인덱스를 사용하면 상당한 성능 향상을 얻을 수 있습니다. 이 단계에서는 복합 인덱스를 생성합니다.

mongosh 셸에서 계속 진행합니다. age와 name 필드에 복합 인덱스를 생성합니다. 복합 인덱스에서 필드의 순서는 중요합니다. MongoDB 는 이 인덱스를 사용하여 age만으로 필터링하는 쿼리 또는 age와 name 모두로 필터링하는 쿼리를 지원할 수 있습니다.

db.users.createIndex({ age: -1, name: 1 });

이 명령은 문서를 age 기준으로 내림차순 (-1) 으로 먼저 정렬하고, 동일한 age를 가진 문서의 경우 name 기준으로 오름차순 (1) 으로 정렬하는 인덱스를 생성합니다.

쿼리를 위해 컬렉션을 더 다양하게 만들기 위해 몇 개의 문서를 더 추가해 보겠습니다.

db.users.insertMany([
  { name: "David", age: 28, email: "david@example.com" },
  { name: "Eve", age: 35, email: "eve@example.com" }
]);

이제 인덱스 목록을 다시 확인하여 새 복합 인덱스를 확인합니다.

db.users.getIndexes();

출력에는 이전 인덱스 외에 age_-1_name_1 인덱스가 포함됩니다.

[
  { "v": 2, "key": { "_id": 1 }, "name": "_id_" },
  { "v": 2, "key": { "name": 1 }, "name": "name_1" },
  { "v": 2, "key": { "age": -1, "name": 1 }, "name": "age_-1_name_1" }
]

이 복합 인덱스는 age로 필터링하거나 정렬하는 쿼리, 또는 age 다음에 name으로 필터링하거나 정렬하는 쿼리를 효율적으로 처리합니다.

고유 인덱스 생성

인덱스는 데이터 무결성을 강제하는 데에도 사용될 수 있습니다. 고유 인덱스는 인덱싱된 필드 (또는 필드) 에 중복된 값이 포함되지 않도록 보장합니다. 이 단계에서는 users 컬렉션에 중복된 이메일 주소를 방지하기 위한 고유 인덱스를 생성합니다.

email 필드에 고유 인덱스를 생성해 보겠습니다. 이는 인덱스를 생성할 때 { unique: true } 옵션을 추가하여 수행합니다.

db.users.createIndex({ email: 1 }, { unique: true });

이제 고유 인덱스가 적용되었으므로, MongoDB 는 email 필드에 중복된 값을 초래하는 문서 삽입 또는 업데이트 시도를 거부합니다.

이를 테스트해 보겠습니다. 먼저 새롭고 고유한 이메일을 가진 문서를 삽입해 보겠습니다. 이 작업은 성공해야 합니다.

db.users.insertOne({ name: "Frank", age: 31, email: "frank@example.com" });

다음으로, alice@example.com과 같이 이미 존재하는 이메일을 가진 다른 문서를 삽입해 보겠습니다. 이 작업은 실패합니다. try...catch 블록을 사용하면 mongosh 셸에서 연결이 끊기지 않고 오류를 확인할 수 있습니다.

try {
  db.users.insertOne({ name: "Fiona", age: 29, email: "alice@example.com" });
} catch (e) {
  print(e);
}

명령은 중복 키 위반을 나타내는 오류를 발생시킵니다. 출력에는 E11000 duplicate key error collection과 같은 메시지가 포함됩니다.

인덱스를 다시 확인하여 고유 제약 조건 속성을 볼 수 있습니다.

db.users.getIndexes();

출력에서 email_1 인덱스의 unique: true 속성을 확인합니다.

[
  ...,
  {
    v: 2,
    key: { email: 1 },
    name: 'email_1',
    unique: true
  }
]

`explain()` 을 사용한 인덱스 사용량 분석

인덱스를 생성하는 것은 절반의 성공일 뿐이며, MongoDB 가 실제로 쿼리에 인덱스를 사용하고 있는지 확인해야 합니다. explain() 메서드는 쿼리가 어떻게 실행되는지에 대한 자세한 정보를 제공하는 강력한 도구입니다. 이 단계에서는 explain()을 사용하여 MongoDB 가 기존 인덱스를 효과적으로 사용하고 있는지 확인하는 방법을 보여줍니다.

특정 연령대의 사용자를 찾는 쿼리를 분석해 보겠습니다. 이전 단계에서 이미 복합 인덱스 age_-1_name_1을 가지고 있으므로, MongoDB 는 이 인덱스를 사용하여 age 필드에 대한 쿼리를 최적화할 수 있습니다.

db.users.find({ age: 35 }).explain("executionStats");

출력에서 winningPlan 내부의 executionStats.stage 필드를 찾으십시오. "Index Scan"을 의미하는 IXSCAN 값을 볼 수 있어야 합니다. 이는 MongoDB 가 기존 복합 인덱스 age_-1_name_1을 사용하여 관련 문서를 빠르게 찾고 있음을 나타냅니다. 또한 totalDocsExamined가 반환된 문서 수와 일치하는 것을 볼 수 있으며, 이는 복합 인덱스 사용의 효율성을 보여줍니다.

MongoDB 가 인덱스를 어떻게 선택하는지 더 잘 이해하기 위해, 이전에 생성한 단일 필드 name 인덱스의 이점을 얻을 수 있는 쿼리도 테스트해 보겠습니다.

db.users.find({ name: "Alice" }).explain("executionStats");

이 쿼리 역시 IXSCAN을 winning plan stage 로 보여주어야 하며, 이는 MongoDB 가 첫 번째 단계에서 생성한 name_1 인덱스를 사용하고 있음을 확인시켜 줍니다.

인덱스 보기 및 삭제

인덱스 관리의 마지막 부분은 인덱스 목록을 확인하고 더 이상 필요하지 않을 때 제거하는 방법을 아는 것입니다. 사용되지 않는 인덱스는 여전히 스토리지를 소비하고 쓰기 작업에 오버헤드를 추가하므로 정리하는 것이 좋습니다.

먼저 users 컬렉션에서 지금까지 생성한 모든 인덱스의 전체 목록을 가져오겠습니다.

db.users.getIndexes();

이 명령은 현재 인덱스 설정에 대한 포괄적인 개요를 제공합니다. 복합 인덱스 age_-1_name_1이 더 이상 필요하지 않다고 가정해 보겠습니다. 인덱스 이름을 지정하여 dropIndex() 메서드를 사용하여 제거할 수 있습니다.

db.users.dropIndex("age_-1_name_1");

명령을 실행하면 확인 메시지가 표시됩니다. 확실히 하기 위해 인덱스를 한 번 더 나열하여 제거되었는지 확인할 수 있습니다.

db.users.getIndexes();

age_-1_name_1 인덱스는 더 이상 목록에 나타나지 않아야 합니다.

컬렉션에서 기본 _id 인덱스를 제외한 모든 사용자 정의 인덱스를 제거해야 하는 경우 dropIndexes() 메서드를 사용할 수 있습니다. 이 명령은 강력하므로 주의해서 사용하십시오.

// 예: db.users.dropIndexes()

이것으로 MongoDB 에서 인덱스를 관리하는 기본 작업이 완료되었습니다. 이제 mongosh 셸을 종료할 수 있습니다.

exit;

요약

이 실습에서는 MongoDB 인덱스 작업에 필수적인 기술을 배웠습니다. 간단한 쿼리를 더 빠르게 실행하기 위해 기본 단일 필드 인덱스를 생성하는 것으로 시작했습니다. 그런 다음 여러 필드를 포함하는 쿼리를 최적화하기 위해 복합 인덱스를 구축했습니다. 또한 고유 인덱스를 생성하여 데이터 무결성을 강제하는 방법을 배웠습니다. 또한 explain() 메서드를 사용하여 쿼리 계획을 분석하고 인덱스가 효과적으로 사용되고 있는지 확인했으며, 컬렉션 스캔과 인덱스 스캔 간의 성능 차이를 관찰했습니다. 마지막으로 인덱스를 나열하고 삭제하여 인덱스를 관리하는 연습을 했습니다. 이러한 인덱싱 기술을 숙달하는 것은 MongoDB 를 사용하여 빠르고 확장 가능한 애플리케이션을 구축하는 데 중요한 단계입니다.

MongoDB 인덱스 생성

소개

단일 필드 인덱스 생성

복합 인덱스 빌드

고유 인덱스 생성

explain() 을 사용한 인덱스 사용량 분석

인덱스 보기 및 삭제

요약

`explain()` 을 사용한 인덱스 사용량 분석