NumPy replace 함수

Beginner

소개

Numpy 는 Python 에서 가장 강력한 과학 컴퓨팅 라이브러리 중 하나입니다. 고성능 다차원 배열 객체와 이러한 배열 작업을 위한 도구를 제공합니다.

Numpy 라이브러리의 numpy.char.replace() 함수는 문자열 배열 또는 문자열에서 하위 문자열의 발생을 새 하위 문자열로 대체하는 데 사용됩니다. 이 랩에서는 replace() 함수를 사용하여 문자열 배열의 내용을 대체하는 방법을 배우겠습니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

NumPy 임포트

Numpy 라이브러리를 사용하려면 먼저 임포트해야 합니다. 다음과 같이 import 문을 사용하여 수행할 수 있습니다.

import numpy as np

문자열 정의

이 랩의 목적을 위해 string1이라는 문자열을 정의하고 특정 값으로 초기화합니다.

string1 = "The quick brown fox jumps over the lazy dog"
print("The original string is:\n", string1)

부분 문자열 바꾸기

문자열 내에서 부분 문자열을 대체하려면 numpy.char.replace() 함수를 사용할 수 있습니다. 이 함수는 네 개의 매개변수를 받습니다.

numpy.char.replace(a, old, new, count=None)

여기서:

  • a: 문자열 배열 또는 문자열입니다.
  • old: 대체될 이전 부분 문자열입니다.
  • new: 이전 부분 문자열을 대체할 새 부분 문자열입니다.
  • count: 이전 부분 문자열의 발생 횟수를 지정하는 선택적 매개변수입니다.

string1에서 부분 문자열 'brown'을 새 부분 문자열 'red'로 바꿔보겠습니다.

string2 = np.char.replace(string1, 'brown', 'red')
print("The string with replaced substring is:\n", string2)

여러 번 나타나는 항목 바꾸기

부분 문자열의 여러 번의 발생을 대체하려면 선택적 매개변수 count를 함수에 전달할 수 있습니다. 예를 들어, 부분 문자열 'the'의 두 번의 발생을 모두 'an'으로 바꿔보겠습니다.

string3 = np.char.replace(string1, 'the', 'an', count=2)
print("The string with replaced substrings is:\n", string3)

배열 내 요소 교체

replace() 함수를 문자열 배열에도 적용할 수 있습니다. 먼저 문자열 배열을 생성해 보겠습니다.

string_array = np.array(['hello world', 'goodbye world', 'world peace', 'world health'])
print("The original string array is:\n", string_array)

이제 배열의 모든 요소에서 부분 문자열 'world''universe'로 바꿔보겠습니다.

new_string_array = np.char.replace(string_array, 'world', 'universe')
print("The new string array is:\n", new_string_array)

반복되는 부분 문자열 교체

count 매개변수를 사용하여 반복되는 부분 문자열을 대체할 수도 있습니다. 배열의 모든 요소에서 부분 문자열 'universe'의 첫 번째 발생을 'space'로 바꿔보겠습니다.

new_string_array2 = np.char.replace(string_array, 'universe', 'space', count=1)
print("The new string array is:\n", new_string_array2)

요약

이 랩에서는 numpy.char.replace() 함수를 사용하여 문자열 또는 문자열 배열 내에서 부분 문자열을 대체하는 방법을 배웠습니다. count 매개변수를 사용하여 부분 문자열의 단일 발생 또는 여러 발생을 대체하는 방법을 배웠습니다. 마지막으로, replace() 함수를 문자열 배열에 적용하는 방법을 배웠습니다. 이러한 기술은 NLP 및 텍스트 처리 응용 프로그램뿐만 아니라 데이터 전처리 작업에도 사용할 수 있습니다.