Numpy char.find() 함수를 사용하여 부분 문자열 찾기

Beginner

소개

이 튜토리얼에서는 Numpy 의 char.find() 함수에 대해 다룹니다. 이 함수는 문자열 배열 내에서 부분 문자열을 찾는 데 사용됩니다. 부분 문자열이 처음 나타나는 인덱스를 반환합니다. char.find() 함수는 Python 의 str.find() 함수와 유사합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하세요.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

Numpy 라이브러리 가져오기

이 단계에서는 import numpy 문을 사용하여 Numpy 라이브러리를 임포트합니다.

import numpy as np

문자열 배열 생성

이 단계에서는 np.array() 함수를 사용하여 문자열 배열을 생성합니다.

arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttdsxxxxcccc', 'AAaaxxxxcccutt', 'AAaaxxccxcxXDSDdscz'])

배열에서 부분 문자열 찾기

이 단계에서는 np.char.find() 함수를 사용하여 배열 내에서 부분 문자열을 찾습니다. 첫 번째 매개변수는 배열이고, 두 번째 매개변수는 찾고 싶은 부분 문자열입니다. 선택적 매개변수인 startend를 사용하여 부분 문자열을 검색할 범위를 제공할 수도 있습니다.

print(np.char.find(arr, 'xc'))

범위 내 부분 문자열 찾기

이 단계에서는 np.char.find() 함수를 다시 사용하여 특정 범위 내에서 부분 문자열을 찾습니다. 이번에는 start 매개변수를 사용하여 범위를 지정합니다.

print(np.char.find(arr, 'xc', start=3))

특정 인덱스 이후 부분 문자열 찾기

이 단계에서는 np.char.find() 함수를 사용하여 특정 인덱스 이후의 부분 문자열을 찾습니다. start 매개변수를 다시 사용하여 인덱스를 지정합니다.

print(np.char.find(arr, 'xc', start=8))

존재하지 않는 부분 문자열 처리

이 단계에서는 np.char.find() 함수를 사용하여 존재하지 않는 부분 문자열을 처리합니다. 부분 문자열을 포함하지 않는 배열을 사용하고, 부분 문자열을 포함하지 않는 범위를 제공합니다.

arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttds', 'AAaaxcutt', 'AAaaxXDSDdscz'])
print(np.char.find(arr, 'xc'))
print(np.char.find(arr, 'xc', start=8))

요약

이 튜토리얼에서는 Numpy 라이브러리의 np.char.find() 함수에 대해 배웠습니다. 이 함수를 사용하여 문자열 배열에서 부분 문자열을 찾는 방법과 부분 문자열을 검색할 범위를 제공하는 방법을 배웠습니다. 또한 존재하지 않는 부분 문자열을 처리하는 방법도 배웠습니다.