문자열에서 단어 추출

Beginner

This tutorial is from open-source community. Access the source code

소개

Python 에서 문자열은 작은 따옴표 또는 큰 따옴표로 묶인 문자 시퀀스입니다. 때로는 문자열에서 개별 단어를 추출해야 할 필요가 있습니다. 이 챌린지에서는 문자열을 입력으로 받아 단어 목록을 반환하는 함수를 작성해야 합니다.

문자열을 단어로

문자열 s와 선택적 pattern 문자열을 인수로 받아 문자열의 단어 목록을 반환하는 함수 string_to_words(s: str, pattern: str = '[a-zA-Z-]+') -> List[str]을 작성하십시오.

  • 함수는 제공된 pattern을 사용하여 re.findall()을 호출하여 일치하는 모든 부분 문자열을 찾아야 합니다.
  • pattern 인수가 제공되지 않으면 함수는 기본 정규 표현식 (regexp) 을 사용해야 하며, 이는 영숫자와 하이픈에 일치합니다.
import re

def words(s, pattern = '[a-zA-Z-]+'):
  return re.findall(pattern, s)
words('I love Python!!') ## ['I', 'love', 'Python']
words('python, javaScript & coffee') ## ['python', 'javaScript', 'coffee']
words('build -q --out one-item', r'\b[a-zA-Z-]+\b')
## ['build', 'q', 'out', 'one-item']

요약

이 챌린지에서는 Python 에서 정규 표현식 (regular expressions) 을 사용하여 문자열에서 개별 단어를 추출하는 방법을 배웠습니다. 이제 이 함수를 사용하여 문자열을 단어로 분할하고 추가 작업을 수행할 수 있습니다.