프로젝트 의 Python 스킬 트리

BeautifulSoup 을 사용한 Python 웹 스크래핑

초급

이 프로젝트에서는 Python 과 BeautifulSoup 라이브러리를 사용하여 웹 스크래퍼를 구축하는 방법을 배웁니다. 목표는 대상 웹사이트인 세계 대학 학술 순위에서 특정 정보를 추출하여 추가 분석을 위해 데이터를 저장하는 것입니다.

python

💡 이 튜토리얼은 영어로 번역되었습니다. 원본을 보려면 영어로 전환

소개

웹 스크래핑 챌린지에 오신 것을 환영합니다! 이 챌린지에서는 BeautifulSoup, httpx, lxml 세 가지 강력한 Python 라이브러리를 사용하여 웹 스크래핑의 세계를 탐험하게 됩니다. 웹 스크래핑은 웹사이트에서 정보를 추출하는 기술이며, 데이터 추출, 자동화 및 분석에 유용한 기술입니다.

목표는 저장된 웹 페이지에서 상위 30 개 대학에 대한 정보를 검색하는 것입니다. BeautifulSoup 모듈, httpx 모듈 및 lxml 모듈을 설치하고, 대상 웹 페이지에 액세스하여 30 줄로 구성된 출력을 인쇄하는 스크립트를 구현해야 합니다.

강사

labby
Labby
Labby is the LabEx teacher.