인터넷에서 데이터를 가져오기 위해서는 파이썬에서 제공하는 라이브러리를 사용할 수 있습니다. 파이썬에서는 urllib, requests, BeautifulSoup 등 다양한 라이브러리를 제공합니다. 이러한 라이브러리를 사용하여 웹 사이트에서 데이터를 가져올 수 있습니다.
가장 기본적인 방법은 urllib을 사용하는 것입니다. urllib은 파이썬 내장 라이브러리로, URL을 다루는 기능을 제공합니다. 예를 들어, 다음과 같이 urllib을 사용하여 구글 홈페이지의 HTML 소스 코드를 가져올 수 있습니다.
pythonimport urllib.request
response = urllib.request.urlopen('https://www.google.com')
html = response.read()
print(html)
requests는 urllib보다 좀 더 직관적인 인터페이스를 제공하는 라이브러리입니다. requests를 사용하여 구글 홈페이지의 HTML 소스 코드를 가져오는 예제는 다음과 같습니다.
pythonimport requests
response = requests.get('https://www.google.com')
html = response.content
print(html)
BeautifulSoup은 HTML, XML 등의 문서에서 데이터를 추출하는 데 사용되는 라이브러리입니다. BeautifulSoup을 사용하여 웹 페이지에서 특정 데이터를 추출하는 예제는 다음과 같습니다.
pythonimport requests
from bs4 import BeautifulSoup
response = requests.get('https://www.google.com')
soup = BeautifulSoup(response.content, 'html.parser')
print(soup.title)
위 예제에서는 BeautifulSoup을 사용하여 구글 홈페이지의 타이틀을 출력하였습니다. 이러한 방법을 응용하여 원하는 데이터를 추출할 수 있습니다.