가상의 HTML 코드가 있을 때, 특정 태그(<h1>, <p>) 안에 있는 글자만 가져오는 예제입니다.
# 1. 라이브러리 불러오기
from ( A ) import BeautifulSoup
# 2. 분석할 HTML 코드 (보통은 웹사이트에서 가져오지만, 여기선 직접 입력해봐요)
html_doc = """
<html>
<body>
<h1 id="title">코딩 뉴스</h1>
<p class="content">파이썬으로 웹 크롤링을 배워봅시다!</p>
</body>
</html>
"""
# 3. BeautifulSoup으로 HTML 요리(분석) 시작
soup = BeautifulSoup(html_doc, 'html.parser')
# 4. 제목(h1 태그) 가져오기
title_tag = soup.( B )('h1')
print("제목 태그 내용:", title_tag.text)
# 5. 본문(p 태그) 가져오기
p_tag = soup.find('( C )')
print("본문 내용:", p_tag.text)
[빈칸 힌트]
- ( A ): 라이브러리 전체 이름이 아닌, 짧게 부르는 이름 bs4를 적어보세요.
- ( B ): "찾다"를 뜻하는 영어 단어는?
- ( C ): 본문 내용이 들어있는 태그의 이름은 무엇인가요? (코드 7번 줄 참고)