실습 1: HTML에서 원하는 글자만 건져내기

가상의 HTML 코드가 있을 때, 특정 태그(<h1>, <p>) 안에 있는 글자만 가져오는 예제입니다.

# 1. 라이브러리 불러오기
from (    A    ) import BeautifulSoup

# 2. 분석할 HTML 코드 (보통은 웹사이트에서 가져오지만, 여기선 직접 입력해봐요)
html_doc = """
<html>
  <body>
    <h1 id="title">코딩 뉴스</h1>
    <p class="content">파이썬으로 웹 크롤링을 배워봅시다!</p>
  </body>
</html>
"""

# 3. BeautifulSoup으로 HTML 요리(분석) 시작
soup = BeautifulSoup(html_doc, 'html.parser')

# 4. 제목(h1 태그) 가져오기
title_tag = soup.(    B    )('h1')
print("제목 태그 내용:", title_tag.text)

# 5. 본문(p 태그) 가져오기
p_tag = soup.find('(    C    )')
print("본문 내용:", p_tag.text)

[빈칸 힌트]

( A ): 라이브러리 전체 이름이 아닌, 짧게 부르는 이름 bs4를 적어보세요.
( B ): "찾다"를 뜻하는 영어 단어는?
( C ): 본문 내용이 들어있는 태그의 이름은 무엇인가요? (코드 7번 줄 참고)

개발자의 길: 코딩 강사가 안내하는 IT 기술 가이드

실습 1: HTML에서 원하는 글자만 건져내기

티스토리툴바