BeautifulSoup을 이용한 태그의 특정 텍스트, 속성 값 불러오기

달력

« 2026/7 »

2021. 8. 5. 12:07

BeautifulSoup을 이용한 태그의 특정 텍스트, 속성 값 불러오기 Programming/Python2021. 8. 5. 12:07

728x90

안녕하세요.

제목 그대로 크롤링을 하다가 보면 다양한 값들을 읽어와야 하는데요.

그중에 특정 텍스트나 속성 값을 불러오는 방법에 대해서 간략히 알아보도록 하겠습니다.

[예시]

from bs4 import BeautifulSoup

html_source = '''
    <div class="Top div class 입니다.">
        <div class="Second div class 입니다.">
            <ul class="ul 입니다.">
                <li data-sequence='12345645'>
                <a id="link" href="특정 링크">부자되기 프로젝트!!!!!</a></li>
            </ul>
        </div>
    </div>
'''

soup = BeautifulSoup(html_source, 'html.parser')

a_tag = soup.find_all('a', attrs={"href" : "특정 링크"})

# 태그 불러오기
print('Soup 내용 그대로 불러오기', a_tag)

# 태그내 텍스트 불러오기
print('텍스 내용 불러오기', a_tag[0].text)

# attribute 값 얻어오기
li_tag = soup.find_all('li')
print(li_tag) # 리스트 형태로 반환

attribute = li_tag[0].attrs #리스트의 0 번째 태그
print('attribute 값 얻어오기',attribute)
print('특정 attribute 값 얻오기', attribute['data-sequence'])

[결과 값]

Soup 내용 그대로 불러오기 [<a href="특정 링크" id="link">부자되기 프로젝트!!!!!</a>]
텍스 내용 불러오기 부자되기 프로젝트!!!!!
[<li data-sequence="12345645">
<a href="특정 링크" id="link">부자되기 프로젝트!!!!!</a></li>]
attribute 값 얻어오기 {'data-sequence': '12345645'}
특정 attribute 값 얻오기 12345645

soup의 find_all은 보통 리스트형태로 반환됩니다.

리스트로 감싸여 있기 때문에 인덱스를 지정하고 텍스트 불러오기나, attribute 값들을 가지고 오면 됩니다.

감사합니다.

728x90

저작자표시 비영리 변경금지 (새창열림)

'Programming > Python' 카테고리의 다른 글

파이썬 캘린더 다음달 출력, calendar next month (1)	2021.09.07
판다스 데이터 프레임 각 셀 별 갯수 구하기, pandas cell length in dataframe (0)	2021.08.20
파이썬 requests로 크롤링 안될 때 해볼 수 있는 방법 (0)	2021.08.04
파이썬 스케쥴(일정) 라이브러리 Schedule (0)	2021.08.04
(1292): Truncated incorrect DOUBLE value (0)	2021.06.28

Posted by 패치#노트

패치#노트코딩, 주식, 자동매매, 백테스팅, 데이터분석 등 관심 블로그 비전공자이지만 금융 및 관련 프로그래밍에 관심을 두고 열심히 공부중입니다. 우리 모두 경제적 자유를 위해 성공해봅시다!! ※ 혹시, 블로그 내용중 문제되는 내용있으시면 알려주시면 삭제/수정 토록하겠습니다. ※ 모든 내용들은 투자 권유가 아니오니 참고만 하시고, 또한 출처는 모두 표기토록 노력하겠으나 혹시 문제가 되는 글이 있다면 댓글로 남겨주세요~^^

달력

« 2026/7 »

BeautifulSoup을 이용한 태그의 특정 텍스트, 속성 값 불러오기 Programming/Python2021. 8. 5. 12:07

'Programming > Python' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

글 보관함

링크

티스토리툴바