728x90
보안을 위해 cloudflare 를 사용하는 페이지들이 있다.
이런 페이지를 크롤링하려면 여러가지 난관들이 있는데 구글링을 열심히 한 결과
한 가지 방법을 찾을 수 있었다.
1. https://www.zenrows.com/ 사이트에 가입 후 빌더에서 api key 를 생성한다
2. 아래와 같이 소스에 api key를 사용해서 크롤링한다
import requests
from bs4 import BeautifulSoup as bs
url = 'SITE_URL'
apikey = 'API_KEY'
params = {
'url': url,
'apikey': apikey,
'js_render': 'true',
'premium_proxy': 'true',
}
response = requests.get('https://api.zenrows.com/v1/', params=params)
soup = bs(response.text, "html.parser")
temp = soup.find("div",id="content")
print(temp.text)
반응형
'파이썬' 카테고리의 다른 글
한번에 여러개 문자열 치환기 - 파이썬 (0) | 2024.07.18 |
---|---|
UnicodeEncodeError: 'cp949' codec can't encode character '\u2013' (0) | 2024.07.16 |
for문 사용법 - 파이썬 (0) | 2024.07.08 |
다른 파일에 있는 함수 사용하기 - 파이썬 (0) | 2024.07.03 |
네이버 뉴스 댓글 가져오기 - 파이썬, 크롤링 (0) | 2024.07.03 |