개요
디지털 전환계의 석유(Oil),데이터 수집.
웹 크롤링, 스파이더링, 스크래핑으로 불리는데요, 크롤링 과정에서 직면하게 되는 잦은 차단은 초보개발자에게 크나큰 골칫덩이입니다.
이러한 부분을 해결하기 위한 5가지 원칙을 다루어보았습니다.
INDEX
- User-Agent를 설정해보자
- IP 주소를 최대한, 자주 변경한다.
- 크롤링 속도를 불규칙하게 조절한다.
- 정확한 파라메터(Parameter) 설정
- 적절한 예외처리
바로가기 링크 🚀
https://blog.hashscraper.com/5-principles-for-bypassing-web-crawling-blocks/
불러오는 중...