이번에 크롤링 공부하면서 알게된 robots.txt
그동안 이런게 있는지도 몰랐다.
나무위키의 설명을 간단하게 요약하면, 크롤러의 접근을 제어하기위한 규약이다.
강제성은 없어서 꼭 지킬의무는없다고한다.
robots.txt 는 반드시 사이트의 루트경로에 있어야한다.
그래서 웬만한 사이트주소에 /robots.txt 를 붙여보면 바로나온다.
https://www.google.com/robots.txt
https://www.naver.com/robots.txt
'개발 > 기타' 카테고리의 다른 글
노트북 배터리용량 확인하기 (0) | 2019.07.02 |
---|---|
글자를 아스키아트로 바꿔주는 사이트 (0) | 2019.07.02 |
DB 비교 분석 사이트 (0) | 2019.06.25 |
내가 자주쓰는 단축키 및 실행창 명령어들 (0) | 2019.03.19 |
이미지 배경 투명하게 만들기 (0) | 2019.01.24 |