회원보드

[web] 트래픽 아끼는 법 2 - 로봇들이 이미지 파일 등을 긁어가는 거 막는 법

2013-12-02 (월) 20:44 10년전 4,582




 
요새, 제 홈페이지 방문자 수에 비해 트래픽이 너무 많이 차지해 분석을 해보니,,,구글 로봇이 거의 대부분의 트래픽을 유발하더군요..
구글 로봇이 제 홈페이지에 있는 글을 긁어가서 신규회원이 유입되는 좋은 측면도 있지만, 너무 과도하게 긁어가 트래픽 초과를 유발합니다.
 
아래 적어진 것처럼, 홈페이지 운영하는 사람에겐 트래픽이 돈인데 말이죠...
트래픽이란 홈페이지에 올려진 글이나 이미지 또는 동영상 등의 정보와 자료가 방문객에게 흘러간 양을 말합니다.
이런 트래픽은 홈페이지 개설자가 호스팅 서비스를 하는 업체에 일정량을 구입해 사용하는 형식으로 이루어지죠...
제 홈페이지 경우, 실 방문자수는 그리 많지 않기 때문에 트래픽을 많이 구입하지 않았는데
요새,,구글 로봇 3 마리가 과도하게 트래픽 양을 유발하네요...
그래서, 저도 위 방법을 참고해 로봇들이 일부 자료를 못긁어가게 막았어요..
 
하지만, 로봇들이 robots.txt 에 적힌 명령을 준수한다는 전제이기 때문에, 잘 지켜질지는 미지수입니다. 
 
───────────────────────────────────────────────────────────
 
웹로봇들의 포투 블로그 방문이 잦다. 자주 방문하지 않아도 되는 블로그인 줄 모르는 모양이다. 그러니 알려줄 방법을 찾을 밖에...


66.249로 시작되는 웹로봇은 구글의 것이고 61.247로 시작되는 녀석은 네이버로봇이다.
날마다 꾸준히 들어온다. 웹로봇과 직접 소통할 수 있다면 데려다 앉혀놓고 설명을 해주면 좋으련만,
워낙 제멋대로인 녀석인지라, 끌고 갈 필요없는 파일 확장자를 알려주면 트래픽 소모가 줄어들 것이다.

포털의 웹로봇들이 설치형 블로그를 방문할때는 예의를 지켜야 하는 것은 아닌가 하는 생각도 있다.
블로거들에게 트래픽은 돈이기 때문이다.
웹로봇들은 블로거들의 글을 가져가서 돈벌이로 이용하면서
블로거들에게는 웹로봇들이 소모한 트래픽때문에 웹호스팅회사에 돈을 지불하게 한다. 불합리해 보인다. 

포털이 일부러 설치형 블로그 트래픽을 왕창 소모해서 자사 블로그 서비스로 들어오라고 압력을 가하는 지도 모른다.
이래저래 포털들은 마음에 안드는 구석이 많다.

일단 robots.txt를 작성했다. (작성한 파일을 홈페이지 계정 최상단 폴더에 넣으시면 됩니다)

User-agent: *
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.jpg$
Disallow: /*.bmp$
Disallow: /*.log$
Disallow: /*.xls$

.php와 .js를 못끌고 가게 하면 웹로봇들이 어떤 반응을 보일지 알 수 없다.
디렉토리를 막아 볼까 생각도 있지만 일단 파일 확장자를 막는 것만으로도 충분한 효과를 볼 수 있을 것이다.

웹로봇들이 robots.txt를 무시하지 않는다는 전제에서다.

또, 최근 하루에 한 두 개 정도의 아이피(IP Address)를 계속해서 막고 있다.
오늘은 룩셈부르크와 러시아에 소재한 회사의 아이피였는데, 외국산 IP가 심하게 트래픽을 소모하면 계속해서 막을 것이다.

방문자수가 제로가 돼도 상관없다.
 

분류 제목 날짜 조회
talk 음, 1
12-19 3,076
12-19 (목) 3,076
talk 승급되었네요... 3
12-18 3,253
12-18 (수) 3,253
talk xe쓰다가 배추빌더로 이사 예정... 1
12-18 4,657
12-18 (수) 4,657
talk 현재 까지의 진도 1
12-16 3,428
12-16 (월) 3,428
web 홈페이지 조회수와 게시물 수 부풀리기
12-15 4,686
12-15 (일) 4,686
web 쿠키, 세션, 캐시(=캐싱) (정의, 장점, 단점)
12-14 13,617
12-14 (토) 13,617
money 본인의 홈페이지가 1024px를 넘는 홈페이지라면...
12-13 2,091
12-13 (금) 2,091
talk 배추 님 계획안 보니까 배추라이트 접으시려고 하더군요. 2
12-13 3,409
12-13 (금) 3,409
talk 가입인사 ^^ 1
12-13 3,155
12-13 (금) 3,155
web 드래그 앤 드랍 (=드래그 앤 드롭 Drag and Drop) 정의
12-13 4,753
12-13 (금) 4,753
web 플러그인 (Plugin) 정의
12-12 2,962
12-12 (목) 2,962
money 문득, 갑자기 생각난건데, 이런 등업제 괜찮지 않나요? 5
12-11 2,390
12-11 (수) 2,390
web 스킨 (Skin) 정의
12-11 2,793
12-11 (수) 2,793
talk 갈매기 입니다. 1
12-11 3,136
12-11 (수) 3,136
talk 요새, 대딩들 시험철이라 정신 없겠군요.
12-10 3,533
12-10 (화) 3,533
web 네이버 오픈 api키 발급 받는 주소
12-10 3,127
12-10 (화) 3,127
web 화이트도메인 (White Domain) - 인증 이메일이 발송 안될 때 확인해 볼 사항
12-09 3,876
12-09 (월) 3,876
money 여러 유저의 애드센스 코드를 한 사이트에 넣을 수 있는지 여부
12-09 2,202
12-09 (월) 2,202
money 허위 토렌트 사이트로 활동하는 웹하드 파트너 주의사항
12-08 3,323
12-08 (일) 3,323
money 원천 징수 대상인 파트너 경우 주민등록번호 등 개인 정보 수집
12-08 2,516
12-08 (일) 2,516
149/153
목록
  • 채팅방
  • 필독
1. 채팅창 헤드에서 접속자 확인 2. 닉네임 클릭해 1:1 채팅 가능 3. 닉네임 클릭해 귓속말 가능 4. 닉네임 클릭해 호출하기 가능 5. 우하단 클릭해 환경 설정 가능 6. 의뢰글 작성 후 의뢰 상담 가능 7. 질문글 작성 후 질문 상담 가능 8. 채팅방에 개인정보 입력 금지 9. 채팅방에 광고 욕설 비방 금지
 홈  PC버전 로그인 일본어
웹디자인언어
서버관리언어
고급코딩언어
그누보드
제작의뢰
Q&A
커뮤니티
웹유틸
회원센터
홈짱 PC버전 로그인