'Log file'에 해당되는 글 1건

  1. 2008.05.24 웹로그파일 이해
2008.05.24 03:26
사이트 운영의 가장 기본은 Log 파일 분석을 통한 사용자 현황에 대한 분석일 것입니다.
그래서 이 부분에 대한 내용을 간략하게 나마 설명할까 합니다.

로그파일은 기본적으로 Extended Log Format으로 저장을 해야 로그분석기를 통하여 분석을 할 수 있습니다. 
그러나 Apache 나 다른 Web Server는 기본적으로 일반형식으로 하기에 로그분석을 하시려는 분들은 
이 부분을 인지 하고 있지 않는다면 기존의 Log 파일은 사용하실 수 없을 것입니다. 
또 로그파일은 계속적으로 증가하기에 주기적으로 초기화를 시켜 주셔야 Web Site의 속도에 영향을 주지 않는다는것도 꼭 기억해 주세요.

:: 로그파일의 Format
211.198.81.13 - - [31/May/2001:20:22:11 +0900] "GET /ihmailing/ihopen.php HTTP/1.1" 200 14
1. 접속한 Client IP주소 혹은 도메인
2. Remote_IDENT
3. 사용자명 ( .htaccess .htpasswd 에 정의된 사용자 ID )
4. Client 접속 시간 [ day/month/year:hour:minute:second zone ]
5. Client 요청 종류 [ GET, POST ]
6. Client 가 요청한 URL 주소
7. 프로토콜 버전
8. 상태 코드  [ 200/301/304/400/401/404/500 ]
9. 전송데이터 크기
* '-' 은 값이 없다는 표기

:: 용어설명
기본적인 용어 설명전에 꼭 알아야 하는 Log 파일의 비밀이 있으니  이 부분은 이해를 해 주세요.
210.123.5.11 - - [31/May/2001:20:39:36 +0900] "GET /test/log.html HTTP/1.1" 200 77
210.123.5.11 - - [31/May/2001:20:39:36 +0900] "GET /img/abc.gif HTTP/1.1" 200 9745
위는 log.html를 요청했을때 log에 저장된 값입니다.
주목할것은 web server는 log.html를 찾아 출력하고 log 파일에 저장하후 log.html에 있는 
img tag 의 abc.gif를 출력후 log에 저장을 합니다.
일반적으로 포탈사이트에서 말하는 Hit수는 이값을 의미하기에 문제가 있다는것입니다.
일반사용자가 한 Page를 방문하였다고 할때 해당 Page에 이미지가 5개가 있었다고 하면
Hit수는 6이 되는것이지요.

ㅁ Hit
로그파일에 기록된 하나의 Record
ㅁ Hits
성공(success)" 상태 코드를 가진 히트들 수.
ㅁ Page views
HTML ,CGI, PHP등 의 특정문서의 Hit 수
ㅁ visits
방문자가 사이트를 찾은 횟수.
미활동-시간 제한치(idle-time limit) 이상 방문자가 활동하지 않으면, 새로운 사람으로 인식하여
count 증가
Posted by 부니기

티스토리 툴바