2005년 6월 15일 수요일

{Book Review} Spidering Hacks



[Anonymous님 曰] 서핑만으로는 부족하다고 느껴질 때가 있는 법이다. 좋아하는 책이 판매순위 몇위인가를 체크하는 것도 지겹고, 다운로드하고 싶은 이미지나 미디어 파일을 찾아 다니는 것도... 매일같이 같은 사이트에서 특정 데이터를 보는 것도 지겹다... 주식, 일기예보, 뉴스... 이 책은 이런 지겨운 서핑의 일상으로부터 탈출하고 싶은 사람에게 눈이 번쩍 뜨이는 책이다.

또한 평소 익힌 펄에 관한 실력을 다방면으로 테스트해 보고 싶은 사람에게도 더운 여름날 한줄기 소나기 같은 책이다. 잡학에 능한 guru라도 이 책을 통해 몰랐던 것들을 몇 가지 발견하게 될 것이다.

이 책은 펄 사용자를 위한 책이다. 자바, 파이선, PHP도 있지만 대부분 펄을 사용해 해킹하기 때문에 펄을 싫어한다면 이 책을 읽지 않기를 권한다. 하지만 펄에 관한 기본적인 지식만 있다면 이해할 수 있고, 네트워크 프로그래밍 지식을 요구하지도 않는다. 내용 역시 그리 복잡하지 않다. 설사 내용이 복잡하다 하더라도 코드 샘플과 함께 해킹하는 법이 예제를 곁들여 확실하게 설명되어 있다.

미디어 파일 수집하기, 미국 국회 도서관의 영화 파일 다운로드하기, 플레이 리스트에서 MP3 다운로드 하기, nget을 사용해 유즈넷에서 다운로드 하기, 아마존에 새로 리뷰를 올리면 이메일 받기, 아마존 서평 스크랩 하기, 블로그에 새로운 커멘트가 올라왔는지 체크하기, 관심있는 블로그 자동 발견하기, TV 프로그램 스크랩 하기, 필터링, wget과 rsync로 웹사이트 미러링 하기, 야후!, 아마존, 구글, 알렉사 및 온라인 은행같은 기타 유명한 정보 소스 데이터베이스에서 데이터 가져오기, 크론이나 기타 스케쥴링 툴로 자동 수집하게 만들기, 웹서비스, RSS 피드 생성하기, 페덱스로 보낸 택배 추적하기, 로봇 가라오께... 등등에 관한 테크닉을 다룬다. 설사 내가 원하는 데이터 소스가 책에 없다 해도 이 중 한가지 방법을 사용하면 어디서든 원하는 것을 구할 수 있다.

펄이 싫다면 펄을 사용하지 않는 해킹은 얼마 나오지 않기 때문에 구입하지 않는 것이 좋다. 탐색하기 좋아하고 호기심 끝내주게 많은 펄 해커에게 권하고 싶은 책이다.

댓글 없음: