내블로그 | 랜덤블로그 쪽지
REDLINE님의 블로그
http://blog.yes24.com/nataren
리스트 | RSS
태그 & 테마링 | 방명록
REDLINE
님의 블로그
프로필 쪽지 친구추가
11월 스타지수 : 별315
댓글알리미 비글 : 사용안함
전체보기
기본 카테고리
나의 리뷰
나의 리뷰
기본 카테고리
나의 메모
기본 카테고리
태그
내용이 없습니다.
2020 / 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
월별보기
나의 친구
나의 친구들
최근 댓글
내용이 없습니다.
새로운 글
오늘 1 | 전체 37
2007-01-19 개설

전체보기
웹 크롤러를 만들고 싶다면 읽어보면 좋을 책 | 기본 카테고리 2020-10-22 09:26
http://blog.yes24.com/document/13200546복사Facebook 보내기 트위터 보내기

[도서]파이썬으로 웹 크롤러 만들기

라이언 미첼 저/한선용 역
한빛미디어 | 2019년 03월

내용     편집/구성     구매하기

웹 크롤러를 만들고 싶다면 꼭 읽어보면 좋을 책

위 상품을 구매하면, 리뷰등록자에게 상품판매대금의 3%가 적립됩니다. (상품당 최대 적립금액 1,000원) 애드온 2 안내



대상독자 

파이썬을 이용해 웹 크롤러를 만들고 싶은 사람


좋았던 점

1. 웹 크롤링/웹 스크래핑이 무엇인지 모르는 사람들에게도 이해하기 쉽게 구성된 챕터

2. 매끄러운 번역

3. 다양한 예제, 라이브러리를 통한 코드의 용이한 작성 및 완성

4. 데이터를 다루는 부분에 대한 상세한 챕터

5. 실용적인 예제로써 웹 스크래이핑의 윤리와 합법성에 대한 부록


요근래에 파이썬에 대해 많은 관심이 생겨서 혼자하는 파이썬 책과 온라인 강의를 통해  기초를 배우고 공부할 수 있었다. 


그 와중에 웹 크롤링이라는 아주 흥미롭고 재미있는 기법을 알게 되었는데,  처음에는 관심있는 배우의 사진을 한꺼번에 저장하는 방법을 예제를 통해 완성해 작동시켜보았다. 그 이후로 웹을 통해 파이썬을 활용할 수 있는 더 다양한 방법이 뭐가 있을까 검색해보던 중, 데이터 수집과 웹 크롤링(스크래핑) 기법이 밀접한 관계에 있다는 것을 알게 되었고 관련 서적을 읽어 볼 생각을 하게 되었다.  

마침 온전히 웹 크롤링을 전반적으로 다루는 책을 읽을 수 있게 되었다.


아쉽게도 이 책은 초급자가 그대로 따라하면 따라할 수 있겠지만, 그래도 조금은 문법같은 것을 알고 접하는 편이 좋을 것 같다.


먼저 이 책의 모든 내용이나 마찬가지인 웹 스크래핑이란, 데이터를 수집하는 작업 전체를 뜻한다. 웹페이지를 가져와 페이지 내 데이터를 추출하는 것을 뜻한다.


읽어보면서 느낀 이 책의 가장 기초적이면서 핵심적인 내용은 다음 키워드들 인 것 같다.

- API / beautifulSoup

- html 분석

- csv를 통한 문서 저장 및 읽기

- 스크레이퍼(scrapy)


위의 4가지를 통해서 파이썬을 통해 웹상에서의 방대한 양의 데이터를 어떻게 수집하고 잘라내고 저장해서 우리가 원하는 자료로 만들어 내는지를 예제를 통해 학습하고 실행해 볼 수 있다.


완독하고 나니 책을 통해 단순히 사진을 저장하기만했던 과거에서 데이터를 구성할 수 있는 단계로 레벨업할 수 있게 되어서 뿌듯하다.

두세번 더 읽으면 나만을 위한 웹 데이터사전을 만들 수 있을것 같다.

이 글이 좋으셨다면 SNS로 함께 공감해주세요.
댓글(0) 트랙백(0)
이 리뷰를 | 추천 0        
진행중인 이벤트
나의 북마크
이벤트 세상