내블로그 | 랜덤블로그 쪽지
blackhs님의 블로그
https://blog.yes24.com/blackhs
리스트 | RSS
태그 & 테마링 | 방명록
blackhs
님의 블로그
프로필 쪽지 친구추가
11월 스타지수 : 별19
전체보기
기본 카테고리
나의 리뷰
나의 리뷰
기본 카테고리
나의 메모
기본 카테고리
태그
내용이 없습니다.
2023 / 11
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30
월별보기
나의 친구
나의 친구들
최근 댓글
내용이 없습니다.
새로운 글
오늘 3 | 전체 289
2007-01-19 개설

전체보기
혼자공부하는 데이터분석 with 파이썬 | 기본 카테고리 2023-02-22 20:14
https://blog.yes24.com/document/17619505복사Facebook 보내기 트위터 보내기

[도서]혼자 공부하는 데이터 분석 with 파이썬

박해선 저
한빛미디어 | 2023년 01월

내용     편집/구성     구매하기

이 책은 데이터분석의 기초기술부터 고급기술까지 json, xml, csv, 웹스크래핑, 데이터 전처리, 통계와 데이터 시각화, 검증과 예측까지 경험해 볼 수 있다.

위 상품을 구매하면, 리뷰등록자에게 상품판매대금의 3%가 적립됩니다. (상품당 최대 적립금액 1,000원) 애드온 2 안내

데이터가 쏟아진다.

자율주행자동차가 돌아다니고 사물들이 인터넷(IoT)하는 시대이니 그럴수밖에 없다.

어떤 산업분야든, 수집되어 누적된 데이터들이 상당하기에 우리가 어떤 직업을 갖던지 관계없이 어떤 포커스로 분석해 나갈지 기획하며 수집단계에 반영할 줄 알아야 하는 시대이다.

전국의 초등학생부터 ~ 성인까지 참여하는 전국민 온라인 코딩파티에도 데이터 분석파트가 추가 된지 오래 되었다. 권장학년은 고등학생 이라고 되어 있지만, 요즘 아이들은 초등학교 6학년만 되어도 시도해 보곤 하며 중학생들도 따라하며 가뿐하게 완성한다.

코딩을 왜 하느냐?

분석을 왜 하느냐? 나랑 관계 없다고 말하는 사람도 있을지 모르겠다.

하지만 자신있게 말할 수 있다.

코딩능력과 데이터를 분석하고 결과를 해석하는 능력을 갖춘 사람은 경쟁력 자체가 다르다고 말이다.

파이썬은 다양한 분야에서 많이 사용되고 있는 프로그래밍 언어이다. 데이터 분석과 머신러닝이 나오면서 그 인기가 급상향되어 지금은 그 인기는 프로그래밍 언어분야에서 1위이다.

파이썬은 문법이 간단하고 직관적이기 때문에 처음 프로그래밍 하는 사람들도 쉽게 배울 수 있다.

또 라이브러리가 많아서 필요에 따라 최적화된 라이브러리를 활용할 수 있는 강점이 있다.

파이썬을 처음 배우는 사람들은 어떤 책부터 보아야 할까?

각각의 선호하는 스타일이 있겠으나 기초 서적으로 최소 3권이상 보는 것이 좋은 것같다.

그 중의 하나는 한빛미디어의 <혼자공부하는 파이썬>을 추천한다.

영상강의도 군더더기 없이 깔끔하고 핵심을 잘 설명하였다. 유튜브에 공개 되어 있으니 책과 함께 보기에도 딱이다!

파이썬의 기본 문법을 다졌다면 이제 데이터분석도 시작해 보자.

파이썬으로 데이터 분석을 하려면 다음의 라이브러리부터 시작해 보자.

  • Pandas : 데이터를 다루기 위한 가장 선호하는 라이브러리로 테이블 형태의 데이터를 다루는데 아주 편리하다.

  • Matplotlib : 가장 많이 사용되는 시각화 라이브러리로 여러 형태의 그래프를 그리는데 유용하다.

  • Numpy : 다차원 배열을 다룰 수 있는 라이브러리로 수치계산을 위한 기본 라이브러리이다.

  • Seborn : Matplotlib보다 더 간단한 문법으로 멋진 그래프를 완성할 수 있다.

데이터분석에 유용한 이 파이썬 라이브러리를 어떻게 시작하면 좋을까?

<혼자 공부하는 데이터 분석 with 파이썬> 책으로 시작하기에 충분하다.

 

 

이 책은 데이터분석의 기초기술부터 고급기술까지 단계적으로 학습하며 경험해 볼 수 있도록 구성되어져 있다.

데이터 분석은 통계학, 확률, 수학적 지식등의 기초 이론도 알아야 하고 프로그래밍 언어도 잘 다룰 수 있어야 하는 분야이다. 그렇기에 막연하게 시작하다가는 중간에 포기하게 된다.

그러니 좋은 교재로 하나씩 하나씩 실습하는 과정이 필요하다.

잘 모를 때에는 일단 듣고, 전문가가 만들어 놓은 것을 실행하며 이해하는 것이 최고다!

이번에는 이 책 흐름을 살펴보면 분석가 작업의 흐름대로 구성한 것을 볼 수 있다.

json, xml, csv, 웹스크래핑, 데이터 전처리, 통계와 데이터 시각화, 검증과 예측까지 경험해 볼 수 있다.

  • 이해 및 분석환경 구성 : 분석을 위한 이해, 환경 세팅에 대해서 먼저 설명한다. 데이터분석의 입문자를 위해 데이터분석에 대한 이해부터 시작한다. 파이썬 에디터로 구글코랩 사용하는 방법도 설명하고 이 책의 깃허브 저장소에서 해당 소스코드를 이용해서 실습도 가능하도록 하였다.

  • 데이터 사이트 소개 : 텍스트 형태의 가장 범용적인 데이터 csv 파일 다루는 법과, 데이터를 확보 할 수 있는 사이트도 소개한다. 믿을 만한 데이터를 바탕으로 분석해야 하니 말이다.

  • 데이터 수집 : 파이썬에서 API를 이용해서 json, xml 데이터를 다루는 방법과, 웹 스크래핑을 이용해서 원하는 자료를 수집하는 방법도 알려준다.

  • 데이터 정제 : 불필요한 데이터를 삭제하거나 수정하는 등의 데이터 전처리 방법도 알려준다. 데이터 분석에서 데이터전처리는 필수적인 과정이다. 전처리 작업만 잘 되어 있어도 일의 절반은 했다라고 표현할 정도이다.

  • 데이터 요약 : 가볍게 할 수 있는 기술통계부터 중앙값, 분산과 표준편차 등을 구하고 그래프로 표현하는 방법을 다루었다.

  • 데이터 시각화와 고급기능 : 앞 장의 그래프의 품질에서 한단계 더 나가서 matplotlib를 자세하게 설명한다. 파이썬 데이터 분석에서 matplotlib는 필수이니 꼭 필요한 과정이다.

  • 검증과 예측 : 통계적 추론과 요즘 핫한 머신러닝으로 예측하는 방법 두 가지를 다루었다.

<혼자공부하는 데이터분석 with 파이썬> 책은 '혼자공부하는 시리즈'의 특장점을 일관성있게 반영하였다.

1. 실습위주로 구성한 점

2. 무료 동영상 강의를 통해서 이해를 향상 시키고 든든한 지원군이 되어 준 점

3. "혼자공부하는"의 취지에 맞게 스스로 확인해 볼 수 있도록 한 점

4. 각 챕터가 끝날때마다 핵심을 다시 한번 집어주고 연습문제를 통해서 확인 할 수 있도록 한 점

5. 용어노트만 분리해서 갖고 다니면서 익힐 수 있도록 한 점

 

책 뒷부분에는 챕터별로 함수들만 따로 모아서 정리가 되어 있다.

필요할 때 빨리 빨리 찾아야 하는데 이런 요약 정말 유용하다.

 

파이썬으로 하는 데이터 분석은 중학생 부터 지도하고 있어서 입문 책부터 다양하게 보고 있다.

'혼자 공부하는 ' 시리즈는 각 장의 앞부분의 목표와 키워드가 늘 명확하게 제시되어 있고 챕터가 마무리 될 때마다 요약과 문제풀이를 통해서 이해정도를 확인할 수 있어서 유용하다.

처음 접하는 사람에게는 어려울 수도 있음을 배려하여, 인트로 부분에 이해를 도와주는 흥미로운 그림도 있어서 친근감이 드는 책이다. 용어도 따로 모아져 있으니 반복하기에도 좋고 실습하기에도 편리하게 되어 있다.

실습을 하다가 중간에 문제가 생기면 진전이 안될 수 도 있는데 '혼자공부하는' 시리즈는 그런 부분이 거의 없다고 볼 수 있다. 실습위주로 구성되어져 있고, 실제 데이터를 사용하여 분석을 수행하는 방법을 정말 자세하게 설명하기 때문에 꼼꼼하게 확인하면서 경험해 볼 수 있다.

이 책 <혼자공부하는 데이터분석 with 파이썬> 은 데이터 분석을 처음 공부하는 사람들을 대상으로 하여 작성 되었으나, 뒷부분에는 검증과 예측까지 다루고 있기 때문에 데이터 분석을 공부하는 사람들은 실습하면 도움이 되는 책이라고 생각한다.

이 글이 좋으셨다면 SNS로 함께 공감해주세요.
댓글(0) 트랙백(0)
이 리뷰를 | 추천 0        
진행중인 이벤트
나의 북마크
이벤트 세상