Loading...
Ggplot2 데이터시각화 그리고 R 코딩
많은 데이터가 빅데이터로 바뀌고 있다. 생활 속에 광범위하게 침투한 전자기기가 쏟아내는 실시간 정보는 날이 갈수록 좋아지는 컴퓨터 성능으로 손쉽게 처리된다. 따라서 이러한 빅데이터를 시각화하는 것은 실용적인 중요성 뿐 아니라 학문적 중요성도 동시에 가지게 된다.
빅데이터의 통계처리에 특화된 R 언어 패키지로서 ggplot2 경우는, 빅데이터의 학문적 활용에 두드러지게 많이 활용된다. 이 책은 이러한 ggplot2 데이터시각화를 다룬다.
다른 책에서는 찾기 어려운 이 책만의 뚜렷한 장점은 두 가지이다. 첫 번째는 ggplot2 작동원리를 예시를 들어가면서 분명하게 설명한다는 점이다. 이유는 알 수 없지만, ggplot2 패키지를 만든 이가 쓴 책을 포함한 거의 대부분 전문서적에서도 ggplot2 문법 작동원리가 명확하게 제시되어 있지 않다. 유화를 그리듯 덧칠한다는 원리는 상대적으로 잘 설명되어 있다. 하지만 한번 설정한 것이 이후 작업에도 계속 이어지는가 이어지지 않는가를 다루는 상속inheritance 원리는 그렇지 않다. 두 번째는 도구인 패키지 ggplot을 학습을 통한 R 코딩 원리 이해이다. 보통은 기본 언어 코딩을 배우고 그 다음에 패키지로 넘어가는 수순이다. 이 책의 접근방식은 정반대이다. 비유를 들자면, 이 책의 학습방법은 계산기를 사용한 수학원리의 이해와 비슷하다. 구체적으로 얘기하자면, 요인factor 개념을 들 수 있다. 막대도표를 그림으로써 왜 이러한 요인이라는 형태가 언어에 있어야 하는지를 이해할 수 있다. 통계학자가 만든 R 언어는 통계처리에 특화되어 있다. 이러한 특화는 문자와 숫자가 결합된 형태를 불가피하게 만든다. 시각적으로 제시되어야만, 이러한 구조가 눈에 들어올 수 있다. 당연히 눈에 들어오면 이해가 쉬워진다. 사실은 책 제목에서 알 수 있는 또 하나의 장점이 있다. 데이터시각화 원칙 ggplot2 사용법 그리고 R코딩을 한 권의 책에 쉽고 깊이있게 연결시킨 점이다.
도서정보
- 출간일
- 2024-08-14
- ISBN
- 9791193707531
- 도서성격
- 국내전문도서
- 전체페이지
- 개정구분
- 초판
- 저작페이지
저자정보
