본문 바로가기
개발/Python

데이터 시각화

by 피로물든딸기 2025. 12. 18.
반응형

전체 링크

 

Arc GIS

- 전문 GIS(Geographic Information System) 소프트웨어 플랫폼

 

Geocoding

- 좌표계 ↔ 주소 또는 행정 구역으로 변환

 

모자이크 플롯

- 범주형 데이터 간의 관계(연관성)을 시각적으로 보여주는 그래프

 

워들 (Wordle)

- 단어 빈도(출현 횟수)를 시각적으로 표현한 워드 클라우드(Word Cloud)의 대표적인 예

- 계층 구조나 연결 고리, 관계성을 표현하기에는 부적합

 

데이비드 맥캔들러스의 시각적 이해의 위계

- 데이터 : 시각화, 정보 : 디자인, 지식 : 매핑, 지혜 : undefined

 

시각화 인사이트 프로세스

- 탐색 → 분석 → 활용


슬라이스

- 한 개의 차원에서 특정 값만 선택해서 데이터를 얇게 자르는 것

- 다차원 → 차원이 하나 줄어든 데이터

- 어떤 차원을 기준으로 데이터를 살펴보는 것

- 2025년 매출만 보기, 서울 지역인 데이터만 보기

 

다이스

- 여러 개의 차원에서 조건을 동시에 걸어 부분 데이터 큐브를 추출

- 여러 조건을 조합해서 작은 데이터 큐브를 만드는 것

 

드릴다운

- 요약된 데이터 → 더 상세한 데이터로 내려가기

- 연도멸 매출 → 분기별 매출 → 월별 매출 → 일별 매출 ( → : 드릴다운)

- 상위 → 하위 계층

 

리버스 드릴다운

- 상세 데이터 → 더 요약된 데이터로 올라가기

- 하위 → 상위 계층


빅데이터 시각화 프로세스

1. 정보 구조화

- 데이터 수집, 탐색, 분류, 배열, 재배열 → 시각화를 위한 정보 구조화 

- 데이터 정제 (Python) + 데이터 분석 (태블로 등)

 

2. 정보 시각화 

- 대규모 비수량 정보를 시각적으로 표현

- 왜 사용하는지, 어떻게 표현하는지 설명

 

3. 정보 시각 표현

- 그래픽 디자인, 인터랙션 (시각화 툴)

 

정보 조직화

- 데이터 멍잉 : Munging, 분석이나 모델링에 쓰기 힘든 원시 데이터를, 쓰기 좋은 형태로 바꾸는 모든 과정

 

LATCH

- 정보 정리 또는 조직화 기준 5가지

- Location : 위치, 공간이나 지리적 위치를 기준으로 데이터를 배열

 

- Alpabet : 알파벳, 텍스트 기반 데이터가 많을 때 이름·단어·알파벳 순으로 배열

 

- Time : 시간, 시간의 흐름에 따라 데이터를 배열

- Category : 카테고리, 속성·그룹별로 데이터를 그룹핑

 

- Hierarchy : 위계, 값의 크기, 중요도, 순서 등을 기준으로 정렬 (트리맵)

 

 

벤 프라이의 7단계 방법론

[데이터 수집 / 마이닝]

- 정보 획득 Acquire

- 분해 Parse

- 선별 Filter

- 마이닝 Mine

-------------------------------------

[시각적 표현]

- 표현 Represent

- 정제 Refine

- 상호작용 Interact


1. 시간 시각화

- 막대 그래프, 누적 막대그래프, 점 그래프, 간트 차트, 모션 차트

 

모션 차트

- 시간의 흐름에 따라 시간 외의 다른 차원에 있는 측정값들의 변화를 동적으로 확인

 

2. 분포 시각화

- 파이차트, 도넛차트, 트리맵, 누적연속그래프

 

트리맵

- 영역 기반의 시각화

- 단순 분류 또는 위계 구조 데이터 표시

 

3. 관계 시각화

- 스캐터 플롯, 버블 차트, 히스토그램

 

버블 차트 - 갭 마인더

- 국가 간 격차(Gap)를 데이터로 이해하게 해주는 도구

 

4. 비교 시각화

- 히트맵, 체르노프 페이스, 스타차트, 평행 좌표계, 다차원 척도법

 

히트맵

- 색상으로 표현할 수 있는 다양한 정보를 일정한 이미지위에 열분포 형태의 비쥬얼한 그래픽으로 출력

 

체르노프 페이스

- 다변량 데이터(변수가 많은 데이터)를 사람 얼굴로 표현하는 시각화 기법

 

5. 공간 시각화

- 지도 매핑, 코로플레스 맵

 

코로플레스 맵 (Coropleth Map)

- 행정구역별 값을 색으로 채운 지도

 

X-ray Map

- 지도 위에 여러 레이어를 겹쳐서 속을 들여다보듯 보여주는 시각화 방식

 


에드워트 터프티의 시각 정보 디자인 7원칙

- 시간 보다는 공간순으로 나열 

- 시각적 비교 강화

- 인과 관계 제시

- 다중 변수 표시

- 텍스트, 그래픽, 데이터를 조화롭게 배치

- 콘텐츠의 질과 연관성, 진실성 확보

- 정량적 자료의 정량성을 제거하지 말기

 

정보 디자인의 개념

- 의미 만들기 (인지)

- 형태 만들기 (지각)

- 맥락 만들기 (경험)

 

정보 디자인 프로세스

와이어프레임 그리기

- 중요한 정보에 대해 이해 가능한 시각 표현 방법을 만들어 내고, 정보 계층 구조를 이해하도록 만드는 단계

 

자크 베르탱의 그래픽 7요소

- 위치 (Position) : 가장 강력한 정보 전달 수단 (중요한 정보는 좌측 상단에 배치)

- 크기 (Size) : 대소 비교는 쉬우나 정확한 수치 인식은 어려움

- 형태 (Shape) : 많은 종류를 쓰면 인지 부담 증가

- 색 (Color) : 순서·크기 인식 불가, 구분에 매우 강함

- 명도 (Value) : 순서 인식은 가능, 정확한 값 인식은 어려움

- 방향 (Orientation) : 미묘한 차이는 인식 어려움

- 질감 (Texture) : 인쇄 매체에서 특히 효과적, 밀도와 집합 표현

 

그리드

- 인쇄 디자인, 모션 인포그래픽, 인터랙션 정보 디자인

- 레이아웃을 잡고 요소를 효율적으로 배치

- 망 그리드 : 수평선과 수직선이 개체를 배치하는 지침이 됨.

 

아이소타이프 (ISOTYPE, International System of Typographic Picture Education)

- 복잡한 사회·경제·통계 정보를 그림 문자(pictogram)로 쉽게 전달하기 위한 시각 언어 체계

- 단순한 픽토그램이 아닌 하나의 기호가 일정한 수량을 대표

- 문자 또는 숫자 대신 상징적인 기호나 도형 사용

 

시각화 플랫폼

- QlikView

- Tableau : 실시간 크로스 테이블, VizQLTM

- Gephi : Edge + Node로 이루어진 복잡한 네트워크 시각화

- Visual Insight

 

시각화 라이브러리

- Flot

- Timeline

- Polymaps

- Tangle

- jQuery Visualize

- Google Charts

- D3.js : drawImage, 절차 = 데이터 획득 - 데이터 파싱 - 데이터 필터링 - 데이터 표현 - 상호작용 추가

 

인포그래픽스

- Visual.ly

- iCharts

- Visualize Free

 

반응형

'개발 > Python' 카테고리의 다른 글

데이터 처리 기술  (1) 2025.12.28
데이터 이해  (0) 2025.12.23
확률분포  (0) 2025.12.12
공분산 행렬  (0) 2025.12.12
사회연결망 분석  (0) 2025.12.07

댓글