본문 바로가기
반응형

전체 글1166

주성분 분석 Biplot 전체 링크 Biplot- 데이터는 어디에 모여 있고, 그 원인이 되는 변수는 무엇인가를 한 번에 보여주는 그래프import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.preprocessing import StandardScalerfrom sklearn.decomposition import PCA# 샘플 데이터 생성np.random.seed(0)X = pd.DataFrame({ "Length": np.random.normal(10, 2, 50), "Width": np.random.normal(5, 1, 50), "Height": np.random.normal(7, 1.5, 50), "Weight.. 2026. 1. 18.
데이터 분석 기획 전체 링크 분석 대상과 방법- 최적화 : What + How = 분석 대상도 알고, 방법도 아는 경우- 솔루션 : What = 분석 대상만 아는 경우- 통찰 : How = 분석 방법만 아는 경우- 발견 : 아무것도 모르는 경우 조직 구조- 집중구조 : 별도의 분석 전담 조직, 현업 분석 업무와 이중화/이원화 가능성 높음- 기능구조 : 일반적인 구조, 별도 분석 조직 없이 해당 업무 부서에서 분석 수행, 전사적 핵심분석이 어려움- 분산구조 : 분석조직 인력들을 현업부서로 직접 배치, 신속한 대응 가능 STEEP- Social- Technological- Economic- Environment- Political 분석 기획시 고려사항 : 관련 데이터, 유즈케이스, 장애 요소에 대한 사전 계획 수립분석기획 .. 2026. 1. 1.
데이터 처리 기술 전체 링크 CDC (Change Data Capture)- 데이터베이스에서 발생하는 변경 사항을 실시간으로 감지·수집하여 다른 시스템으로 전달하는 기술- 푸시 : 데이터 source에서 변경 식별, target에 데이터 적재- 풀 : 정기적으로 데이터 적재 CDC : Log Scanner on Database- 데이터베이스 영향 최소화, 변경 식별 지연시간 최소화, 트랙잭션 무결성 영향 최소화, 스키마 변경 불필요- Time Stamp on Rows : 마지막 변경 시점을 기록, 변경 시점을 기준으로 데이터 식별 (실시간 추적 X)- Version Numbers on Rows : 버전을 기록, 참조 테이블- Status on Rows : 위 두 기법에 대한 보완, 데이터 변경 여부를 True / Fal.. 2025. 12. 28.
데이터 이해 전체 링크 암묵지 - 말이나 문서로 표현하기 어려운 지식- 경험, 직관, 감각, 노하우에 기반- 숙련 개발자의 "이 코드는 왠지 위험해 보인다"는 감각- 개인의 내면화된 지식 → 조직의 지식으로 공통화 형식지- 문서, 수식, 코드, 매뉴얼 등으로 표현 가능한 지식- 공유와 저장이 용이- API 문서, 알고리즘 설명서, 코딩 규칙- 언어, 기호로 표출화된 지식 → 개인 지식으로 연결화 내면화 : 형식지 → 암묵지, 문서·이론으로 배운 것을 직접 해보며 체득하는 과정공통화 : 암묵지 → 암묵지, 말이나 문서 없이, 경험을 공유하면서 암묵지가 다른 사람에게 전이표출화 : 암묵지 → 형식지, 개인의 경험 · 머릿속 감각 · 노하우를 언어, 문서, 그림, 공식 등으로 표현연결화 : 형식지 → 형식지, 이미 문서.. 2025. 12. 23.
데이터 시각화 전체 링크 Arc GIS- 전문 GIS(Geographic Information System) 소프트웨어 플랫폼 Geocoding- 좌표계 ↔ 주소 또는 행정 구역으로 변환 모자이크 플롯- 범주형 데이터 간의 관계(연관성)을 시각적으로 보여주는 그래프 워들 (Wordle)- 단어 빈도(출현 횟수)를 시각적으로 표현한 워드 클라우드(Word Cloud)의 대표적인 예- 계층 구조나 연결 고리, 관계성을 표현하기에는 부적합 데이비드 맥캔들러스의 시각적 이해의 위계- 데이터 : 시각화, 정보 : 디자인, 지식 : 매핑, 지혜 : undefined 시각화 인사이트 프로세스- 탐색 → 분석 → 활용슬라이스 - 한 개의 차원에서 특정 값만 선택해서 데이터를 얇게 자르는 것- 다차원 → 차원이 하나 줄어든 데이터-.. 2025. 12. 18.
[코드트리] 가로등 설치 (코드트리, 2025 하반기 오후 2번, B형) SW 역량테스트 합격하기 A형 강의 오픈!! (인프런 바로가기) 삼성 A형 전체 링크삼성 B형 전체 링크 참고- B형 필수 : 우선순위 큐 Priority Queue- BOJ 10825 : 국영수 https://www.codetree.ai/ko/frequent-problems/samsung-sw/problems/street-light-installation/description 이 문제는 1. 가로등 사이의 거리2. (가장 왼쪽의 가로등 - 1) * 2,3. (N - 가장 오른쪽의 가로등) * 2 중 가장 큰 값을 구하는 문제다. 가장 왼쪽 또는 오른쪽 가로등이 제거될 때, 가로등 index를 갱신하면 2 / 3 번 값을 항상 구할 수 있다.1.은 우선순위 큐를 이용해서 가장 큰 값을 구하면 된다.이때.. 2025. 12. 18.
[코드트리] AI 로봇청소기 (삼성 SW 역량테스트 2025 하반기 오후 1번) A형 필수 알고리즘을 체계적으로 배우고 싶다면? (인프런 바로가기) https://www.codetree.ai/ko/frequent-problems/samsung-sw/problems/ai-robot/description 참고- 코드트리 빵 (삼성 SW 역량테스트 2022 하반기 오후 1번) 좌표를 관리하기 위한 RC 구조체와 문제에서 제시하는 값을 define한다.#define MAX (30 + 5)#define WALL (-1)#define INF (0x7fff0000)#define RIGHT (0)#define BOTTOM (1)#define LEFT (2)#define UP (3)int T;int N, K, L;int MAP[MAX][MAX];bool check[MAX][MAX]; // 청소기 좌.. 2025. 12. 17.
[코드트리] 해적 선장 코디 (코드트리, 2025 하반기 오전 2번, B형) SW 역량테스트 합격하기 A형 강의 오픈!! (인프런 바로가기) 삼성 A형 전체 링크삼성 B형 전체 링크 참고- B형 필수 : 우선순위 큐 Priority Queue- BOJ 10825 : 국영수- 이중 우선순위 큐 https://www.codetree.ai/ko/frequent-problems/samsung-sw/problems/pirate-captain-coddy/description 공격 준비 공격력이 가장 높고, 같은 공격력인 경우 id가 작은 선박을 구하기 위해 우선순위 큐를 사용한다.우선순위 조건은 다음과 같다.SHIP heap[100100];int hn;int isPriority(SHIP a, SHIP b){ if (a.pw != b.pw) return a.pw > b.pw; // 공격력.. 2025. 12. 15.
확률분포 전체 링크 감마 분포의 경우 θ = 1 / β로 사용할 수 있다. (β = rate, θ = scale) 베르누이 분포 - 한 번의 시행에서 성공(1) 또는 실패(0)이항 분포 - n번 독립 시행에 대한 성공 횟수푸아송 분포 - 단위시간(또는 구간) 내 발생 횟수지수 분포 - 사건 발생까지의 대기시간감마 분포 - k번째 사건이 발생할 때까지 시간, α=사건 발생 횟수, β=단위시간(또는 구간)에서 발생하는 평균 사건 수정규 분포 - 연속형 실수 값t 분포 - 표본평균의 표준화된 형태예시 1 감마 분포에서 α = 5, θ = 3일 때, 다음을 구하라.예시 2 정규분포 신뢰구간 z 값from scipy.stats import normconfidence = 0.95alpha = 1 - confidencez .. 2025. 12. 12.
반응형