Blog
About
Github
Kimuksung
Jr Data Engineer
All Stories
Aws Redshift Env&Architecture
Redshift Architecture Wclub 1Leader Node 3Compute Node Cluster Database Slice 각각 메모리, Disk, Cpu 할당 독립적인 워크로드로 병렬 실행 Leader Node query 실행 및 데이터 분산 처리 담당 Client와 Communicate...
Python PEP8
안녕하세요 오늘은 Python 기본 코드 가이드라인으로 유명한 PEP8에 대해서 알고 있는 바를 공유 드리려고 합니다.
AWS EC2 접근 With Bastion
안녕하세요 오늘은 AWS EC2 Service에 접근하기 위한 방법을 알려드리려고 합니다. 일반적으로 EC2 Service는 Private Subnet에 구성되어, 외부에서 접근이 불가능합니다.
Airflow Mongodb
안녕하세요 오늘은 Mongodb와 연동하여 데이터 가져오는 파이프라인 구축 관련해서 이야기 해보려고 합니다.
Airflow를 활용하여 S3 Parquet 데이터 Redshift 적재
안녕하세요 오늘은 S3 Parquet 데이터를 Redshift에 적재하는 방법에 대해 공유드리려고 합니다.
Airflow Dag Factory
Dag Factory란?
« Prev
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Next »
Explore
→
Spark (13)
dataengineer (1)
AWS (14)
IAM (1)
Network (3)
Airflow (24)
Linux (3)
Code (1)
OS (1)
Python (29)
S3 (1)
Redshift (4)
Mongodb (1)
AwS (1)
SSH (2)
Mssql (1)
Streamlit (1)
Distributed System (3)
Nosql (1)
File (1)
EC2 (5)
Datagrip (1)
Jenkins (3)
CI/CD (1)
Docker (5)
RDS (5)
Hadoop (6)
K8S (16)
sql (34)
redshift (1)
hadoop (5)
Pytest (1)
MultiProcessing (2)
PEP8 (1)
python_leetcode (6)
Kafka (4)
Ec2 (1)
Cluster (2)
Tableau (1)
RDBMS (1)
CloudWatch (1)
Programmers (6)
Cache (1)
Redis (1)
Prometheus (1)
Grafana (1)
Mysql (1)
Index (1)
Kubernetes (1)
Data_Governance (1)