Airflow Start_date
Start_date
- start_date : DAG가 데이터를 읽을 시간
- scheduler가 지금 실행해야한다고 인지해야하는 시간
- start_date에 실행된다는 의미가 아니다.
- 현재 시간이 start_date보다 이전이면 DAG는 시작하지 않는다.
- DAG의 Start_date와 Airflow UI에서의 Start_date는 의미가 다르다.
- Airflow UI Start_date ⇒ Task가 실행되는 날짜
- start_date = 2023-10-23 00시라면 해당 날짜 이후부터 시작되는 DAG를 만들고 실제 동작은 이 시간이 지난 2023-10-23 1시에 시작된다는 것이다.
- 아래 실제 Airflow 그림에서는 Started = Start_date을 의미한다.
1
2
3
4
5
6
dag = DAG(
dag_id = 'scheduling',
start_date = datetime(2023, 10, 23),
schedule_interval = '0 1 * * *'
)
Execution_date
- Execution_date : 실제 DAG가 실행되도록 설계된 시간 ( 실제 실행되는 시간 X )
- Logical date라고 불리며, 코드가 동작하도록 맞춘 시간
- Airflow 그림에서는 RUN = Execution_date를 의미한다.
참조
- https://medium.com/nerd-for-tech/airflow-catchup-backfill-demystified-355def1b6f92