Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 카마츠루
- 프라하
- Python
- CSV
- vba
- javascript
- JenkinsFile
- pyenv
- 체코
- 페이페이
- react.js
- documentdb
- 아타미
- node.js
- 미츠이 스미토모
- duckdb
- PostgreSQL
- 방콕
- 메르페이
- 三井住友カード
- Selenium
- local
- PayPay
- terraform
- 釜つる
- 뮌헨
- 熱海
- typescript
- codebuild
- 태국
Archives
- Today
- Total
도쿄사는 외노자
AWS Glue Job을 종료시키고 싶을 때 본문
일단 Glue Job의 상식.
Bookmark를 켜둔 상태로 같은 데이터에 대고 Job을 2번 실행할 시, 두번째 실행은 데이터를 0건 취득한다.
근데 데이터가 없다고 따로 종료시켜주거나 하는 게 없고, 그냥 데이터가 없는 상태로 들이박아버리더라.
데이터가 없는 상태에서 데이터 변환을 하려니 당연히 아래와 같은 에러가 터진다.
그러니 데이터가 없으면 종료시켜주는 처리를 넣고 싶었다.
그런데 이게 또 뭐 종료용 명령 같은건 없고, 그냥 파이썬의 exit() 를 써야 하는데...
sys.exit(0)
을 쓰면 아래와 같이 에러로 처리된다.
os._exit(0)
을 써야 Succeeded가 되더라.
이런 식으로 사용하면 된다.
import os
if df.count() == 0:
job.commit()
os._exit(0)
처음엔 os._exit()
로도 된다길래 몇번 시험해봤는데, status를 넣으라고 뜨더라.
TypeError: _exit() missing required argument 'status' (pos 1)
보니까 Glue 3.0부턴 status가 필요하게 되었다나.
비슷한 고민을 한 사람이 있어서 링크를 적어둔다.
'Tech > AWS for Data Engineering' 카테고리의 다른 글
Eventbridge Scheduler를 이용한 Teams 자동 통지 (0) | 2024.01.22 |
---|---|
AWS Glue Job에서 Tableau에 Hyper파일 Publish하기 (1) | 2023.04.20 |
Glue Crawler로 쌍따옴표가 포함된 CSV파일 읽기 (2) | 2023.02.14 |
Terraform으로 CloudTraild의 Cloudwatch 만들 때 조심할 것 (0) | 2022.12.14 |
Athena, Redshift에서의 CSV 줄바꿈 미대응 문제 (0) | 2022.10.20 |