Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
Tags
- typescript
- 태국
- 熱海
- javascript
- local
- pyenv
- codebuild
- 메르페이
- terraform
- node.js
- markdown
- react.js
- Python
- 아타미
- 체코
- PostgreSQL
- 일본
- Selenium
- 프라하
- 페이페이
- 미츠이 스미토모
- 방콕
- duckdb
- vba
- PayPay
- JenkinsFile
- 三井住友カード
- 뮌헨
- documentdb
- CSV
Archives
- Today
- Total
도쿄사는 외노자
AWS Glue Job을 종료시키고 싶을 때 본문
일단 Glue Job의 상식.
Bookmark를 켜둔 상태로 같은 데이터에 대고 Job을 2번 실행할 시, 두번째 실행은 데이터를 0건 취득한다.
근데 데이터가 없다고 따로 종료시켜주거나 하는 게 없고, 그냥 데이터가 없는 상태로 들이박아버리더라.
데이터가 없는 상태에서 데이터 변환을 하려니 당연히 아래와 같은 에러가 터진다.

그러니 데이터가 없으면 종료시켜주는 처리를 넣고 싶었다.
그런데 이게 또 뭐 종료용 명령 같은건 없고, 그냥 파이썬의 exit() 를 써야 하는데...
sys.exit(0)을 쓰면 아래와 같이 에러로 처리된다.

os._exit(0)을 써야 Succeeded가 되더라.

이런 식으로 사용하면 된다.
import os
if df.count() == 0:
job.commit()
os._exit(0)처음엔 os._exit()로도 된다길래 몇번 시험해봤는데, status를 넣으라고 뜨더라.
TypeError: _exit() missing required argument 'status' (pos 1)
보니까 Glue 3.0부턴 status가 필요하게 되었다나.
비슷한 고민을 한 사람이 있어서 링크를 적어둔다.
'Tech > AWS for Data Engineering' 카테고리의 다른 글
| Eventbridge Scheduler를 이용한 Teams 자동 통지 (0) | 2024.01.22 |
|---|---|
| AWS Glue Job에서 Tableau에 Hyper파일 Publish하기 (1) | 2023.04.20 |
| Glue Crawler로 쌍따옴표가 포함된 CSV파일 읽기 (2) | 2023.02.14 |
| Terraform으로 CloudTraild의 Cloudwatch 만들 때 조심할 것 (0) | 2022.12.14 |
| Athena, Redshift에서의 CSV 줄바꿈 미대응 문제 (0) | 2022.10.20 |