Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- markdown
- 미츠이 스미토모
- documentdb
- vba
- 뮌헨
- 釜つる
- node.js
- PostgreSQL
- 아타미
- 프라하
- 체코
- 三井住友カード
- codebuild
- 메르페이
- pyenv
- Python
- terraform
- PayPay
- local
- typescript
- CSV
- 태국
- react.js
- javascript
- 방콕
- Selenium
- 熱海
- 페이페이
- JenkinsFile
- duckdb
Archives
- Today
- Total
도쿄사는 외노자
Databricks Git folder 추가하기 본문
개요
Databricks Git folder는 Databricks 워크스페이스에서 Git 저장소를 직접 연동해 코드 버전 관리와 협업을 지원하는 기능.
이 도큐먼트에서는 간단한 설명 및 세팅, 조작 방법 등에 대해 적어 보도록 한다.
상세
Git integration for Databricks Git folders
장단점
장점
- Databricks UI에서 Git 주요 기능(Clone, Commit, Push, Pull, 브랜치 관리, diff 등) 사용 가능
- 다양한 Git 제공자(GitHub, GitLab, Bitbucket 등) 지원
- 노트북, 코드 파일 등 다양한 파일 버전 관리
- CI/CD 파이프라인 연동 및 자동화 가능
- 시각적 diff, 충돌 해결 등 협업에 유리
단점
- 복잡한 Git 작업(리베이스, 충돌 해결 등)은 제한적
- 네트워크, 인증(PAT, OAuth 등) 설정 필요
- 대용량 저장소/파일 처리 시 성능 저하 가능
- 일부 Git 워크플로(submodule 등) 미지원 또는 제약
- 폴더 권한 관리가 혼동될 수 있음
Git folder 다루기
Databricks와 GitHub 계정 연동
Settings - Linked accounts - Add Git credential
Git provider에서 'GitHub' 선택, 'Link Git account' 클릭 후 'Link'
연결됨
Git folder
Workspace - Create - Git folder
Git repository url 을 입력하면, 나머진 알아서 채워짐
연결됨
test_nb Notebook file 작성 후, Git... 선택
Branch 작성 및 Commit & Push 가능
Github 에서 확인 가능
결론
DBX 상에서 GUI를 이용하여 직관적으로 소스 관리가 가능하다는 점은 만족스러움.
다만 DBX는 아래와 같이 VS Code 연계도 가능하므로, 이를 이용할 경우엔 더욱 편한 방법이 많긴 하다.