Databricks 접속 & 가입
- databricks community edition 으로 검색해서
- Sign up >> Sign in 해주면 다음과 같은 화면이 나타난다
- 무료 이용은 2주라, 2주마다 구글 이메일 계정만들어서, 크롬에 로그인 후 접속해주면 계속 이용할 수 있다.
👉 나중에 재접속 할 때는 Databricks Commuity 로 접속하도록 한다!
Cluster 생성
- cluster_name : 직접 입력
- Databricks Runtime Version : Runtime 10.0 ML(Scala 2.12 Spark 3.2.0) 선택
- 현재 버전에서는 아래를 선택
- 2시간이 지나면 클러스터가 Terminate 가 된다. 그럴 땐 기존 것을 삭제하고 동일 세팅으로 다시 만들어서 노트북과 연결해준다.
- 2주 후에 커뮤니티 계정이 종료되면 다른 구글 계정으로 접속!
[👀 팁] 여러 창을 띄울 때는 다음 부분만 복붙해서 새로운 탭에서 하기
Notebook 가져오기
- 외부에서(로컬에서) ipynb을 가져오기 위해서는 다음 경로로 접속한다.
728x90
'Python > spark(python)' 카테고리의 다른 글
[Spark] 레코드와 컬럼 삭제 / 결측치 확인 및 처리 (0) | 2023.10.25 |
---|---|
[Spark] 컬럼 생성/업데이트를 위한 withColumn() , substring(), split() (0) | 2023.10.24 |
[Spark] spark DataFrame의 orderBy( )와 aggregation (1) | 2023.10.24 |
[Spark] select() 와 filter() 메서드 (1) | 2023.10.24 |
[Spark] databrick으로 데이터 로드하고, 기술통계량 확인하기 (1) | 2023.10.23 |