본문 바로가기
Python/spark(python)

[Spark] Databricks로 시작하기

by ISLA! 2023. 10. 23.

Databricks 접속 & 가입

  • databricks community edition 으로 검색해서
  • Sign up >> Sign in 해주면 다음과 같은 화면이 나타난다
  • 무료 이용은 2주라, 2주마다 구글 이메일 계정만들어서, 크롬에 로그인 후 접속해주면 계속 이용할 수 있다.

 

👉 나중에 재접속 할 때는 Databricks Commuity 로 접속하도록 한다!

 


Cluster 생성

  • cluster_name : 직접 입력
  • Databricks Runtime Version : Runtime 10.0 ML(Scala 2.12 Spark 3.2.0) 선택
    • 현재 버전에서는 아래를 선택

클러스터 생성 완료

 

 

  • 2시간이 지나면 클러스터가 Terminate 가 된다. 그럴 땐 기존 것을 삭제하고 동일 세팅으로 다시 만들어서 노트북과 연결해준다.
  • 2주 후에 커뮤니티 계정이 종료되면 다른 구글 계정으로 접속!

 

 

[👀 팁] 여러 창을 띄울 때는 다음 부분만 복붙해서 새로운 탭에서 하기

 


Notebook 가져오기

  • 외부에서(로컬에서) ipynb을 가져오기 위해서는 다음 경로로 접속한다.

728x90