python기반의 pyspark기준으로 설명하겠다. 처음에 기본적인 sparkContext를 선언해주자. from pyspark import SparkConf, SparkContext conf = SparkConf().setAppName("PySpark") # 내가 만들 앱의 이름. sparkContext = SparkContext(conf=conf) # 설정 간단하게 선언이 가능하다.스파크를 다운받으면 있는 파이썬 쉘에는 기본적으로 sc로 SparkContext가 선언되어있다. 그러므로 쉘에서는 굳이 선언이 필요없고 sc를 가져다가 쓰면 된다. RDD란 분산되어 존재하는 데이터 요소들의 모임이다.(스파크에서 사용하는 자료구조라고 생각하자.) 스파크에서의 모든 작업은 새로운 RDD를 만들거나, 존재하는 ..