RDD 읽기 전용으로 분할된 record의 모음 클러스터 노드들 간에 파티션된 엘리먼트의 컬렉션이며 분산 처리 단위는 파티션 scala, java, python 언어의 객체들을 포함 Transformation(중간), Action(종단)의 연산 Transformation - 중간 연산 현재의 RDD에서 새로운 RDD를 생성 변환 전 RDD 한 요소마다 처리하는 연산 method 명 설명 매개변수 비고 filter 조건에 부합하지 않는 요소는 버림 함수 map 요소를 가공 ex) 타입의 변환, toUpperCase ... 함수 flatMap 요소 가공 후 list 모음의 반환을 flatten 하게 반환 ex) [[1,2,3], [5,6,7], [8,9,0]] -> [1,2,3,5,6,7,8,9,0] 함수 ..