_EXEC_TYPE = 'local'



_DEFAULT_PARALLELISM은 단일 노드(1 노드)의 Hadoop 클러스터당 최대 ‘5’ 까지 설정할 수 있으며, 이는 5개의 병렬 스레드의 처리를 의미합니다.
<패키지 변수 화면>
[

_DEFAULT_PARALLELISM을 6 이상으로 늘리려면 Hadoop 클러스터가 다중 노드로 설정된 경우에만 유효합니다.
예를 들어 _DEFAULT_PARALLELISM를 15개의 병렬 스레드를 사용한다고 설정한다면 3노드 클러스터( 3 X 5 = 15 ) 상에서 잡을 실행시킬 필요가 있습니다.
4. 시스템 변수
일부 시스템 변수는 _MAX_COMBINED_SPLIT_SIZE(**)와 같이 특정 시나리오에서 파일 처리에 걸리는 오버헤드를 최소화 하고, 성능을 최적화 하는 변수가 있습니다.
** 단일 작업에서 처리할 데이터의 양을 바이트 단위로 지정. 설정값보다 작은 파일은 이 크기에 도달할 때까지 결합되며, 이 값보다 큰 파일 - 비압축 혹은 Bzip2 압축의 경우 - 는 설정된 크기를 기준으로 분할
Xplenty 시스템 변수 목록
<!— notionvc: 391bb1d5-6397-4883-bc30-87a118eb5633 —>