728x90
spark-in-action 공부를 위해 가상머신을 설치하던 중 , 해당 에러를 발견했다.

내가 하고있던 작업은
1. 가상 머신을 저장할 폴더를 생성 후,
2. 책의 깃허브 저장소에서 JSON 형식의 파일을 내려받고,
3. 위의 vagrant box -add ~ 명령어를 사용해 가상머신을 내려받는 것.
하지만 위의 캡쳐처럼
bsdtar: Error opening archive: Unrecognized archive format 오류가 났다.
처음엔 그저 vagrant 프로그램 설치 오류인 줄 알았는데 ..
알고보니 github 에서 파일을 내려받는 부분이 잘못되었고, 그 때문에 vagrant 명령을 입력해도 해당 파일을 못찾는 오류였다.;;
github 에서 올바르게 파일 다운받기

위의 raw 버튼을 누르면,

창이 뜨면 Ctrl + S 로 다운로드 후
위치해야 할 경로에 넣어주면 제대로 다운로드가 된다.
이후 위의 vagrant 명령어를 입력하면 문제 해결 완료 !
나와 같은 오류로 시간낭비 하는 사람이 없길 바라며 ,, ;;
'Data Engineering > Spark' 카테고리의 다른 글
spark RDD (2) - flatMap/samle,take,takeSample (0) | 2022.09.18 |
---|---|
spark(2) - 실행, RDD, map 변환 연산자 (0) | 2022.08.07 |
Apache Spark - 컴포넌트, 실행과정 (0) | 2022.06.12 |
Apache Spark 개념,활용 (0) | 2021.03.09 |