데이터 분석을 위해서는 리눅스 운영체제를 사용하는 것이 가장 이상적이다. 하지만 반드시 윈도우즈나 맥 OS를 사용해야 하는 경우에는 다음과 같이 도커 툴박스(Docker Toolbox)를 사용하여 리눅스를 사용하기를 권장한다.
도커는 원래 리눅스 기반의 가상화 컨테이너이다. 따라서 윈도우즈나 맥 OS를 사용하는 경우에는 오라클 버추얼박스(VirtualBox) 등의 저수준 가상화 소프트웨어로 리눅스 운영체제를 가진 가상 컴퓨터를 만들어야지만 도커를 쓸 수 있다. 도커 툴박스는 윈도우즈나 맥 OS에서 버추얼박스와 부팅용 OS, 도커 서비스 등을 한꺼번에 설치하여 도커를 쉽게 사용할 수 있도록 해주는 도구이다. 도커 툴박스의 설치 방법은 다음과 같다.
도커를 사용하기를 권장하는 이유 데이터 분석에 필요한 각종 프로그램 설치나 환경 설정을 일일이 직접 할 필요없기 때문이다. 인터넷에서 제공하는 다양한 도커 이미지를 사용하면 모든 데이터 분석이 완벽하게 구비된 리눅스 환경을 간단히 설치할 수 있다.
도커 툴박스를 설치하고 datascienceschool_rpython
이미지를 실행하려면 다음과 같은 하드웨어 사양이 필요하다.
도커 툴박스의 VirtualBox를 사용하려면 우선 컴퓨터 하드웨어가 가상화를 지원하도록 BIOS를 설정하여야 한다. 만약 뒤에 나오는 지시에 따라 도커 툴박스를 설치했는데 다음과 비슷한 메세지가 출력된다면 BIOS 설정이 제대로 되지 않은 것이다.
이 때는 컴퓨터를 재부팅하여 BISO 설정 화면으로 들어간 뒤, CPU 등의 항목에서 다음 항목들을 Enable 시킨다. BIOS에 따라 세부적인 항목 이름은 다를 수 있다.
이 부분에 대해서는 다음 웹사이트들을 참조할 수 있다.
우선 인터넷에서 도커 툴박스를 다운로드 받는다. 웹사이트 주소는 아래와 같다.
윈도우즈 버전과 애플 맥 버전이 별도로 있으므로 잘 구분하여 다운로드 받아야 한다.
그림: Docker Toolbox 웹사이트
다운로드가 완료되면 다운로드 받은 설치파일을 실행하여 Docker Toolbox을 설치한다. 설치 과정에서 나오는 설정에 대해서는 모두 기본 설정으로 진행해도 무방하다.
그림: Docker Toolbox 설치 과정 1
그림: Docker Toolbox 설치 과정 2
그림: Docker Toolbox 설치 과정 3
그림: Docker Toolbox 설치 과정 4
도커 툴박스 설치가 완료되면 "시작 메뉴 > 프로그램 > Docker "에 다음과 같은 두 개의 바로가기가 나타난다
그림: 도커 툴박스 설치가 완료되었을 때
여기에는 나타나지 않지만 Oracle VirtualBox도 설치된다. 윈도우즈의 "시작 > 모든 프로그램 > Oracle VM VirtualBox" 에서 이를 확인 할 수 있다.
그림: Oracle VM VirtualBox 설치 확인
도커 툴박스는 설치했지만 아직 도커를 사용할 수 있는 단계는 아니다. 도커는 리눅스에서만 실행할 수 있는 컨테이너 서비스이므로 리눅스 운영체제가 깔려 있는 가상머신(가상 컴퓨터)이 필요한데 아직 가상머신이 설치되지 않았기 때문이다.
시작메뉴에서 "Docker Quickstart Terminal"을 선택하여 실행하면 다음과 같이 가상머신을 자동으로 생성해 준다. 가상머신을 생성하는 작업은 최초 한 번만 실행되며 컴퓨터의 성능에 따라 몇 분 가량 걸릴 수 있다. 일단 가상머신이 생성된 다음에는 "Docker Quickstart Terminal"을 실행해도 기존의 가상머신을 가동시키기만 하고 다시 생성하지는 않으므로 최초 생성시보다는 빠르게 실행된다.
가상머신이 생성되면 다음과 같이 도커를 뜻하는 고래 모양의 그림과 함께 도커 터미널이 실행된다.
그림: 도커 툴박스를 처음으로 실행시킨 화면
이 화면에 나타난 IP 주소를 꼭 기억해 놓아야 한다. Oracle VirtualBox는 NAT(Network Address Translation)와 사설 IP 주소를 사용하여 호스트 컴퓨터(윈도우즈)와 게스트 가상 머신(리눅스)를 연결하는데 "Docker Quickstart Terminal" 실행시 나타나는 192.168.99.100
이라는 사설 IP 주소가 게스트 가상 머신의 주소가 된다. 가상 머신을 두 대 이상 생성하지 않았다면 기본적으로 사설 IP 주소는 192.168.99.100
이 된다.
"Docker Quickstart Terminal"을 사용할 때에는 이 주소를 환경변수로 저장해 놓았기 때문에 신경쓰지 않고 사용할 수 있지만 putty 등의 다른 방법으로 가상 머신을 연결하거나 가상 머신에서 작동하는 Jupyter Notebook을 웹 브라우저에서 실행할 대는 이 사설 IP 주소를 사용해야 하므로 주의하자.
이 상태에서 도커가 정상적으로 동작하는지 확인하기 위해서는 docker
라는 명령어를 입력한다. 다음과 같은 출력이 나온다면 정상적으로 설치된 것이다.
그림: docker
명령어를 입력한 경우
"Docker Quickstart Terminal"을 실행하면 가상머신이 생성되고 가동된다고 하였는데, Oracle VirtualBox에서 실제로 이를 확인할 수 있다.
"시작 > 모든 프로그램 > Oracle VM VirtualBox > Oracle VM VirtualBox" 를 실행하면 다음과 같이 default
라는 이름의 가상 머신이 동작하고 있음을 확인 할 수 있다.
그림: Oracle VirtualBox 를 통한 가상 머신 확인
도커를 설치하고 Docker Quickstart Terminal을 실행 시킨 후, 오류 메세지가 나타나거나 docker
명령을 인식하지 못하는 경우에는 다음과 같은 사항을 순서대로 조치해 본다.
default
가상 머신을 "모든 파일 완전 삭제"한 후에 다시 Docker Quickstart Terminal 을 실행해 본다.