[파이토치 기초] Section 01. 아나콘다로 pytorch 개발환경 만들기
Aiffel 강남 캠퍼스에서 퍼실리테이터로 일하면서 파이토치 풀잎을 준비한적이 있습니다.
파이토치의 ㅍ도 모르는 상황에서 준비해야되는 풀잎이었기 때문에 파이토치 튜토리얼을 교재로 활용하여 준비했습니다.
그때 당시에는 최대한 전체적인 흐름을 이해하는데에 주력하였고, 수강생들에게도 Tensorflow와 어떤 것들이 다르고 전체적인 흐름이 어떤 느낌인지에 대해서 전달하려고 노력했습니다.
그런데 막상 풀잎이 마무리되고 나서 정작 파이토치로 모델을 scratch부터 만들 능력이 부족하다는 것을 깨닫게 되었습니다.
base model이 있고 이를 활용해서 무언가를 만들어내고 어떤 결과물을 만들어내는지는 이해가 가능하지만 그에 반해 구체적인 구현능력이 부족함을 깨닫고 이를 채우기 위해 Udemy에서 강의를 듣고 정리하려고 합니다.
하루에 강의 하나씩을 듣고 이를 정리해 블로그로 남겨 나중에 내가 다시 보더라도 쉽게 기억할 수 있도록 하려고 합니다.
Section 01. Course overview, Installs, and Setup
이번 Section은 첫번째 Section으로 Pytorch를 시작하기 전 개발환경을 구성한는 Section입니다.
전체적인 Section의 내용은 아래와 같이 요약됩니다.
- 아나콘다 다운받기
- 아나콘다 설치
- 아나콘다 가상환경 만들기(yml활용 or 구글 코랩에서 설정하기)
1. 아나콘다 다운받기
아나콘다는 환경설정을 통해 진행하는 프로젝트에 따라 다르게 환경을 구성하여 라이브러리 및 프레임워크 충돌을 막기 위해 사용합니다.
강의는 2018년도에 제작되었기 때문에 강의에서 보여지는 페이지와 현재의 페이지는 조금 차이가 있습니다.
다운로드는 아래의 페이지에서 다운을 받습니다.
Anaconda | Individual Edition
Anaconda's open-source Individual Edition is the easiest way to perform Python/R data science and machine learning on a single machine.
www.anaconda.com
페이지로 들어가면 위와 같은 화면이 나옵니다.
사용하는 운영체제(윈도우, MacOS, Linux)에 따라 아이콘을 클릭하고 다운 받으면 됩니다.
2. 아나콘다 설치하기
다운을 받고 Next를 누르다 보면 위와 같은 선택지가 보입니다. 'Just Me'를 클릭하면 됩니다.
다음 선택지입니다. 첫번째 선택지가 비워져 있는데 해당 선택지는 이전에 Python을 설치했을 경우라면 체크해주시고, 만약 Python을 설치한 적이 없고 아나콘다를 설치하는 거라면 굳이 체크해줄 필요는 없습니다.
이는 아나콘다로도 Python을 설치할 수 있는데 컴퓨터가 기존에 설치된 Python과 헷갈릴 수 있기 때문입니다.
이후 Install을 누르시면 설치가 완료됩니다.
3. 가상환경 만들기
사실 우리에게는 두가지 선택지가 있습니다.
첫번째, Desktop에서 개발을 진행하기 위해 아나콘다를 설치하고 개발환경 구축하기.
두번째, 코랩으로 개발환경 구축하기
강의에서는 첫번째를 염두해서 진행합니다. 첫번째 방법은 아래와 같습니다.
3.1 yml활용
해당 강의에서는 pytorch_course_env.yml 파일로 아나콘다 가상환경 및 라이브러리 설치를 통해 개발환경을 구축합니다.
pytorch_course_env.yml은 아래와 같은 내용으로 적혀있습니다.
위와 같은 파일을 활용하여 간단하게 cmd창에서 command line으로 구축을 마무리하죠.
방법은 아래와 같습니다.
# 강의에서는 단순 cmd대신 anaconda prompt를 사용합니다.
# pytorch_course_env.yml이 있는 폴더로 이동합니다.
# 강의에서는 Downloads로 이동합니다.
!cd Downloads
!conda env create -f pytorch_course_env.yml
이렇게 가상환경을 구축하고 강의에서 제공하는 주피터노트북 파일을 활용하여 강의를 진행한다로 Section을 마무리 짓습니다.
여기서 궁금한 점이 있습니다.
pytorch_course_env.yml에서 dependencies는 라이브러리들이라는 것은 알겠는데 channels는 무슨역할일까요?
conda란?
운이 좋게 이번 방학에 KISTI 슈퍼컴퓨팅인프라센터에서 알바를 하게 되었다. 슈퍼컴퓨터의 OS는 당연히 linux이고 Centos를 사용하고 있었다. 개발을 하던 도중 깔려있지 않은 파이썬 패키지를 발견
velog.io
위의 링크를 통해 알게 된 내용은 channel이 패키지들이 저장되어 있는 위치라는 것입니다.
마치 클라우드 같은 느낌이네요.
자 그럼 두번째방법으로는 어떻게 할 수 있을까요?
구글 코랩에서 설정하기
코랩에는 기본적으로 pytorch가 깔려있습니다.
따라서 기본적으로 깔려져 있는 것들만 제외하고 깔면 되는거죠.
아래에 제가 requirements.txt파일을 만들어 놨습니다.
https://drive.google.com/file/d/1Jh_q3Ff2SVWL7LUIUZ6d5C4wqAOAKnEu/view?usp=sharing
해당 txt파일을 구글 드라이브에 업로드 한 후에 드라이브 마운트를 시킵니다.
그 후에 아래의 명령어를 실행시키면 됩니다.
# requirements.txt가 있는 경로를 -r 뒤에 붙여 주시면 됩니다.
!pip install -r /경로/requirements.txt
여기까지가 오늘의 Section이었습니다.