HPC Solution 아렌티어를 소개합니다.

KR
KR EN JP
SEARCH
인사이트
머신러닝과 딥러닝의 차이와 개념에 대한 이해
  • 소식
  • 2024.01.12
 

2023년 한 해, 생성형 Ai의 최대 이슈, Chat GPT를 시작으로 글로벌 기업들을 비롯 국내 기업들 또한 대부분이 인공지능(ai)와 연관시킨 제품 고도화 및 서비스/상품 개발에 나서면서 다양한 변화가 있었습니다.

 

인공지능의 기반은 분산컴퓨팅 및 GPU자원을 활용한 데이터 병렬처리와 관련이 있습니다. 때문에, HPC 자원에 해당하는 GPU 자원에 대한 수요도 폭증했습니다. 실제 Nvidia가 생산하는 GPU자원은 수요 폭증에 의해 GPU 자원 부족 현상이 나타나는 현상도 나타났으며, 이에 Chat GPT개발사인 Open Ai에서는 자체 Ai칩 만들기에 돌입하는 상황까지 나타났다고 합니다.

 

이 인공지능 개발에 모두가 뛰어드는 현시점에서, 그 인공지능의 하위 개념인 머신러닝과 딥러닝의 개념적 구조와 함께 인공지능 개발 환경을 구축하는 몇 가지 방안에 대해 알아보겠습니다.

 

 

인공지능과 머신러닝 그리고 딥러닝과의 개념적 구조 이해

 

출처 : 클루닉스

 

머신러닝 시스템은 명시적으로 프로그램이 되는 것이 아닌 훈련되는 것으로 이해할 수 있습니다.

특정 작업을 진행 시 해당 작업과 관련된 여러 샘플을 제공하면 이 데이터들을 기반으로 통계적 구조를 찾아내어 그 작업을 자동화할 수 있는 규칙을 만들어 냅니다.

 

 

출처 : 클루닉스

 

 

샘플과 기대값을 제공하여 데이터 처리 작업을 위한 실행 규칙을 찾게 되면, 그 다음부터는 입력 데이터를 의미 있는 출력 형태로 변환합니다.

 

딥러닝 시스템은 이 같은 머신 러닝의 한 분야로 연속된 층에서 점진적으로 의미 있는 표현을 배우는 데 강점이 있습니다. 즉 데이터로부터 표현을 학습하는 새로운 방식입니다. 딥(Deep)에 의미는 깊이 있는 통찰을 말하는 것이 아닌, 연속된 층으로 표현을 학습한다는 개념을 나타냅니다.

 

쌓여 있는 데이터를 통해 특정 모델을 개발한다고 했을 때, 얼마나 많은 층을 사용했는지가 그 모델의 깊이가 됩니다. 이 층 들을 모두 훈련 데이터에 노출하고 자동으로 학습시키면서, 해당 모델이 고도화됩니다.

 

이러한 머신러닝과 딥러닝에 대해 재미있게 이해할 수 있게, 클루닉스 권대석 의장님의 영상을 함께 공유합니다.

 

>> 머신러닝과 딥러닝, 더 자세히 이해하러 가기

 

 

결국 머신러닝과 딥러닝 모두 지속적으로 쌓이는 데이터를 누적 학습하고, 고도화시켜 나가야 하며, 이 과정에 있어 반복학습에 필요한 GPU 자원을 구비하고, 효율적으로 사용하거나 여러 S/W, 어플리케이션 들을 구축하는 것 또한 기업들의 새로운 문제가 되었습니다.

 

 

딥러닝 개발을 위한 GPU 자원 활용이 중요

 

딥러닝 개발에 최적화된 환경을 구축하기 위해서는 필요한 GPU 자원을 구비하는 것만큼 중요한 것이 바로 개발 환경 방식이라 말할 수 있습니다.

값비싼 GPU 자원을 다수가 효율적으로 쓸 수 있고, 개개인은 본인에 최적화 시켜놓은 연구개발 환경을 어디서든 변경 없이 유지하여 사용할 수 있기 때문에, 자원의 효율성과 생산성 두 가지 모두를 해소할 수 있기 때문입니다.

 

클루닉스에서는 컨테이너 기반의 딥러닝 솔루션, 을 제안하고 있습니다.

 

개발 환경 구성에 대한 궁금증이 있으셨다면 아래 RNTier Deep Learning의 내용을 참고해 보시기 바랍니다.

 


1. 자원 통합 구성


컴퓨팅 개발 환경을 조성할 때는 개발자에 치중된 환경을 조성하는 것은 자원 효율 면에서 취약합니다. 특히나 GPU와 같은 고가의 자원을 특정 누군가가 독점해서 쓰는 것이 아닌, 다수가 작업 스케줄링을 통해 필요할 때만 가져다 쓸 수 있게 구성해야 합니다.

 

2. 도커 컨테이너를 통한 딥러닝 개발 환경 구성

 

팀/부서 단위로 GPU 장비를 공동 사용하여 발생하는 자원 점유 문제나 딥러닝 개발에 필요한 다양한 종류의 S/W 버전 조합 관리가 결코 쉬운 일이 아닙니다.

 

그래서 많은 딥러닝 개발자들이 이미지화 시켜서 저장하고 공유할 수 있는 도커 컨테이너 방식을 선호합니다. 특히나 아렌티어 Deep Learning의 경우 웹 환경에서 컨테이너 이미지(컴퓨팅 사양), 원하는 S/W이미지를 마우스 클릭 만으로 컨테이너를 생성할 수 있습니다.

 

3. GPU 자원 분할을 통한 효율적인 자원 이용


1) MIG 기능을 통한 GPU 자원 분할 관리 및 추가 자동 구성


단일 GPU 자원을 최대 7개의 독립 인스턴스로 분리하여 컨테이너 당 배분량을 조절할 수 있습니다. 단일 컨테이너로 자원이 부족하다면 병렬 컨테이너 구성을 통해 GPU 자원을 추가 구성도 가능합니다.

 

2) VM 기반의 하이퍼바이저 활용

 

NVIDIA 가상 GPU(vGPU) 소프트웨어를 하이퍼바이저와 함께 가상화 계층에 설치하여 물리 서버를 여러 개의 VM으로 생성할 수 있습니다. VM에 GPU는 물론 Memory와 Disk 등을 나누어서 할당할 수 있습니다.

 

이 밖에도 자원 모니터링, 유휴자원 자동 회수, 재 가동을 통한 자원 변경 등 여러 자원 효율과 사용성을 높이는 기능들을 탑재하고 있습니다.

 

>>아렌티어 딥러닝 소개 바로 가기 

>>소개서 다운로드받기
 

 

2024년도는 인공지능에 대한 이슈로 더더욱 떠들석한 한 해가 될 것으로 예상됩니다. 이러한 인공지능 개발 환경 및 HPC 환경에 대한 고민이 있으시다면 현재의 고민을 토대로 HPC 전문가에게 문의하시기 바랍니다.

 

 

클루닉스 뉴스레터
받아보세요!
클라우드, HPC, 인공지능 (AI) 등의
트랜드 뉴스를 매주 만나보세요. 뉴스레터 구독하기
퀵메뉴 모바일 여닫기 한단 아래로 맨 위로

현재 브라우저에서는 지원하지 않는 사이트입니다. 아래의 다른 브라우저를 다운받아 사용해주세요.