아렌티어 고객 사례를 소개합니다.

KR
KR EN JP
SEARCH
인사이트
클라우드 기반 HPC(HPC as a Service)의 한계와 이를 극복하는 방법
  • 소식
  • 2024.10.22

 

 

클라우드 기반 HPC(HPC as a Service)는 복잡한 계산을 수행하거나 대규모 데이터를 처리할 때 필요한 고성능 컴퓨팅 환경을 구성하는 데 있어 큰 이점을 제공합니다. 자체 HPC 환경을 구축하기 위한 비용과 장비, 인력을 모두 생략하고, 데이터센터에 있는 자원을 빌려서 쓴 만큼만 지불하는 구조이기 때문입니다. 즉 ① 낮은 초기 인프라 비용, ② 자원 확장성이 대표적인 이점이라고 볼 수 있습니다. 하지만 이러한 클라우드 기반 HPC에도 한계가 존재합니다. 클라우드 기반 HPC의 장점을 이용하되, 한계점은 유의하기 위해서는 아래 내용을 숙지할 필요가 있습니다.

 

 

 

 

클라우드 기반 HPC 한계

 

1) 네트워크 지연(Latency)

일반적으로 클라우드 환경에서 데이터 전송과 처리는 분리되어 있습니다. 때문에 네트워크 지연이라는 문제를 초래할 수 있습니다. 특히 고성능 컴퓨팅 작업은 대량의 데이터를 빠르게 전송해야 하는 경우가 많습니다. 하지만 대량의 데이터를 전송하는 데 있어서 클라우드 환경의 구조적 한계에 의해서 서버 간 또는 데이터센터 간의 네트워크 연결에 제약을 받을 수 있습니다. 특히 병렬처리 작업을 수행한다면 네트워크 지연이 전반적인 컴퓨팅 성능을 저하시킬 수 있습니다.

 

2) 비용 문제

클라우드 기반 HPC는 초기 인프라 구축 비용이 절감되는 것은 이점이지만, 장기적인 관점에서는 높은 비용을 초래할 수 있습니다. 특히 GPU 같은 고성능 리소스를 지속 사용하는 경우에는 온디멘드(On-demand) 방식인 시간당 과금 체계를 적용 시 상당히 큰 비용을 발생시킬 수 있습니다.

근래에 들어 이 같은 한계점 극복을 위해 시스템 적으로 자동화를 통한 워크로드 단순화 및 시간 단축이 되고 있지만, 모든 클라우드 기반 HPC 워크로드의 기본 전제는 예산 배정은 필수 불가결합니다.

 

3) 보안 문제

만일 보안상 민감한 데이터가 외부 클라우드 인프라를 통해 처리한다면, 보안 위협에 노출될 가능성이 있습니다. 근래에는 클라우드 서비스를 제공하는 업체들이 다양한 보안 및 규정 준수 기준을 충족하기 위한 다양한 노력들이 있습니다. 하지만 데이터 암호화와 접근 제어 등의 보안 조치가 취해진다 하더라도 물리적 인프라를 직접 통제할 수 없다는 것은 쉽게 안정감이 들 수 없는 부분입니다.

특히 국방, 금융, 의료, 연구 기관 등에서 클라우드를 다룬다면 철저히 보안에 대한 보장이 되는지 충분한 검토가 필요합니다.

 

4) 데이터 전송 비용

대규모 데이터를 클라우드로 전송하거나 클라우드에서 내려받는 작업은 상당한 비용이 들 수 있습니다. 클라우드 서비스 제공업체는 데이터 입출력(I/O)과 네트워크 사용에 대해 과금하는 경우가 많습니다. 이로 인해 대규모 데이터 세트에 대한 고성능 컴퓨팅 작업을 자주 수행해야 하는 조직은 생각보다 높은 네트워크 사용 비용을 감당해야 할 수 있습니다.

 

5) 사용자 맞춤형 환경의 제한

온프레미스 HPC에서는 상대적으로 시스템을 특정 작업에 맞게 최적화할 수 있지만, 클라우드 기반 HPC에서는 클라우드 서비스 제공업체가 제공하는 표준화된 환경을 사용해야 합니다. 이는 일부 특수한 워크로드에서는 업무 최적화 및 최적의 성능을 발휘하는데 제약이 따를 수 있습니다.

 

 

 

 

클라우드 기반 HPC 한계 극복 방안

 

1) 하이브리드 HPC 환경 구축

온프레미스와 클라우드를 결합한 하이브리드 환경을 구축하면, 각 인프라의 장점을 활용할 수 있습니다. 예를 들면, 일상적인 고성능 컴퓨팅 작업이나 민감한 데이터에 대한 처리는 온프레미스에서 처리하고, 일시적인 대규모 작업이나 확장성이 필요한 작업이 필요할 때는 클라우드에서 처리하는 방식입니다. 이 방식은 네트워크 지연 문제와 비용을 동시에 최적화할 수 있는 전략입니다.

 

2) 비용 관리 및 최적화 도구 사용

클라우드 비용을 효율적으로 관리하기 위해 클라우드 서비스 제공업체들이 제공하는 비용 최적화 도구를 활용할 수 있습니다. 예를 들면 AWS의 경우 스팟 인스턴스(Spot Instances : 여유 컴퓨팅 자원을 옥션 현태로 저렴하게 제공하는 인스턴스)나, 예약 인스턴스(Reserved Instances : 일정 기간 동안 특정 컴퓨팅 자원을 미리 예약하여 할인된 가격으로 사용하는 인스턴스)를 사용할 수 있습니다. 또한 사용량 모니터링 및 예산 초과 방지를 위한 경고 시스템을 설정하여 비용 예측을 용이하게 할 수 있습니다.

 

3) 보안 강화

클라우드 기반 HPC 환경에서 보안을 강화하기 위해서는 암호화와 접근 제어뿐만 아니라, 클라우드 서비스 제공업체가 제공하는 보안 기능들을 최대한 활용해야 합니다. 예를 들어, AWS의 GuardDuty나 Security Hub 같은 보안 서비스는 실시간 위협 탐지 및 대응을 지원하며, 사용자는 이를 통해 보안 리스크를 최소화할 수 있습니다. 또한, 중요한 데이터는 온프레미스 환경에서 처리하거나 하이브리드방식으로 분리해 보안을 강화할 수 있습니다.

 

4) 맞춤형 솔루션 개발

클라우드의 표준화된 환경을 사용하면서도 특정 워크로드에 맞는 최적화된 환경을 구현하기 위해서는 인프라 코드(IaC, Infrastructure as Code)를 활용한 맞춤형 솔루션을 개발하는 것이 중요합니다. 이를 통해 클라우드 환경에서 고성능 컴퓨팅 워크로드에 맞는 스케일링, 리소스 배분, 스토리지 구성을 자동화할 수 있습니다. 예를 들어, 아렌티어(RNTier)나 AWS 클라우드포메이션(CloudFormation)을 활용해 인프라를 자동화하고, 필요에 따라 유연하게 조정할 수 있습니다.

 

 

 

 

클라우드 기반 HPC의 한계를 극복하는 아렌티어 HPC 솔루션

 

아렌티어는 조직 내 HPC 컴퓨팅 자원(CPU, GPU, 소프트웨어 라이선스, 메모리 등)을 통합하여 단일 웹 플랫폼에서 중앙 집중식으로 관리할 수 있는 고도화된 솔루션입니다. 특히 확장성이 요구되는 경우, 사용자는 클릭 한 번으로 현재 작업 환경을 유지한 채 퍼블릭 클라우드 자원을 즉시 확장하여 사용할 수 있습니다. 이는 온프레미스 기반의 안정성을 유지하면서도, 필요 시 퍼블릭 자원의 유연한 확장을 가능하게 하여 고가용성과 비용 효율성을 모두 충족시킵니다.

 

아렌티어는 조직에 맞춤화된 HPC 환경을 그대로 유지하면서 퍼블릭 클라우드 자원을 효과적으로 활용할 수 있도록 설계되었습니다. 사용자 별 퍼블릭 자원 사용에 대한 세부 정책 설정 기능과 다양한 관리 도구는 사용자와 관리자 모두의 생산성을 극대화합니다. 이를 통해 운영 효율성을 높이고, HPC 자원의 유연한 확장을 손쉽게 구현할 수 있습니다.

 

아렌티어에 대해 더 알아보거나, HPC 환경에 대한 고민이 있다면 HPC 전문 기업 클루닉스의 전문가와 상담해 보십시오.

 

 

참고자료

 

1) https://enterprise.kt.com/bt/dxstory/1982.do

 

 

 

 

    ★ 함께 보면 좋은 IT 트렌드

 

    - HPC와 GPU의 결합 : AI 애플리케이션을 위한 새로운 잠재력 발휘

 

    - 효과적인 HPC 운영을 위한 HPC 시스템 검토 및 활용 방안

 

    - 고성능 컴퓨팅(HPC)과 인공지능(AI)의 융합에 대하여

 

 

 
 
클루닉스 뉴스레터
받아보세요!
클라우드, HPC, 인공지능 (AI) 등의
트랜드 뉴스를 매주 만나보세요. 뉴스레터 구독하기
퀵메뉴 모바일 여닫기 한단 아래로 맨 위로

현재 브라우저에서는 지원하지 않는 사이트입니다. 아래의 다른 브라우저를 다운받아 사용해주세요.