- 소식
- 2024.06.26
불과 몇 년 전, 판교에 있는 한 데이터센터 화재로 인해 해당 데이터센터의 서버를 이용하던 카카오톡의 서비스가 멈추는 ‘카카오톡 먹통 사태’이슈가 있었습니다. 당시 카카오 서비스 장애만을 기준으로 할 때, 언론에 공개된 정보에 따르면 127시간 30분이라는 긴 시간이 소요되었습니다. 이를 두고 언론에서는 ‘플랫폼 초연결사회의 취약점’이 드러났다고 했으며, 전문가들은 데이터센터 간 이중화 미흡 및 운영 관리 도구 이중화 미흡, 가용 자원 부족 등이 원인이라고 분석했습니다.
그리고 1년 6개월이 지난 지금, 멀티 클라우드 이용체계 확립과 ‘카카오 데이터 센터’라는 자체 데이터 센터를 구축하였고, 2026년까지 제2 데이터센터도 건립할 계획이라고 합니다.
서버 이중화란?개념상 운영 중인 서비스의 안정성을 위한 각종 자원을 이중 또는 그 이상으로 구성하는 것을 의미합니다. 서버 이중화를 충분히 고려해야 하는 이유는, 서버 문제로 인한(서버 장애) 장비 대책에 투자하는 비용을 판단했을 때, 장애 대책에 드는 비용 대비 예상되는 손해는 비교가 되지 않습니다. 유형의 손실(복구 비용, 시스템 중지 간 시간당 매출/가치) 뿐만 아니라, 무형의 손실(복구 시간 간에 고객 이탈, 데이터 손실, 사회적 신용 이미지 실추 등..)도 있기 때문입니다.
고가용성 HPC 환경을 위한 방안 ① 서버 이중화(Active-Standby) 방안앞서 컴퓨팅 서버 마비 문제는 R&D를 다루는 연구 단지, 연구소 등의 HPC환경에서도 발생할 수 있습니다. 또한 이 같은 상황은 모든 연구 데이터들이 사라질 수도 있는 아주 큰 문제로 번지게 된다면, 기업의 경쟁력을 크게 해칠 수 있습니다. 때문에, 고가용성을 위한 서버 이중화뿐만 아니라, 클라우드로 즉각 연결하여 활용할 수 있는 대안도 준비가 되어 있어야 합니다.
가용성을 높이는 방안 중 첫 번째로는 클루닉스에서도 제공하고 있는 서버 이중화 구성입니다. 모든 서버를 이중화 구성하는 것이 아니라, 관리 서버를 이중화 시키는 것만으로도, 고가용성을 실현시킬 수 있습니다.
자원 통합을 통한 HPC 자원 구성
아렌티어는 자원을 통합 구성하여, 고성능 컴퓨팅(HPC)을 통한 해석(시뮬레이션), 설계(엔지니어링 디자인), 딥러닝(인공지능) 개발 환경을 단일 플랫폼에서 작동할 수 있게 돕습니다.
자원 구성된 것을 단일 웹플랫폼(RNTier)에서 전체 컴퓨팅 자원을 모니터링할 수 있고, 자원 스케줄링, 프로젝트 별 자원배분 등이 가능 합니다. 이러한 자원 통합 방침으로 HPC 환경에서의 과도하지 않은 최적의 자원 이중화 달성이 가능합니다.
[아렌티어 아키텍처 이미지]
아렌티어에 아키텍처를 보시면, 관리서버 부분에 서버 이중화 구성을 한 것을 볼 수 있습니다. 이러한 이중화 구성은 원 서버의 이상이 생겼을 때, Standby되어 있던 서버가 가동하여 연구개발 활동에 대한 멈춤 현상과 같은 연구 방해 요인을 사전에 막을 수 있습니다.
관리 서버뿐만 아니라, 통합 스토리지 구성은 연구개발을 통해 얻어진 결과 값(Data)를 통합 관리하면서, 여기저기 데이터 결과값이 흩어져 있지 않도록, 백업 및 데이터 보안에 대한 안정성을 더해줍니다.
원클릭(One-Click) 하이브리드 자원 활용을 통한 시뮬레이션 작업 제출아렌티어 4.0에서는 온프레미스의 안정성과 더불어서, R&D 과정이 멈추지 않도록, 작업 제출 과정에서 클릭 한 번에 퍼블릭 클라우드 자원으로 연결하여 제출할 수 있습니다. 다양한 AWS 인스턴스 중에서, S/W 별 최적의 인스턴스를 추천하기 때문에 퍼블릭 클라우드에 대한 이해가 없더라도 작업이 가능합니다. 이는 서버 이중화는 물론 온프레미스와 퍼블릭 클라우드를 양립하는 하이브리드 클라우드 환경에서 작업이 가능한 최적의 작업 환경을 실현합니다.
고가용성 HPC환경의 실현, 하이브리드 클라우드를 탑재한 HPC 솔루션 아렌티어HPC환경을 디지털 전환(DX)에 맞춰, 혹은 인공지능 전환(AX)에 맞춰 고비용의 GPU자원 및 연구 S/W와 라이선스를 통합하여 효율성을 극대화한 아렌티어로 고가용성 HPC 환경을 실현하시는건 어떨까요?
[참고자료]https://www.segye.com/newsView/20231015511994 https://www.ibinfo.co.kr/computer-tip-2/ https://www.sharedit.co.kr/posts/14239
|
★ 함께 보면 좋은 IT 트렌드 |
|
- 이전글
- 다음글