테라곤G

 

제품 개요

NVIDIA, INTEL 사의 GPGPU를 탑재한 고성능 병렬계산 컴퓨팅 환경을 제공하는 HPC

  • 기계, 화학, 기상, 생명공학 등 각 분야를 대표할 수 있는 수십여 개의 사용 및 오픈소스 Application이 GPU engine을 이용한 가속화 방법을 개발하여 출시
  • Open MPI, Open CL, CUDA로 개발된 In-house code와 상용 솔버 지원(Parametric study 전용)
  • 스마트한 GPGPU 작업 제출 기능 제공 (GPU 클러스터 구축 후 관리로 인한 시간과 비용 절약)

도입 효과

웹기반 해석 작업 환경으로 GPU 클러스터 사용 편리성 강화

기존의 복잡하고 어려웠던 GPU 클러스터 사용 환경에서 벗어나, 다양한 CAE 프로그램들을 웹브라우저를 통해 사용 가능하여 해석 작업 절차가 단순화 되고, 작업 부담이 획기적으로 경감됩니다.

웹기반 GPU 통합관리로 유지비용 절감

시스템을 운영하는 관리자는 웹브라우저로 클러스터에 탑재된 GPU 리소스를 모니터링하고, 각종 기능을 통해 손쉽게 제어할 수 있게 되어 유지비용이 절감됩니다.

GPU 작업스케줄러를 통한 업무 처리량 증가

다중 유저환경에서 작업 제출시 GPU 작업스케줄러를 통해 가장 빠른 GPU 리소스를 자동으로 선별하거나 혹은 사용자가 선정한 특정GPU 리소스에 작업을 할당시켜 줌으로써 GPU 리소스 사용률을 극대화하여 업무 처리량이 대폭 증가합니다.

이기종 서버 통합으로 높은 확장성

기존 CPU 클러스터에 GPU가 탑재된 컴퓨팅 노드들을 추가 할 경우에도, CPU 자원과 GPU 자원을 동시에 효율적으로 관리할 수 있는 기능을 제공함으로써 높은 확장성을 보장합니다.

특징 및 장점

GPU 제어 및 실시간 모니터링 기능

  • GPU 노드에 등록된 각각의 GPU MODE 제어 기능
  • 가동이 불가능한 GPU 발생 시 스케줄링 대상에서 제외 기능
  • GPU노드에 등록된 각각의 GPU의 상태를 모니터링
    • 메모리 / 온도 / 시용률 / GPU 사용여부 모니터링
    • 실행되고 있는 작업의 PID / 프로세스명 / 소유자 모니터링
  • 각 GPU의 작업 정보 확인 기능(작업 소유자, 작업명, 실행일)

자원통합 기능

  • 통합 시스템의 “서버”, ”S/W “, ”라이선스” 자원 그룹화 기능
  • 사용자, 프로젝트 단위로 자원그룹 할당, 관리 기능

통계 기능

  • 라이선스 사용량 측정 및 분석
  • HW/SW 자원 이용률 분석
  • 자원 그룹별 HW/SW 통계 기능
  • 통합 자원 이용률 분석
  • HW/SW 자원 이용률 분석(자원 활용률 분석 및 투자 계획에 반영)



     

작업관리 기능

  • 사용자 중심의 웹 기반 인터페이스 제공
  • 해석 input 파일 확장자 입력과 클릭만으로 작업제출 가능
  • Shell을 통한 GPU 작업 제출 및 모니터링 기능
  • 스케줄러의 모든 작업 정보 제공 및 제어 기능
  • GPU 작업 대기 및 실행 기능
  • GPU 작업 균등 할당 기능
  • 특정 GPU 지정 작업 제출 기능
  • 가용 GPU가 없을 경우, 대기 상태 유지 및 사유제공 기능
  • 작업 소유자 및 관리자의 작업 관리(중단) 기능

테라곤G 웹기반 UI

도입 분야

생명공학 분야

  • Ugene
  • WideLM
  • SOAP3
  • SeqNFind
  • In-house code 등

계산화학 분야

  • LAMMPS
  • Gromacs
  • NAMD
  • Amber
  • In-house code 등

구조해석 분야

  • ANSYS
  • Abaqus
  • Fluent
  • In-house code 등

기상예측 분야

  • MM5
  • WRF
  • In-house code 등

적용 사례

한국타이어 – 타이어 해석을 위한 Multi GPU 전용 플랫폼 개발

도입배경

복잡한 형상에서 다상유동에 대한 수치해석, 분자역학 해석, 입자 베이스 유동해석 등 본 연구단에서 수행 중인 다양한 대규모 수치해석을 위한 대용량 병렬 계산을 수행할 수 있는 연산 클러스터 시스템. 고성능 병렬 연산 환경 구축을 통해 효율적인 대규모 계산환경 구축

도입제품

  • Teragon
  • Lustre file system

사용 S/W

  • AMBER
  • CHARMM
  • NAMD
  • VASP
  • Openform
  • Tensorflow

도입효과

  • Open Source (Openform, Tensorflow, Keras) 시스템 최적화
  • Lustre file System을 적용하여 Data I/O 속도 개선
  • 모든 작업을 웹 기반으로 통합하여 사용자의 신규 시스템 적응에 대한 부담을 최소화
  • 개인 PC와 통합 해석 시스템간의 작업 연계 기능을 제공함으로 해석 전체 작업 효율을 최대화
  • 최적화된 스케줄러 적용을 통한 작업효율 극대화
PLUS