- 소식
- 2023.07.13
24시 상담이 가능한 ai 콜센터, 이동 간에 귀로 듣는 오디오 북, 트위치 스트리머의 목소리로 음성 후원을 해주는 서비스와, 네이버의 클로바 보이스 등.. 어느 순간부터 내가 입력한 텍스트를 사람이 읽어주는 TTS(Text To Speech) 서비스가 우리 일상에 눈에 띄게 많이 생겨나고 있습니다.
해가 거듭할수록 일상에서 쉽게 접하게 되는 ai 전화 상담사의 목소리가 진짜 사람이 말하는 것처럼 자연스러워지는 이유는 무엇일까요?
전제조건 1. 충분한 학습 데이터 확보
기계가 사람의 자연스러운 감정, 억양, 목소리를 표현하려면 충분한 데이터가 필요합니다.
실제로 클루닉스에서 자체적으로 유인나 “목소리로 책 읽어주기”를 구현해 보기 위해, 구글 STT를 통해 음성에 대한 text를 자동 인식 시켰을 때의 정확도 보다
사실상 충분한 학습 데이터를 확보하는 것에 노력을 얼마나 했는지에 따라서 ai 음성의 퀄리티를 좌지우지한다고 볼 수 있겠습니다.
전제조건 2. AI를 가르칠 수 있는 딥러닝/머신러닝 환경 확보
AI가 사람의 음성을 자연스럽게 구현하기 위해서는 생각보다 많은 정보가 필요합니다. 사람은 음성을 시각과 청각으로 정보를 입력받지만,
그래서 음성을 1초에 몇 번 진동했는지 파악하여 진동이 빠른지 느린지를 파악하여 음의 높 낮이를 찾는 등의
다만 이 과정에서 결과물의 퀄리티를 높이려면 상당한 시간이 소요되며 이는 컴퓨터 사양을 구성하고 관련 S/W를 설치하는 등의 시간과 노력이 상당히 소모됩니다.
아렌티어 클라우드 소개여기에 딥러닝에 필요한 라이브러리를 비롯하여 딥러닝/머신러닝 환경에 필요한 모든 것을 단 3분만에 구축할 수 있는 클라우드 플랫폼이 있습니다.
지금부터 아렌티어 클라우드의 딥러닝 플랫폼에 대해 간단히 소개하고자 합니다.
AWS 자원을 기반으로 3~5분 만에 구축되는 빠른 딥러닝 플랫폼 환경RNTier Cloud 서비스에서 제공하는 딥러닝 AI 응용개발 플랫폼은 딥러닝 응용 개발 및 모델 학습에 필요한 다양한 Python 버전과 딥러닝 오픈 프레임워크,
수많은 응용 S/W 개발 환경 제공RNTier Cloud 딥러닝 AI 응용개발 플랫폼에서 제공되는 응용 S/W 환경은
다양한 플랫폼 서비스 기능으로 편리한 환경 구성사용자는 RNTier Cloud에서 제공하는 GPU 스케줄러, GPU 모니터링, 리눅스 데스크탑 GUI 작업환경, Multi GPU 학습, 분산 GPU 학습, Python 가상 패키지 관리 등 다양한 딥러닝 플랫폼 서비스 기능으로 더욱 쉽고 편리한 플랫폼 이용이 가능합니다.
TTS 개발 입문자도 사용 가능하도록 동영상 가이드 제공사용자는 아래와 같은 TTS 서비스 이용 안내 가이드 영상을 따라, TTS 서비스를 이용해 볼 수 있습니다.
|
- 이전글
- 다음글