레이더M M-PRINT GFW CITYLIFE LUXMEN 매경이코노미 MBN골드 MBN 매일경제
로그인|회원가입 |시청자 게시판
종목검색
  • 종목검색
  • 통합검색

헤드라인

광고
프로그램 바로가기
프로그램 바로가기 닫기
가나다순 카테고리순
광고
> 뉴스 > 기사
기사목록|||글자크기 
"어, AI스피커에서 엄마 목소리가 나네?"
기사입력 2019-05-29 11:12
  • 기사
  • 나도 한마디
공유하기 
배우 유인나 목소리를 클로바에 적용한 네이버
워킹맘 김혜련씨(42)는 요즘 야근을 하더라도 아이 걱정이 줄었다.

6살 아들은 매일 저녁 엄마가 읽어주는 동화를 들으면서 잠들고 했는데, 김씨가 야근을 할때마다 아이가 엄마를 애타게 찾아 마음이 무겁곤했다.

그러나 이달 초 KT가 출시한 음성합성 기술이 적용된 동화 서비스 '내 목소리 동화'를 이용하면서 이러한 짐을 덜었다.

이용자가 일정 문장을 녹음하면 그 데이터에 음성합성 기술을 적용해서 비슷한 목소리를 만들어서 동화를 자동으로 낭독해주는 서비스다.

K김씨는 "목소리에 비음이 심하고 사투리 억양이 남아있는데 정말 똑같이 나와서 놀랐다.

아이도 '엄마랑 똑같다'며 좋아한다"면서 "야근을 할때면 집에 있는 식구들에게 '내 목소리를 틀어달라'고 부탁해서 이제는 아이가 엄마가 없어도 편안하게 동화를 듣다 잠든다"고 했다.

김씨는 "아침 알람, 영어 교육 등에도 음성합성 기술이 적용되면 아이와 더 가까이 소통할 수 있을 것 같다"고 기대했다.

기계가 여러 음성을 학습해서 원음을 그대로 구현하는 인공지능(AI) 음성합성 기술이 발달하면서 어디서든 원하는 목소리를 들을 수 있는 시대가 성큼 다가왔다.

연예인·아나운서 등 유명인 목소리를 복제할 수 있을 뿐만 아니라 고인이 된 사람들의 목소리도 되살릴 수 있다.


요즘은 일반인들도 자신의 목소리를 합성해 AI스피커나 동화 읽기에 사용할 수 있다.

기계가 스스로 학습하는 머신러닝, 데이터를 분석하는 빅데이터가 음성 합성 기술과 결합하면서 짧게 몇 문장만 녹음해도 금세 내 목소리가 합성되는 방향으로 음성합성 기술이 대중화되고 있다.


KT가 이달 초 출시한 '내 목소리 동화'는 누구나 자신의 목소리를 음성합성에 사용할 수 있다.

KT 기가지니 앱에서 목소리 '등록' 버튼을 누르고 제시된 300문장을 또박또박 읽으면 된다.

하루 뒤 내 목소리가 서비스에 등록돼 동화 10여 편을 KT 기가지니가 적용된 TV나 스마트폰에서 들을 수 있다.


음성합성은 실제 사람 목소리를 활용해 인공음성을 만들어 내는 기술이다.

이용자가 녹음한 음성 파일을 기계가 딥러닝 방식으로 학습해 문장을 따라읽는다.

음소 단위로 학습하는 것이 아니라 어절 단위로 기계가 문장을 통째로 학습하기 때문에 억양도 익힐 수 있다.

KT 관계자는 "딥러닝 방식이 적용돼 적은 문장으로도 음성합성이 가능하고 문장 맥락에 따라 억양을 자연스럽게 만들 수 있다"고 말했다.


네이버도 일반인에게 음성합성 기술의 문을 활짝 열었다.

지난해 탤런트 유인나 목소리를 합성한 음성을 AI스피커 클로바에 적용한 바 있는 네이버는 이달에는 일반인을 대상으로 클로바에 적용될 목소리를 찾는 '네이버의 목소리를 찾아라' 이벤트를 시작했다.

다음달 10일까지 일반인 음성을 공모한다.

네이버는 신청자들이 제출한 목소리를 심사해 최종 남녀 1명씩 총 2명을 뽑는다.

이들의 목소리를 합성해 동화책을 읽어주거나 문자를 읽어주는 서비스에 적용할 예정이다.


네이버는 소량의 데이터로도 일상회화가 가능한 음성합성 결과물을 뽑아낼 정도로 음성합성 수준이 상향됐다고 설명했다.

지난해 유인나 목소리를 합성할 때는 4시간 분량이 필요했지만, 올해는 이를 더 단축해 30분 분량으로 이질감 없는 음성합성 결과물을 제공할 수 있다는 것이다.


최근에는 스타트업 업계에서 음성합성을 적용한 새로운 비즈니스 모델 개발이 활발히 진행되고 있다.

스타트업 머니브레인은 음성합성 기술과 이미지합성 기술을 적용해 AI앵커를 개발하고 있다.

문재인 대통령, 손석희 JTBC 대표의 목소리를 음성합성 기술로 똑같이 재현한 바 있는 머니브레인은 여기에 이미지합성 기술을 더해 가상의 앵커를 만들어냈다.


기사를 입력하면 가상의 앵커가 낭랑한 목소리로 뉴스를 읽는다.

머니브레인측은 입모양 부분을 자연스럽게 다듬어 하반기내 유튜브에 AI 앵커를 공개할 예정이다.

지난해 중국 신화통신에서 AI앵커를 공개한 바 있는데, 국내에서도 AI 아나운서가 등장하는 것이다.

머니브레인 관계자는 "기계가 입모양, 눈짓과 같은 표정도 학습할 수 있기 때문에 피부 색만 입히면 진짜 앵커가 말하는 듯한 시각적 이미지가 구현가능하다.

여기에 음성합성 기술을 더하면 진짜 아나운서같은 AI앵커가 가능하다"고 했다.


머니브레인은 다음달 유명 인사들의 목소리로 메시지를 읽어주는 '음성 이모티콘'(가칭)도 출시한다.

성대모사 전문 유튜버와 계약을 맺고 음성합성 개발을 끝냈다.

이 관계자는 "예를 들어 '결혼 축하해'라는 메시지를 문재인 대통령, 손석희, 성시경 등 유명인사들의 성대모사 톤으로 전달할 수 있다"고 했다.


머니브레인측은 현재 대기업, 대형 연예기획사와 음성합성 기술 서비스 개발을 논의하고 있다고 했다.

한류 콘텐츠, 쇼핑, 영어 교육 등에 음성합성 기술을 적용하기 위해 좋은 목소리 확보에 주력하고 있다.

아나운서 4명, 중국 인플루언서 등 7명과 목소리 계약을 맺었다.

장세형 머니브레인 대표는 "음성합성 기술은 기계처럼 여겨진 AI 어시스턴트에 '목소리'라는 실체를 부여해서 더욱 친근하게 느끼게 한다.

유통·교육 등 산업 전분야로 활용 용도가 무궁무진하다"면서 "음성합성과 이미지 합성 기술의 발전은 AI 대중화를 촉진할 것"이라고 했다.


[이선희 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

기사목록|||글자크기