인간이 호감 갖는 '컴퓨터 목소리' 어떻게 만드나?

불완전 해야 호감 ... 컴퓨터에 '개성' 입히는 과학이자 예술 영역에 도전

컴퓨터가 말할 때, 인간에게는 어떻게 들릴까? 인공지능 컴퓨터의 인간화 작업에 대해 뉴욕타임스가 14일(현지시각) 보도했다.

2009년 IBM의 언어학자, 엔지니어, 마케터로 이뤄진 팀은 이 질문에 직면했다.

IBM의 인공지능형 컴퓨터 왓슨을 위해 문장을 음성으로 바꿀 수 있는 기능을 디자인하기 시작할 때 엿다.

1년 반 후, 왓슨의 목소리는 사람의 음성처럼 들리지는 않았지만 1968년 ‘2001:스페이스 오딧세이’의 HAL9000과도 많이 달랐다. 영화에서 HAL9000의 음성은 정확한 발음에 감정 표현은 없는 기계로 묘사된다. 왓슨은 2011년 미국 ABC텔레비전 퀴즈쇼 ‘제퍼디!’의 최강자 켄 제닝스와 브래드 러터를 압도적인 차이로 제친 상태였다.

컴퓨터에 '개성'을 입히다...과학이자 예술의 영역에 도전

컴퓨터의 개성을 개발하는 것은 하나의 도전이 되고 있다. 수많은 소프트웨어 디자이너들이 이를 위해 노력하고 있다. 많은 컴퓨터 기기들의 휴대성이 높아지고 음성으로 상호 소통이 가능해지고 있다. 이제 기기들은 듣고 이해하고 말하는 것을 넘어, 단순히 컴퓨터나 스마트폰에 머무르지 않는다. 음성 서비스는 자동차, 장난감 등 매일 사용하는 사물들에 추가되고 있다. 가령 가정용 로봇 페퍼, 지보, 알렉사 등과 아마존의 에코 스피커 기기의 음성이 그 예이다.

새로운 디자인 과학은 ‘대화 가능한 중개인’으로 불리는 소프트웨어 프로그램 개발을 추구하면서 나타나고 있다. 이 프로그램은 자연 언어와 발화(소리내어 말함)를 이해하고 인간의 음성 명령에 대답할 수 있다.

이러한 시스템의 창출은 인간-컴퓨터 상호작용 디자인(Human-Computer Interaction Design)으로 알려진 분야의 연구자들을 통해 진행되고 있어, 과학의 영역임과 동시에 예술의 영역에 속하기도 한다.

인간의 목소리와 유사한 음성 '불가능 '... 너무 똑같으면 비호감

기상 예보나 운전 내비게이션에 쓰이는 짧은 문장 외에, 인간의 목소리와 구분할 수 없을 정도의 컴퓨터 음성을 만들어내는 것은 아직까지는 불가능하다. 대부분의 소프트웨어 디자이너들은 여전히 ‘언캐니밸리(uncanny valley, '거의 인간에 가까운' 로봇이 기계적인 형태의 로봇에 비해 더 낮은 호감도를 갖는다는 이론.)’ 와 마주하고 있음을 알고 있다.

1970년 일본의 로봇 공학자 모리 마사히로(森政弘)는 그래픽 애니메이션이 인간과 더 비슷해지면서 오히려 불쾌감이 높아지는 것을 발견하면서 이 이론을 전개했다.

이미지뿐만 아니라 음성에서도 언캐니 밸리 이론은 성립한다. 샌프란시스코에 위치한 토이토크의 과학자인 브라이언 라너는 바비 인형과 같은 디지털 음성을 개발했다. 발음을 정확하게 하는 것보다 더 큰 도전은 발화에 인간처럼 감정과 억양을 넣는 것이다. 언어학자들이 ‘운율 체계’라 부르는 것이다.

오늘날 이 모든 진보에도, 인공지능이 발화할 때 인간처럼 풍부한 감정을 완벽히 표현하는 것은 불가능하다.

인공지능의 인조된 발화는 여러가지 방법을 이용하고 있다. 자연스러운 발화는 여러가지 방법으로 데이터베이스화하고 있다. 성우와 연기자는 10시간 내지 100시간 이상, 인간의 발화를 녹음 하고 있다.

기계와 사랑에 빠지는 인간 ... 언캐니 밸리 "완벽하지 못해야

손에 잡히지 않는 감정적인 퀄리티를 더하는 것의 중요성과 어려움은 2013년 영화 ‘허(Her)’에서 확인할 수 있다. 호아킨 피닉스가 분한 외로운 사무직원은 사만다와 사랑에 빠지는데 그녀는 최첨단 컴퓨터 운영체제의 인조 목소리이다. 목소리는 스칼렛 요한슨이 연기했고, 감독 스파이크 존즈는 여배우의 목소리가 인간과 기계 간의 로맨틱한 관계를 실어 나를 수 없도록 디렉팅했다. 일부러 완벽하지 못하게, 언캐니 밸리를 살린 것이다.

현대의 음성 합성 기술은 카네기 멜론 대학의 랭귀지 테크놀로지 인스티튜트(LTI)의 교수인 알란 블랙의 초기 연구에 근간을 두고 있다.

블랙 교수는 해당 연구에 많은 진보가 있어 왔지만, 음성 합성 시스템은 아직 인간만큼의 완벽함에는 미치지 못함을 잘 알고 있다. “소리합성기에 우리가 처리하지 못하는 명령은 ‘감정을 갖고 말해보라’는 것”이라고 말했다.

엔터테인먼트 캐릭터를 디자인하는 토이토크의 개발자들에게 이러한 에러는 아마 치명적이지는 않을 것이다. 관객을 웃게 하면 그만이기 때문이다. 그러나 상업적 이용이나 동료가 될 경우에 인간과 협업하는 것을 의도하는 프로그램에 관해서라면 이 도전은 좀 더 정교한 것이 된다.

■ 인간-기계, 보다 인간적인 관계 개발 위해 '불완전한 목소리'

디자이너와 개발자들은 기계와 소통하면서 인간을 놀리고자 하는 것이 아니다. 하지만 사용자와 기계 간에 보다 인간적인 관계를 개발하고 싶어한다.

예를 들어 IBM은 최근 밥 딜런과 왓슨이 등장하는 텔레비전 광고를 런칭했다. 왓슨 프로그램이 노래하려고 할 때 밥 딜런이 퉁명스레 무대를 떠난다. 왓슨이 음치이기 때문이다. 이 광고는 그다지 인간 같지 않은 서번트를 표현하려는 IBM의 목표를 잘 표현해 주고 있다. IBM은 기괴함을 느끼지 않는 한도에서, 인간과 똑같지는 않은 목소리를 원했다.

제퍼디!는 IBM 연구자들에게 음성 합성 문제에 관한 특별한 도전이었다. 답은 짧지만, 잘못 발음할 수 있는 위험이 아주 많았기 때문이다. “정확히 단어를 발음하는 문제에서 있어서 에러율은 큰 문제였다.” IBM리서치의 앤디 아론은 말했다.

많은 연구자들은 가능한 한 실수를 줄이고 정확한 발음을 하기 위해 거대 데이터베이스를 만들기위해 1년 이상의 시간을 투자했다. 브륏 샴페인(brut Champagne)과 같은 단어 구, 소또 보체(sotto voce)와 같은 이탈리어어, 카르페 디엠(carpe diem)과 같은 라틴어 문구 등은 잘못 발음하기가 매우 쉽고, 무턱대고 모든 단어를 현재의 영어 발음을 따르게 하기는 어렵다.

연구자들은 왓슨의 목소리를 만들기 위해 특별한 인간의 목소리를 찾으며 25명의 성우를 인터뷰했다. 가장 선호도가 높은 목소리를 추려가면서 연구자들은 목소리를 변주해보기도 했다. 소리의 진동수를 바꿔가며 아이의 목소리를 도출하기도 했다.

“모든 사람들이 이런 종류의 페르소나는 거절할 것이다.” IBM리서치의 왓슨 멀티모델 랩의 마이클 피셰니는 말했다. “우리는 지나치게 열광적으로 들리는 목소리를 바란 게 아니다.”

연구자들은 기계 음성을 찾고 있다. 느리고 일정하며 가장 중요한 것은 ‘기분 좋은’ 목소리이다. 결국 연구자들은 엔지니어보다는 아티스트에 더 가깝게 미세 조정 프로그램을 필요로 한다. 그들이 개발 끝에 도달한 목소리는 명백하게 컴퓨터였지만 낙관적으로 들리고 심지어 더 원기 왕성하다.

“좋은 컴퓨터 기반 기계의 인터페이스는 예술의 일부분이고, 그렇게 대우받아야 한다.” 피셰니는 말한다. 컴퓨터의 발화 테크놀로지가 계속 발전함에 따라, 새롭고도 흥미로우며 강한 호감을 줄 수 있는 적용이 가능할 것이다.

엔터테인먼트 분야에서 대화가 가능한 캐릭터를 개발하고 있는 이스라엘의 소프트웨어 사인 임퍼슨은 이제 정치학으로 눈을 돌리고 있다. 임퍼슨의 캠페인은 정치인들이 유권자들을 유인할 수 있도록 소셜미디어 플랫폼에서 아바타를 효율적으로 사용해야 한다는 것이다. 그럴싸하게 들리는 테드 크루즈나 도널드 트럼프의 아바타는 어떤 주제에 대해서도 후보자의 포지션을 분명히 설명할 수 있을 것이다.

“유권자들은 후보자와의 상호 작용을 원한다.” 임퍼슨의 공동창립자인 에얄 페이팔은 말한다. “유권자들은 아바타를 통해 정치인의 공약을 이해할 것이고, 언캐니 밸리는 문제가 되지 않을 것이다.”

Cards you may also be interested in
[부산IN신문] 부산반송도서관, 강원국 작가 초청 ‘어떻게 살 것인가 어떻게 쓸 것인가’ 북 콘서트 개최
busaninnews
1
0
0
한국과 중국의 폴더블 폰 비교
evilen82
48
14
16
GIF
[취트키] 활용성 100% 워드 단축키 모음
JobCheatKey
168
293
2
[부산IN신문] 부산시립교향악단, 제555회 정기연주회 ‘부산 신사’ 부산문화회관 대극장에서 개최
busaninnews
2
0
0
디즈니, 실사판 버전의 <레이디와 트램프> 새로운 예고편 공개
eyesmag
14
3
0
GIF
[꿀팁] 10년차 피부관리사가 공개한 피부과 시술급 효능 화장품!!
GGLAB
165
332
1
미국을 공포에 몰아넣은 가물치 ㄷㄷ
GGoriStory
32
3
14
"반도체 소재 대체. 2달이면 된다."
real896pc
62
18
14
머물다컷유리창 게시판
kimsseoudang
22
1
7
k5전용 12.9인치 테슬라스타일
roinavigation
2
1
0
꼭 삭제해야 할 악성프로그램 이름들.jpg
real896pc
56
176
0
[부산IN신문] (재)부산문화회관 시민회관본부 기획공연, 남성현악 5중주 <볼로시> 앵콜공연 열어
busaninnews
2
0
0
간단한 윈도우10 부팅 USB 만들기, 만드는게 어렵다? 아니! 쉽다!
007overmen1
49
128
1
공인인증서를 대체할 ‘모바일 신분증’이 등장한다
eyesmag
5
3
0
엑셀 함수 자료 모음 ~!
bookmark67
160
446
6
[라이프 꿀팁] ‘등 뒤를 조심해…’ 알아두면 유용한 단축키들
newsway
76
247
1
대학생들이 촛불을 이어갑니다. 광화문으로!!
noayo9t
15
0
6
자꾸 깜빡할 때, 일정 관리 어플 BEST 3
eezz
159
398
5
직장인 5대 허언
visualdive
16
5
1
현재 홍콩의 풍경
real896pc
16
2
3
4.7 Star App Store Review!
Cpl.dev***uke
The Communities are great you rarely see anyone get in to an argument :)
king***ing
Love Love LOVE
Download

Select Collections