인간이 호감 갖는 '컴퓨터 목소리' 어떻게 만드나?

불완전 해야 호감 ... 컴퓨터에 '개성' 입히는 과학이자 예술 영역에 도전

컴퓨터가 말할 때, 인간에게는 어떻게 들릴까? 인공지능 컴퓨터의 인간화 작업에 대해 뉴욕타임스가 14일(현지시각) 보도했다.

2009년 IBM의 언어학자, 엔지니어, 마케터로 이뤄진 팀은 이 질문에 직면했다.

IBM의 인공지능형 컴퓨터 왓슨을 위해 문장을 음성으로 바꿀 수 있는 기능을 디자인하기 시작할 때 엿다.

1년 반 후, 왓슨의 목소리는 사람의 음성처럼 들리지는 않았지만 1968년 ‘2001:스페이스 오딧세이’의 HAL9000과도 많이 달랐다. 영화에서 HAL9000의 음성은 정확한 발음에 감정 표현은 없는 기계로 묘사된다. 왓슨은 2011년 미국 ABC텔레비전 퀴즈쇼 ‘제퍼디!’의 최강자 켄 제닝스와 브래드 러터를 압도적인 차이로 제친 상태였다.

컴퓨터에 '개성'을 입히다...과학이자 예술의 영역에 도전

컴퓨터의 개성을 개발하는 것은 하나의 도전이 되고 있다. 수많은 소프트웨어 디자이너들이 이를 위해 노력하고 있다. 많은 컴퓨터 기기들의 휴대성이 높아지고 음성으로 상호 소통이 가능해지고 있다. 이제 기기들은 듣고 이해하고 말하는 것을 넘어, 단순히 컴퓨터나 스마트폰에 머무르지 않는다. 음성 서비스는 자동차, 장난감 등 매일 사용하는 사물들에 추가되고 있다. 가령 가정용 로봇 페퍼, 지보, 알렉사 등과 아마존의 에코 스피커 기기의 음성이 그 예이다.

새로운 디자인 과학은 ‘대화 가능한 중개인’으로 불리는 소프트웨어 프로그램 개발을 추구하면서 나타나고 있다. 이 프로그램은 자연 언어와 발화(소리내어 말함)를 이해하고 인간의 음성 명령에 대답할 수 있다.

이러한 시스템의 창출은 인간-컴퓨터 상호작용 디자인(Human-Computer Interaction Design)으로 알려진 분야의 연구자들을 통해 진행되고 있어, 과학의 영역임과 동시에 예술의 영역에 속하기도 한다.

인간의 목소리와 유사한 음성 '불가능 '... 너무 똑같으면 비호감

기상 예보나 운전 내비게이션에 쓰이는 짧은 문장 외에, 인간의 목소리와 구분할 수 없을 정도의 컴퓨터 음성을 만들어내는 것은 아직까지는 불가능하다. 대부분의 소프트웨어 디자이너들은 여전히 ‘언캐니밸리(uncanny valley, '거의 인간에 가까운' 로봇이 기계적인 형태의 로봇에 비해 더 낮은 호감도를 갖는다는 이론.)’ 와 마주하고 있음을 알고 있다.

1970년 일본의 로봇 공학자 모리 마사히로(森政弘)는 그래픽 애니메이션이 인간과 더 비슷해지면서 오히려 불쾌감이 높아지는 것을 발견하면서 이 이론을 전개했다.

이미지뿐만 아니라 음성에서도 언캐니 밸리 이론은 성립한다. 샌프란시스코에 위치한 토이토크의 과학자인 브라이언 라너는 바비 인형과 같은 디지털 음성을 개발했다. 발음을 정확하게 하는 것보다 더 큰 도전은 발화에 인간처럼 감정과 억양을 넣는 것이다. 언어학자들이 ‘운율 체계’라 부르는 것이다.

오늘날 이 모든 진보에도, 인공지능이 발화할 때 인간처럼 풍부한 감정을 완벽히 표현하는 것은 불가능하다.

인공지능의 인조된 발화는 여러가지 방법을 이용하고 있다. 자연스러운 발화는 여러가지 방법으로 데이터베이스화하고 있다. 성우와 연기자는 10시간 내지 100시간 이상, 인간의 발화를 녹음 하고 있다.

기계와 사랑에 빠지는 인간 ... 언캐니 밸리 "완벽하지 못해야

손에 잡히지 않는 감정적인 퀄리티를 더하는 것의 중요성과 어려움은 2013년 영화 ‘허(Her)’에서 확인할 수 있다. 호아킨 피닉스가 분한 외로운 사무직원은 사만다와 사랑에 빠지는데 그녀는 최첨단 컴퓨터 운영체제의 인조 목소리이다. 목소리는 스칼렛 요한슨이 연기했고, 감독 스파이크 존즈는 여배우의 목소리가 인간과 기계 간의 로맨틱한 관계를 실어 나를 수 없도록 디렉팅했다. 일부러 완벽하지 못하게, 언캐니 밸리를 살린 것이다.

현대의 음성 합성 기술은 카네기 멜론 대학의 랭귀지 테크놀로지 인스티튜트(LTI)의 교수인 알란 블랙의 초기 연구에 근간을 두고 있다.

블랙 교수는 해당 연구에 많은 진보가 있어 왔지만, 음성 합성 시스템은 아직 인간만큼의 완벽함에는 미치지 못함을 잘 알고 있다. “소리합성기에 우리가 처리하지 못하는 명령은 ‘감정을 갖고 말해보라’는 것”이라고 말했다.

엔터테인먼트 캐릭터를 디자인하는 토이토크의 개발자들에게 이러한 에러는 아마 치명적이지는 않을 것이다. 관객을 웃게 하면 그만이기 때문이다. 그러나 상업적 이용이나 동료가 될 경우에 인간과 협업하는 것을 의도하는 프로그램에 관해서라면 이 도전은 좀 더 정교한 것이 된다.

■ 인간-기계, 보다 인간적인 관계 개발 위해 '불완전한 목소리'

디자이너와 개발자들은 기계와 소통하면서 인간을 놀리고자 하는 것이 아니다. 하지만 사용자와 기계 간에 보다 인간적인 관계를 개발하고 싶어한다.

예를 들어 IBM은 최근 밥 딜런과 왓슨이 등장하는 텔레비전 광고를 런칭했다. 왓슨 프로그램이 노래하려고 할 때 밥 딜런이 퉁명스레 무대를 떠난다. 왓슨이 음치이기 때문이다. 이 광고는 그다지 인간 같지 않은 서번트를 표현하려는 IBM의 목표를 잘 표현해 주고 있다. IBM은 기괴함을 느끼지 않는 한도에서, 인간과 똑같지는 않은 목소리를 원했다.

제퍼디!는 IBM 연구자들에게 음성 합성 문제에 관한 특별한 도전이었다. 답은 짧지만, 잘못 발음할 수 있는 위험이 아주 많았기 때문이다. “정확히 단어를 발음하는 문제에서 있어서 에러율은 큰 문제였다.” IBM리서치의 앤디 아론은 말했다.

많은 연구자들은 가능한 한 실수를 줄이고 정확한 발음을 하기 위해 거대 데이터베이스를 만들기위해 1년 이상의 시간을 투자했다. 브륏 샴페인(brut Champagne)과 같은 단어 구, 소또 보체(sotto voce)와 같은 이탈리어어, 카르페 디엠(carpe diem)과 같은 라틴어 문구 등은 잘못 발음하기가 매우 쉽고, 무턱대고 모든 단어를 현재의 영어 발음을 따르게 하기는 어렵다.

연구자들은 왓슨의 목소리를 만들기 위해 특별한 인간의 목소리를 찾으며 25명의 성우를 인터뷰했다. 가장 선호도가 높은 목소리를 추려가면서 연구자들은 목소리를 변주해보기도 했다. 소리의 진동수를 바꿔가며 아이의 목소리를 도출하기도 했다.

“모든 사람들이 이런 종류의 페르소나는 거절할 것이다.” IBM리서치의 왓슨 멀티모델 랩의 마이클 피셰니는 말했다. “우리는 지나치게 열광적으로 들리는 목소리를 바란 게 아니다.”

연구자들은 기계 음성을 찾고 있다. 느리고 일정하며 가장 중요한 것은 ‘기분 좋은’ 목소리이다. 결국 연구자들은 엔지니어보다는 아티스트에 더 가깝게 미세 조정 프로그램을 필요로 한다. 그들이 개발 끝에 도달한 목소리는 명백하게 컴퓨터였지만 낙관적으로 들리고 심지어 더 원기 왕성하다.

“좋은 컴퓨터 기반 기계의 인터페이스는 예술의 일부분이고, 그렇게 대우받아야 한다.” 피셰니는 말한다. 컴퓨터의 발화 테크놀로지가 계속 발전함에 따라, 새롭고도 흥미로우며 강한 호감을 줄 수 있는 적용이 가능할 것이다.

엔터테인먼트 분야에서 대화가 가능한 캐릭터를 개발하고 있는 이스라엘의 소프트웨어 사인 임퍼슨은 이제 정치학으로 눈을 돌리고 있다. 임퍼슨의 캠페인은 정치인들이 유권자들을 유인할 수 있도록 소셜미디어 플랫폼에서 아바타를 효율적으로 사용해야 한다는 것이다. 그럴싸하게 들리는 테드 크루즈나 도널드 트럼프의 아바타는 어떤 주제에 대해서도 후보자의 포지션을 분명히 설명할 수 있을 것이다.

“유권자들은 후보자와의 상호 작용을 원한다.” 임퍼슨의 공동창립자인 에얄 페이팔은 말한다. “유권자들은 아바타를 통해 정치인의 공약을 이해할 것이고, 언캐니 밸리는 문제가 되지 않을 것이다.”

Cards you may also be interested in
뮬란, 유역비대역 스턴트배우 액션씬
Voyou
48
22
12
GIF
"세계를 선도"..文대통령, '청년리더' 방탄소년단 재회 든든한 대통령 멋진 K팝 문화대통 BTS 우리나라 일본 넘고 아시아 최강 세계 지도적 위치로 간다!! https://news.v.daum.net/v/20200919140102790
plus68
5
0
0
떡상 프로젝트! 빙구의 뉴비 인공호흡_8
Vingooo
33
2
3
모기때문에 망한 중국의 친환경 아파트
Voyou
23
2
3
트럼프가 코로나 통제 실패한 만화
quandoquando
21
8
2
자꾸 깜빡할 때, 일정 관리 어플 BEST 3
eezz
163
402
5
드로잉 UCC제작해보기! 공기업(한국환경산업기술원 친환경부) 소개
khr6429
1
0
0
Video
[이슈시개]"CHOO하다"…JK김동욱에 쏟아진 비난
nocutnews
3
2
1
[일상생활 속 마케팅] 백화점에 숨겨진 비밀 8가지
visualdive
27
36
2
같이 해요) 코로나 시국 환경에 대한 고민
fromtoday
27
8
11
꼭 삭제해야 할 악성프로그램 이름들.jpg
real896pc
84
233
0
(내가 필요해서 펌) 컴퓨터로 특수기호 쉽게 쓰는법
ihatecocacola
68
151
3
마리오 카트 AR(마리오 카트 라이브: 홈 서킷)
Justin
2
1
0
PS5 국내 예약판매 전량 매진... 일부 판매처 혼선 빚기도
thisisgame
1
0
0
좀비가 정말 있을까? 마약: 곰팡이: 코리안
goalgoru
7
4
1
'가짜사나이' 이근 대위, 검은사막 모바일 광고 촬영
thisisgame
1
1
1
솔직한 소비자들의 구매 후기.jpg
real896pc
35
1
1
초보자를 위한 자급제폰 구매 가이드
Voyou
61
76
9
지식채널e 패러디영상 - 환경시계
khr6429
2
0
0
Video
엑셀 함수 자료 모음 ~!
bookmark67
165
464
6
4.7 Star App Store Review!
Cpl.dev***uke
The Communities are great you rarely see anyone get in to an argument :)
king***ing
Love Love LOVE
Download

Select Collections