자동 기사 로봇…워드스미스란?

엑셀 같은 스프레드시트 소프트웨어를 이용하면 표와 그래프는 쉽게 만들 수 있다. 하지만 해당 데이터를 분석해서 알기 쉽게 전달하는 건 전혀 다른 문제다. 지금까지는 풍부한 지식이나 경험이 있는 전문가가 필요했다. 그런데 데이터만 있으면 자동으로 문장화를 해주는 플랫폼이 바로 AI(Automated Insights)가 개발한 워드스미스(Wordsmith)다. 이 회사는 특허 기술을 이용해 숫자만 나열된 데이터를 바탕으로 자동 분석을 실시, 사람이 이해하기 쉬운 문장을 자동 생성하는 변환 엔진을 보유하고 있다. 이미 경제 뿐 아니라 스포츠 분야에도 도입되어 있다. 야후 스포츠 페이지 같은 곳도 축구 리그 현황을 정리한 보고서를 자동 생성해 소개한다. 야후 뿐 아니라 삼성전자와 마이크로소프트, AP통신 등 다양한 기업이 워드스미스 기술을 도입하고 있다. 마케팅에 적용하는 기술도 개발 중이라고 한다. 워드스미스가 데이터에서 텍스트를 생성하는 과정은 이렇다. 먼저 당연히 데이터가 필요하다. API를 통해 데이터를 검색하고 XML과 CSV 데이터 등 온갖 형태 데이터를 모은다. 다음으로 이런 데이터 세트를 자체 방식으로 분석, 트렌드 분석과 시간 축에 따라 정렬한다. 그런 다음 분석한 데이터를 바탕으로 인사이트를 찾아내고 자연 언어 생성 기술(Natural Language Generation)을 이용해 읽기 쉬운 문장을 생성하게 된다. 여기에서 문장 길이를 바꾸거나 제목 형식이나 시각화 등을 곁들이기도 한다. 이렇게 만들어진 글은 다양한 플랫폼에 전송하게 된다. 워드스미스로 작성된 뉴스는 이미 일반 독자에게도 전달되고 있다. AP통신의 경우 자사가 제공하는 뉴스에 이 기술을 도입하고 있다. 이런 기사를 보면 단순한 매출 데이터만 나열하는 게 아니다. 분석 내용을 담거나 자연스러운 문체를 곁들인 것이다. 이는 자연 언어 생성 기술의 성과라고 할 수 있다. 이들 자동 생성 기사에는 하단에 문구(story was generated by Automated Insights)를 넣어서 표시를 하고 있다. 이런 기사는 인터넷에서 검색해보면 4만 건이 넘는다. 생각보다 많은 곳에서 이미 활용되고 있는 것이다. 이제까지 이런 기사를 작성하려면 기자가 발표 자료를 읽고 필요한 숫자를 뽑아낸 다음 미리 만들어놓은 개요에 숫자를 넣어 손을 보고 기사를 작성하는 과정을 거쳤다. 하지만 워드스미스는 이를 거의 자동화해서 몇 초만에 기사를 완성할 수 있게 해준다. 워드스미스 도입에 따라 이전까지 분기당 300건이 한계였던 이런 류의 기사 작성 수는 3,000건으로 늘어났다고 한다. AI사는 이런 기술 덕에 사모펀드인 VEP(Vista Equity Partners)로부터 8,000만 달러에 인수됐다. 이 회사는 스포츠 분야에서 AI처럼 특화된 자동 생성 기술을 갖춘 스테츠(STATS)를 이미 인수한 바 있다. 여기에 부동산이나 마케팅, 경제, 스포츠 분야에 강한 AI까지 통합한 만큼 산하 26개사의 데이터 활용에 도움이 될 것으로 보인다. 관련 내용은 이곳( http://blog.automatedinsights.com/post/110808141052/weve-been-acquired-but-wait-theres-more )에서 확인할 수 있다.

All about Tech. 사람과 기술, 제품이 만나는 뉴미디어 테크홀릭입니다.
Follow
4.7 Star App Store Review!
Cpl.dev***uke
The Communities are great you rarely see anyone get in to an argument :)
king***ing
Love Love LOVE
Download

Select Collections