close

카카오, 핵심 음성 기술 확대 개방...음성 API 일 2만 건 무료 제공

  • 이메일
  • 트위터
  • 페이스북
  • 페이스북

[OSEN=고용준 기자] 인공지능 시대 기술 발전을 가속화하는데 카카오가 팔을 걷어올렸다. 카카오는 19일, 한국어 음성 인식 및 합성 기술 분야에서 최고 수준의 품질을 지닌 카카오 음성 API의 무료 이용 범위를 하루 2만 건으로 4배 확대 제공한다고 공개했다.

무료 이용 범위 기준으로 한국어 음성 API 중 최대다. 음성 기술이 2017년 전세계 IT 업계의 화두인 인공지능 및 모바일 개인 비서 서비스의 근간을 이루는 핵심 기술 중 하나인 만큼, 카카오의 이번 결정은 올 한 해 국내 인공지능 기술 발전의 촉매가 될 전망이다.

카카오가 음성 API 무료 이용량을 기존 하루 5000 건에서 4배까지 대폭 확대한 것은 지난 3년 간, 음성 기술을 필요로 하는 기업 및 개인의 다양한 요구를 확인했기때문이다. 음성 기술을 공유함으로써 더 많은 영역에서 음성을 기반으로 한 발전을 가능하게 한다는 취지다.

카카오 김재범 미디어처리파트장은 “모바일 기기의 발전과 인공지능에 대한 관심 등에 힘입어 음성 기술에 대한 필요가 계속 증가하는 추세다. 음성 검색이나 음성 합성을 기반으로 한 서비스를 개발 및 상용화하는데 제약이 없는 수준을 검토한 끝에 하루 2만 건으로 음성 API 무료 이용량을 확대하게 된 것”이라며 “다양한 음성 기반 서비스의 출시는 궁극적으로 국내 음성 기술 수준의 향상과 개발 역량의 발전을 이끌게 될 것”이라고 덧붙였다.

카카오는 입력된 목소리를 문자로 변환, 음성 검색 서비스를 가능케 하는 음성 인식 엔진 ‘뉴톤’을 자체 개발하고 2014년 2월, API를 개방했다. 같은 해 6월, 입력된 문자를 음성으로 변환해서 사람이 읽어주는 것처럼 자연스럽게 들려주는 음성 합성 엔진 ‘뉴톤 톡’을 개발, 기존 음성 인식 API에 해당 기능을 추가해 인식과 합성이 모두 가능한 음성 API를 완성했다.

다년 간 구축해 온 방대한 양의 데이터베이스와 고도화된 딥러닝 경험 등을 바탕으로 완성한 한국어 음성 엔진을 개방한 것은 국내 최초다. 개방 당시 기업 및 개발자 누구에게나 하루 최대 5천 건을 무료 제공함으로써 스타트업의 혁신적인 모바일 서비스 개발과 음성 기반 서비스 편의 제공 등을 가능하게 했다. 이미 470여 기업 및 개인이 카카오 음성 API를 이용 중이다. 업종 역시 쇼핑, 교육, 병원 등 다양하게 분포돼 있으며 장애인 관련 서비스 및 기업에서도 음성 API를 적극적으로 활용하고 있다. 주소나 지역 명 등의 검색 빈도가 잦은 배달 업종에서도 음성 검색 기능으로 효율을 높이고 있다.

배달 대행 업체 제트콜은 카카오 음성 API를 앱에 적용, 배달 주문이 접수되면 이를 음성으로 변환해 매장과 배달 담당 직원에게 안내한다. “점주와 직원들이 바쁜 업무 중 일일이 주문을 확인하지 않아도 음성으로 내역 알림을 받기때문에 편리하고 시간도 절약된다”는 평이다.

카카오 음성 API를 이용해 도로명주소와 새 우편번호 등의 검색 정보를 제공하는 코리아크레딧뷰로는 “주소는 한글, 특수기호, 숫자 등의 조합이라 스마트폰 자판으로 입력하기 번거로워서 음성 검색 중심의 서비스를 기획했고, 카카오의 음성 API가 개방돼 있었기때문에 이 서비스를 실제 구현하는 것이 가능했다”고 밝혔다.

한편 카카오는 자체 서비스 내 음성 기술 적용 범위도 확대할 계획이다. 현재 음성 검색이 가능한 카카오맵, 카카오내비, 다음앱 외에 카카오지하철과 카카오버스 앱에도 음성 검색 기능 도입이 예정돼 있다. 상반기 중에는 음성 합성 엔진을 이용해 다음뉴스의 뉴스 콘텐츠를 음성으로 변환해 주는 뉴스 읽기 서비스도 추가된다. / scrapper@osen.co.kr

OSEN 포토 슬라이드
슬라이드 이전 슬라이드 다음

OSEN 포토 샷!

    Oh! 모션

    OSEN 핫!!!
      새영화
      자동차