본문 바로가기
나눔/인공지능 소식

오픈AI 인공지능 음성 비서 출시 예정 Voice Engine

by 나누는 뭐맘 2024. 4. 2.
반응형

AI 음성 비서

인공지능 음성 비서는 사용자가 음성 명령을 사용하여 상호 작용할 수 있는 기술입니다. 애플의 '시리'나 아마존의 '알렉사'같은 것들이 포함됩니다. 간단한 일정 관리나 정보검색은 물론 스마트 홈 제어, 엔터테인먼트 등의 기능을 수행할 수 있습니다. 또한 스마트폰은 물론 다양한 기기에 적용 가능 합니다.

 

오픈AI 보이스 엔진

오픈AI 블로그

미국 현지 시간 3월 23일 오픈AI에서 '보이스 엔진(Voice Engine)' 상표를 출원했다고 합니다. 상표 용도에는 음성인식, 음성명령처리, 음성생성, 번역, 텍스트와 음성 간 변환 등이 포함되어 있습니다.

3월 29일 오픈AI의 공식 블로그를 통해 AI 모델 '보이스 엔진'을 미리 보기 형태로 공개했으며 영상 생성 인공지능 '소라'처럼 일부 제한된 테스터들이 모델에 접근할 수 있습니다.  GPT-5가 출시 예정인 가운데 음성 비서를 먼저 선보인 것입니다.

블로그에 공개된 내용에 따르면 15초 분량의 오디오 샘플을 통해 음성 복제가 가능하며, 매우 감성적이고 사실적인 목소리를 낼 수 있습니다.
2022년 부터 개발되어 온 모델로 교육용이나 장애가 있는 사람에게 도움이 되기 위한 의료용 목적으로도 유용하다고 밝혔습니다.

 

음성 변환

이처럼 샘플 음성을 통해 다양한 언어로 번역된 인공지능 음성을 얻을 수 있으며, 크리에이터나 기업이 전세계의 많은 사람들에게 자신의 목소리로 유창하게 다가갈 수 있다고 오픈 AI는 설명했습니다.


하지만 각국의 선거를 앞두고 악영향을 우려해 일반공개는 아직 결정되지 않았습니다. 보이스 엔진의 오용을 막기 위해 다양한 각도에서 검토하고 안전을 위한 접근 방식을 취하고 있다고 합니다.

 

마무리

음성 인공지능 기술이 발달함에 따라 편의성이 늘겠지만 우려되는 부분도 분명 있습니다. 앞서 오픈AI가 언급한 선거철 오용은 물론 음성 데이터를 취합하기 위한 개인정보의 탈취 우려, 음성을 통한 각종 보안 이슈나 사기 등의 우려, 가짜 뉴스의 확산이나 음성 관련 직업에 대한 불안감 등이 있습니다. 인공지능을 개발하는 회사는 당연하고, 인공지능을 활용하는 개개인들도 이런 위험을 항상 인지하고 있는 것이 피해를 줄이는 방법이라고 생각합니다. 이상 뭐맘이었습니다.

 

 

반응형