AI 스타트업 신테시아, 인간 감정 표현을 위한 업그레이드된 AI 아바타 선보여
자카르타 - 엔비디아(Nvidia)가 지원하는 인공지능(AI) 스타트업 신테시아(Synthesia)가 AI 아바타가 인간의 감정과 움직임을 전달할 수 있는 새로운 업그레이드를 선보였습니다.
회사는 기업 프레젠테이션, 마케팅, 교육 목적으로 텍스트 지침을 기반으로 감정을 표현하는 것을 목표로 하는 'Expressive Avatars'를 4월 25일 공개했습니다.
Generative AI는 OpenAI의 Sora 비디오 생성기처럼 사실적인 움직이는 이미지를 생성하는 능력으로 종종 칭찬을 받습니다.
그러나 AI에도 결함이 없는 것은 아닙니다. 특히 왜곡된 손이나 팔다리, 콜라주된 배경, 말과 일치하지 않는 입술 등으로 나타나는 인간을 묘사할 때 특히 그렇습니다.
Synthesia는 스튜디오에서 대본을 읽는 실제 인간을 대상으로 개발된 최신 버전에서 이 문제를 해결하려고 합니다. 이는 봇이 입술 추적을 캡처하고 감정 표현을 보다 정확하게 수행할 수 있도록 돕기 위해 수행됩니다.
Synthesia의 공동 창립자이자 CEO인 Victor Ribarbelli는 비디오에서 누락된 부분은 인간과 달리 "아바타는 자신이 말하는 내용을 이해하지 못하기 때문에" 이전에는 감정에 대한 얼굴 반응이 부족했다는 점이라고 말했습니다.
스튜디오에서는 "기쁘다. 슬프다. 답답하다"라는 간단한 지시에도 주어진 감정에 맞는 표정과 말투를 전달해 반응하도록 훈련받는다.
새로운 아바타는 130개 이상의 언어로도 제공되며 자체 자막을 제공하고 사용자의 음성을 복제할 수도 있습니다.
그러나 영어 이외의 언어(프랑스어, 독일어, 스페인어 등)를 사용하는 Synthesia 웹사이트의 예시 아바타 모델 중에서 영어 모델이 가장 발전되고 인간과 유사합니다.
이 스타트업은 포춘지 선정 100대 기업 중 최소 절반을 고객으로 보유하고 있으며 55,000개 이상의 기업에 서비스를 제공하는 것으로 알려졌습니다. 여기에는 Zoom, Xerox, Microsoft, Reuters 등 다양한 업계의 리더가 포함됩니다.
Synthesia는 2017년에 설립된 영국 기반 회사입니다. 지난해 AI 붐 덕분에 이 회사는 현재 Nvidia와 같은 주요 후원자들과 함께 약 10억 달러(16조1천억러피아)의 가치 평가에 도달했습니다. AI 반도체 칩 개발을 주도하고 있다.
비즈니스 용도로 인간과 유사한 아바타를 생성하는 좁은 접근 방식으로 인해 Synthesia는 OpenAI의 ChatGPT와 Google의 Gemini 챗봇과 같은 경쟁 챗봇 모델 간에 발생한 과대 광고와 치열한 경쟁을 피했습니다.