사람처럼 '실시간 대화' AI 나왔다…오픈AI, 'GPT-4o' 출시

by 민들레 posted May 14, 2024
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄

사람처럼 보고 듣고 응답
구글 행사 하루 전 '정면 승부'

 

챗GPT 개발사 오픈AI가 13일(현지시간) 실제 사람처럼 자연스럽게 대화할 수 있는 새로운 AI 모델을 공개했다. 구글의 연례 개발자 회의(I/O)를 하루 앞두고 정면 승부에 나섰다.

이날 미라 무라티 오픈AI 최고기술책임자(CTO)는 라이브 행사를 통해 'GPT-4o'(GPT-포오)를 공개했다.
 

샘 올트먼 오픈AI CEO [이미지출처=AFP연합뉴스]

샘 올트먼 오픈AI CEO [이미지출처=AFP연합뉴스]

주로 텍스트를 통해 대화하던 기존 모델과 달리 'GPT-4o'는 이용자와 실시간 음성 대화를 통해 질문하고 답변을 요청할 수 있는 AI 모델이다. 텍스트뿐 아니라 청각, 시각으로도 추론하고 답할 수 있는 것이다. 새 모델의 'o'는 '모든'이라는 뜻의 '옴니'(omni)에서 따왔다.

응답시간도 대폭 짧아졌다. GPT-4o의 응답 시간은 최소 232밀리초, 평균 320밀리초다. 오픈AI는 인간의 응답시간과 비슷한 수준이라고 설명했다. 이전 모델인 GPT-3.5는 평균 2.8초, GPT-4가 응답에 5.4초가 걸렸다. 반응 지연을 극복하고 실제 사람같이 실시간 대화가 가능해진 것이다.

GPT-4o는 시연에서 다양한 말투와 목소리, 감정, 톤을 바꿔가며 말하는 모습을 보였다. 비전 인식을 통해 간단한 수학 문제(3x+1=4)를 푸는 시연도 했다. 풀이법을 보여달라고 하자 차근차근 단계별로 설명했다. 사람처럼 세상을 보고, 듣고, 해답을 내놓는 것이다.

영화 '그녀(HER)'에서 주인공이 AI 사만다와 대화를 나누는 장면이 떠오른다. 샘 올트먼 오픈AI 최고경영자(CEO)는 이날 행사가 끝난 뒤 X(옛 트위터)에 'her'이라는 단어를 게시하기도 했다.

실시간 번역 기능도 제공한다. 오픈AI는 'GPT-4o' 모델이 기존 GPT-4 터보보다 두 배 더 빠르고 비용은 2분의 1 수준이라고 밝혔다. GPT-4 터보는 지난해 11월 선보인 최신 버전이다. 또 한국어 등 50개 언어에 대한 품질과 속도가 향상됐다.

모든 글로벌 이용자들에게 무료로 제공하지만, 기존 유료 이용자는 무료 이용자보다 5배 많은 질문을 할 수 있다. GPT-4o는 이날부터 사용 가능하며, AI 음성 모드는 몇 주 내에 공개될 예정이다.

무라티 CTO는 "사용 편의성에 관해 우리가 정말로 큰 진전을 이뤘다고 생각하는 것은 이번이 처음"이라고 말했다.

오픈AI의 이날 발표로 거대기술기업(빅테크) 간 AI 경쟁이 더욱 치열해질 전망이다. 구글은 최대 행사 중 하나인 연례 개발자 회의를 하루 앞두고 있다. 애플은 다음 달 열리는 연례 세계 개발자 회의(WWDC)에서 AI 전략을 발표할 것으로 보인다.

 

 

아시아경제