본문 바로가기
일상다반사/이슈모음

GPT4 출시, "SAT 등 시험서 상위 10% 성적"

by ▦▒▥▧▩ 2023. 3. 15.
반응형

ChatGPT

인공지능 챗봇인 챗GPT 열풍을 일으킨 오픈 AI가 새로운 대규모 AI 언어모델(LLM)인 GPT-4를 공개했다. 챗GPT에 적용된 GPT-3.5의 업그레이드 버전이다.

 

학문·전문분야 시험서 '인간 수준의 능력'

오픈 AI는 이날 대규모 AI 언어 모델(LLM)인 GPT-4를 출시했다고 밝혔다. 앞서 공개된 후 전 세계적으로 인기를 끈 챗GPT에 적용된 GPT-3.5의 업그레이드 버전이다.

오픈 AI는 GPT-4 모델이 많은 전문적인 시험에서 인간 수준의 능력을 보여줬다고 설명했다. GPT-4는 미국 모의 변호사 시험에서 90번째, 대학 입학 자격시험인 SAT 읽기와 수학 시험에서는 각각 93번째, 89번째 백분위수를 기록하며 상위 10% 수준의 성적을 냈다. 기존의 챗GPT의 경우 변호사 시험 등에서 하위 10% 정도의 성과를 기록했다. 오픈 AI 측은 “평소 대화에서는 GPT-3.5와 차이가 크게 나지 않을 수 있다”면서도 “더 미묘한 명령들을 처리할 수 있다”라고 말했다. 이어 “기존 버전보다 틀린 답이나 주제를 벗어난 답을 하는 경우가 적어 표준화된 시험에서 인간보다 더 좋은 성적을 낼 것”이라고 덧붙였다.

 

이미지 기반 질문에 올바른 추론 기반해 답변

GPT-4의 또 다른 강점으로 사진에 기반한 질문에도 답변하는 이미지 입력 기능이 제시됐다. 오픈 AI는 해당 기능이 시각장애인에게 도움이 될 것으로 기대했다. 공개된 사례 중 하나로, 풍선에 무거운 추를 단 사진을 제시한 후 줄을 자르면 어떻게 될지 질문하자 GPT-4는 풍선이 하늘로 날아갈 것이란 답을 내놨다.

 

허위정보·혐오발언 생성 등 한계는 여전

다만, 오픈AI는 GPT-4가 내놓을 오답을 의식한 듯 "여전히 우리가 해결하기 위해 노력하고 있는 많은 한계가 있다"라고 설명했다.

이어 "새로운 소프트웨어는 아직 완벽하지 않으며 많은 시나리오에서 인간보다 능력이 떨어진다"며 "여전히 '환상'을 갖고 답을 지어내며 틀렸을 때에도 옳다고 주장하는 경향도 있다"라고 덧붙였다.

 

더욱 강력해진 단어 생성 능력을 가진 GPT4

GPT4는 단어 생성 능력도 더욱 막강해졌다. 기존 챗GPT는 세션당 최대 토큰이 4096개로 한 세션에서 최대 약 8000 단어까지 처리할 수 있다.

세션은 AI와 사람이 묻고 답하고 묻고 답하기를 주고받는 구간이다. GPT4는 이 능력이 챗GPT보다 8배 많은 최대 3만 2760개 토큰, 최대 6만 4000개 단어를 처리할 수 있게 향상됐다. AI가 단편소설 하나를 그야말로 눈 깜짝할 새 쓸 수 있다. 이뿐 아니라 GPT4는 다른 나라 말로 번역할 수 있는 것도 한국어를 포함해 26개 국어로 늘렸습니다. 외신은 이탈리아말을 예로 들어 이탈리아 말을 우크라이나와 한국어로 번역해 준다고 보도했다.

 

반응형

댓글