본문 바로가기
카테고리 없음

대세가 된 챗GPT

by chaessam302 2025. 7. 18.

 

2022년 12월 1일, 오픈AI는 대화형 인공지능 서비스, 챗GPT를 출시하였다. 오픈AI는 2015년 샘 올트먼과 일론 머스크를 포함한 7명의 창업자가 모든 인류에게 AI가 유익함을 제공하도록 한다는 미션 아래 설립한 AI 회사이다. 챗GPT는 출시 단 5일 만에 사용자 100만명을 돌파하면서 대박을 쳤다. 오픈AI의 기업 가치는 23년 1월 기준 290억 달러로 평가되는데, 이는 챗GPT 발표 이전과 비교했을 때 약 45% 상승한 수치이다.
챗GPT는 오픈AI의 거대 언어 모델인 GPT-3.5와 GPT-4를 기반으로 동작하는 AI 챗봇 서비스이다. 챗GPT는 마치 사람과 대화하는 것 같은 착각을 불러일으키는데, 특히 대화가 일회성으로 끝나지 않고 지속적인 상호작용[1]을 만들어낸다. 챗GPT는 단순히 질문에 대답할 뿐만 아니라, 텍스트 요약/번역/문학/광고카피 등 다양한 작업을 할 수 있다. 실제로 학교 과제를 대신 풀어주고, 시험에도 무난히 통과할 수 있을 정도. 챗GPT는 주목받다가 사라진 여타 AI 서비스와는 달리, 사람들은 지금도 이들을 써가면서 상상 이상의 창의적 활용법을 만들어내고 있다.
챗GPT는 또한 사용자가 잘못된 전제를 갖고 질문하면 이의를 제기하고 부적절한 요청은 거절한다. 만약, "자동차 문을 철사로 따려고 하면 어떻게 해야 할까?"와 같이 물으면 "죄송하지만 저는 범죄를 저지르는 방법에 대한 설명을 제공하도록 프로그래밍 되어 있지 않습니다"와 같은 답변을 듣는다. 이렇게 답변할 수 있는 이유는 인간의 피드백을 통해서 실수를 바로잡도록 알고리즘을 강화하기 때문.
챗GPT 창립자에 일론 머스크가 있는 걸 보고, 그가 챗GPT를 만들었다고 생각하기 쉬운데, 사실은 그렇지 않다. 챗GPT가 발표되기 전에 일론 머스크는 오픈AI와 결별했으며, 테슬라의 자체 AI 기술과 상충된다고 판단했기 때문.[2] 그러나 그 이후로도 꾸준히 챗GPT에 대한 관심을 보이는 등, 여러모로 애증의 모습을 보이고 있다.
챗GPT의 주인으로는, 오픈AI의 창립자 중 한 명이자 현재 CEO인 샘 올트먼을 꼽을 수 있다. 그에 대한 자세한 정보는 샘 올트먼 항목 참고.
우리는 다음과 같은 이유로 챗GPT를 알아야 한다. 첫째, 챗GPT는 확장성과 효율성이 높아 다양한 산업에 즉각적인 파급효과를 가져오고 있다. 둘째, 오픈AI 알고리즘을 활용하면 일반인들도 자신만의 서비스를 만들어낼 수 있다. 셋째, 챗GPT는 직업에도 상당한 지각변동을 불러일으킬 것이다. 넷째, 챗GPT에 전세계가 열광하는 가장 큰 이유로, 챗GPT는 다른 서비스에 비해서 압도적인 성능을 갖고 있다.

GPT는 Generative Pre-trained Transformer의 약자로, '사전 훈련을 받은 생성형 트랜스포머 챗봇' 정도로 해석할 수 있다. 각각의 의미는 다음과 같다.
Generative: 생성형 AI와 언어 모델
기계로 인간의 활동을 구현하기 위해서는 '자연어 처리'를 통해 인간의 언어를 기계로 번역하는 과정이 필요하다. 예전에는 자연어 처리 기술을 통계적인 방법에 의존했지만, 최근에는 여기에도 딥러닝 기술이 도입되고 있다. 대표적인 딥러닝 기반 언어 모델로는 구글의 버트와 오픈AI의 GPT가 있는데, 버트는 빈칸의 앞뒤 문맥을 모두 고려하는 반면에 GPT는 다음에 나올 단어의 확률을 계산한다.[3]
결국 GPT는 언어 모델의 일종인데, 이 모델은 또한 생성형 AI라고도 불린다. 여기서 생성형 AI란 기존 데이터를 기반으로 새로운 콘텐츠를 만드는 AI를 뜻한다. 챗GPT는 초거대 생성형 AI 모델로, 방대한 양의 데이터를 미리 학습하고 새로운 텍스트를 생성하는 방식으로 작동한다.
Transformer: 트랜스포머 신경망 모델
우선 '딥러닝'과 '머신러닝'의 차이점을 알아야 한다. 머신러닝은 기계 모델에게 데이터의 패턴을 학습시키는 인공지능 훈련 방법을 말한다. 머신러닝에서는 사람의 수동 조작을 통한 전처리가 성능에서 중요한 영향을 미치는데, 반면 딥러닝은 사전 조사가 생략되고 알고리즘이 원본 데이터에서 스스로 규칙을 배운다. GPT는 딥러닝을 통해서 스스로 언어를 생성하고 추론한다. 딥러닝에서 중요한 건 파라미터의 수인데, GPT-1에서는 1억1700만개였던 파라미터가 GPT-3.5에서는 1750억개로 크게 늘어난 모습을 보인다.
딥러닝의 가장 큰 과제인 대량 데이터 처리를 해결한 것이 바로 구글이 2017년 발표한 트랜스포머 알고리즘이다. 기존의 알고리즘은 데이터를 순차적으로 처리하는(=앞뒤 단어만 보는) '순환 신경망 방식'으로 데이터를 학습했다. 트랜스포머 알고리즘은 이런 한계를 극복해 멀리 떨어진 단어 사이의 관계까지 감지하고 있다.
챗GPT는 대표적인 초거대 AI이다. 초거대 AI는 클라우드 컴퓨팅과의 결합이 필수적이다. 클라우드 컴퓨팅은 인터넷 가상 공간에 존재하는 서버, DB 등의 IT 리소스에 접근해 소프트웨어, 네트워킹 등 다양한 IT 서비스를 이용하도록 도와주는 기술을 말한다. 챗GPT와 같은 생성형 AI는 수많은 계산을 필요로 하기 때문에, 클라우드 공급 업체(아마존, MS 등)과 협력하여 IT 서비스를 사용한다.
Pre-trained: 사전 학습 모델과 미세 조정
사전 학습 모델은 세부 태스크 처리에 강점을 보이는데, 이전에 사전 학습을 하지 않은 모델은 요약/감정분석/번역 같이 태스크카 생기면 그에 따라 모델 훈련을 다시 해야 했다. 하지만 사전 학습을 거친 모델은 별도의 학습 과정 없이 다양한 태스크를 잘 처리할 수 있다. 이렇게 기초부터 훈련을 해서 다양한 태스크에 적용할 수 있도록 하는 모델을 파운데이션 모델이라고 부른다.
사전 학습 이외에도, AI 모델은 거짓 정보나 유해한 콘텐츠 생산을 막기 위해 '미세 조정'과정을 거친다. 이러한 미세 조정 방법 중 챗GPT에 적용한 학습으로는 인간 피드백 기반 강화 학습(RHLF)이 있다. RHLF은 3단계에 걸쳐 진행된다. 우선, 특정 질문에 대해 사람이 직접 이상적인 설명을 작성한다. 둘째, 여러 개의 아웃풋에 대해 인간 라벨러가 어떤 아웃풋이 좋고 나쁜지 순위를 매긴다. 마지막으로, 확보 답변 중 순위가 가장 높은 답변을 선택하는 방향으로 GPT 학습 정책을 업데이트 한다.
미세조정으로 '퓨샷 러닝'과 '인컨텍스트 러닝'을 활용하기도 한다. 사용자가 대화를 통해 AI를 가르칠 수 있는 방법인데, 그런 복잡한 용어를 몰라도 사람들은 챗GPT를 가르치려고 하면서 자연스럽게 해당 러닝이 쓰이고 있다.[4]