[남영준 칼럼] 챗GPT의 속성과 예상되는 변화
[남영준 칼럼] 챗GPT의 속성과 예상되는 변화
  • 남영준
  • 승인 2023.02.22 03:00
  • 댓글 0
이 기사를 공유합니다

남영준 톡톡미디어 대표  (전 국제종합기계 대표)
남영준 톡톡미디어 대표 (전 국제종합기계 대표)

챗GPT가 시중의 큰 화제이다. 챗봇(Chatbot)은 문자로 사람과 대화하도록 만들어진 프로그램이다. 말로 물으면 답해 주는 구글 어시스턴트가 음성기능이 장착된 하나의 챗봇이다. 오픈AI사가 이번에 공개한 챗GPT-3.5는 딥러닝을 바탕으로 한 인공지능 모델로 사람이 쓰는 자연어를 잘 알고 대화한다.

현재도 챗봇은 우리 생활 곳곳에 사용되고 있다. 고객센터의 응대에서 흔히 볼 수 있다. 지금은 질문하면 미리 정해진 답변을 가져와서 대답한다. 그런데 챗GPT는 사람과 하듯이 답을 하고, 대화하면서 수정하기도 한다. 챗GPT의 핵심은 사람처럼 대화하는 능력이다. 사람의 글을 그만큼 잘 알아보고, 방대한 자료에서 정확한 대답을 가져오는 게 핵심이다.

여기서 사람이 쓰는 자연어를 잘 이해하려면 파라미터가 중요한데, GPT는 1,750억개의 파라미터를 쓰는 언어 모델이다. 파라미터는 매개변수라고 하는데, 프로그램에서 어떤 출력 값이 나오기 위해 전달되는 변수이다. 어쨌든 현재까지는 많을수록 유리하다.

인공지능이 사람이 쓰는 언어를 이해하려면 학습해야 한다. 전에는 인공지능에 언어 문법을 가르쳤지만, 지금은 수십억 개의 말 덩어리를 던져주면 인공지능이 알아서 스스로 공부한다. 인공지능은 말들의 관계를 수학적으로 분석해서 학습하는 트랜스포머 방식을 사용한다. GPT가 미리 훈련된 생성 트랜스포머(Generative Pre-trained Transfomer)의 약자이다.

챗GPT는 대부분 영어로 되어 있어서 한국어는 잘 이해 못 한다. 이에 국내 업체들의 언어 모델 개발이 활발하다. LG의 엑사원은 1,750억개의 파라미터를 보유하고 있으며 영어와 한국어를 동시에 학습하고 있다. 네이버의 하이퍼클로바는 2,000억이 넘는 파라미터를 보유하고 있는 한국어 특화 모델이다.

챗GPT가 말을 이해한다는 것은 사람처럼 이해하는 게 아니라 가지고 있는 방대한 자료 중에서 확률적으로 가장 연관이 높은 문장을 보여주는 식으로 대화한다. 대화 능력을 갖추고, 여기에 공개된 각종 자료를 학습하면서 웬만한 사람 이상의 지식을 갖춘 똑똑한 인공지능이 되었다.

구글은 버트(BERT)를 통해 대화에 나서고 있다. 챗GPT가 구글 버트보다 문장 만드는데 조금 앞서고 있는 것으로 알려졌다. 마이크로소프트사는 챗GPT 개발사인 오픈AI에 10억달러(1조3천억원)를 투자한 데 이어 100억달러 투자를 협의 중이라고 한다. 마이크로소프트는 자사 검색엔진 빙(Bing)과 MS오피스에 GPT를 올린다고 한다. 앞으로 PPT나 엑셀 작성이 얼마나 편해질까.

마이크로소프트사는 코타나를 통하여 음성 서비스를 제공하고 있다. 코타나는 마이크로소프트사의 검색 엔진인 빙을 기반으로 동작하는데, 사용자의 습관이나 행동을 학습하면서 점점 더 사용자에 맞추는 개인비서를 지향한다. 여기에 챗GPT가 더해진다면 또 다른 모습이 될 것이다.

음성인식은 애플의 시리로 잘 알려졌는데, 이를 개발한 뉘앙스커뮤니케이션즈의 음성인식 엔진은 삼성, 구글에서 다 사용 중이다. 현재 영어는 99%의 인식률을 보인다. 뉘앙스에서 분사한 세렌스는 자동차 음성인식의 선두주자이다. 운전자와 자동차 간의 음성을 통한 연결은 세계 최고 수준이다.

음성인식을 넘어 음성합성이 또 다른 발전 분야이다. 음성합성은 입력 문자와 음성 데이터를 주면 스스로 학습해서 그 사람의 목소리로 말한다. 지금은 특정인의 목소리를 그대로 복제하는 수준까지 이르러 발언을 조작할 수도 있다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.