글쓴이 : SOONDORI
神, 외계인, 미래에서 온 자, 어찌 보면 인공지능일 수도 있는 우월한 존재에 대한 갈망은 수천 년간 이어져온 셈이고 가장 가까운 시점의 기원은, (장난삼아 정의하기로) 영화 ‘2001 스페이스 오디세이’의 HAL 9000이라고 생각하는데…
제법 익숙해진 Machine Learning, Deep Learning, AI 등 다양한 용어로 풀이되는 프로그램적 구현물에 대해서, 갑자기 사람들이 이토록 큰 관심을 보이는 이유는? 아직은 “심봤다”를 외칠 단계가 아닌데 풀 한 포기를 보고 흥분하는 이유는?
“왜 이렇게 화들짝 놀라시는지 잘 모르겠습니다”
진행형이지만 월등하게 좋은 성능과 로직 개선을 위한 억 명 단위 베타 테스터 모집 전략과 어떻게든 구글을 때려 눕히고 싶은 마이크로소프트의 언론 플레이와 호재 키워드에 신이 난 IT 업계 내지 언론 시장의 이해득실이 겹친 것은 아닐까 한다.
물론, 그 선두 주자가 국내 IT 산업계의 분위기를 싹 바꿔 놓고 그럼으로써 국산형 AI 개발에 유리한 환경이 조성되는 것이나 콩알만한 데이터베이스로 가두리 장사를 해온 N사와 K사가 정신 차릴 기회를 제공하게 되었다는 점은 대단히 고무적인 일이기는 하다.
아무튼 그리하여…
○ 다음 URL에서, 흔한 방법으로 적당히 로그인.
https://openai.com/blog/chatgpt/
○ 확실히… “This is a free research preview”라고 적혀 있고 시니컬한 자의 눈에는 “ChatGPT에게 이득이 되는 피드백 테스트 모드로 가동 중입니다.”로 읽힌다.
○ 무성의한 질문에는 상식적인 답변이 돌아오고… “그런 거 아니거덩!”
○ 대화형이라서? 질문 이면에 담긴 의미를 해석하고 나름 유연하게 대처한다.
○ 구글 테이터베이스에 연동하면 조금 나아질까? 수 조 건 자체 데이터베이스와 사용자 입력 문장에 기초한 확률론적 추정으로 답변을 조합하는 시스템이라서, 기본 정보가 부재할 경우 적당한 답을 내놓지 못한다.
그럼에도 끝내 에둘러 뭐라고 뭐라고 하기는 하는데… 그런 식이면 언젠가는 전 세계에서 “나는 정말 몰라요” 찾기 놀이가 유행할 듯?
진정으로 알고리즘 개선을 원하면 MS가 그런 이벤트를 기획해야 하는 것 아닌가 싶음. 구글 AI와 이세돌의 바둑 대결과 같은 글로오~벌 이벤트.
○ 아하! 인켈의 명품, AD-400을 모르다니… 섭섭하지만 그럴 수 있다. 단, 5조 건 데이터베이스로는 많이 모자란다는 뜻.
가만 보면, 현재 시스템은 그럴듯한 답변 문장을 조합하는데 초점이 맞춰져 있는 모양이다. 그러니까 ‘내용’ 또는 ‘진실’이 아니라 ‘쥐어짜기 답변 문장’을 만드는 것에 특화되어 있다는 말씀. ‘CHAT’을 강조하고 ‘Optimizing Language Models for Dialogue’라고 정의해둔 그대로.
대체로 사람처럼 행동하려면, “몰라요. 알려주세요” 또는 “저는 잘 모르지만…”, “~아닐까요?” 톤으로 말해야 하는 것 아닌가? (요즘 언어 변환은 기본 중의 기본이니까 번역 문투 차이라고 생각하지 않음)
ChatGPT의 의미를 최첨단 AI 인터페이스 정도로 축소할 때… 구글은 MS보다 훨씬 더 방대한 데이터베이스를 갖고 있고 목하 카운터 펀치를 날리려고 참고 있을 것이니 조만간 재미있는, 점입가경의 IT 싸움을 관전하게 되겠다. 그 싸움의 이면에서… 자동차 시장이 눈독을 들이게 될 것인데 전장기업 하만을 가진 삼성전자의 행보는? 당장은 폭망각인 N사와 K사의 대응은?
일람은 여기까지.
뭐… AI 강세가 좋은 일인지 아닌지는 잘 모르겠고 어쨌든 빠르게 기술이 진화하고 있음이다.
한편으로 Text 교환이 있으면 음성, 음향은 그대로 따라가는 법이니까 대화형 솔루션의 득세 즉, <새로운 국면의 오디오 전성시대>가 다시 찾아오리라는 기대하에 양호한 전조 현상으로 이해하련다. 그래서 왈,
“인켈 AD-400은 최첨단 AI에서 멀어지는 게 아니라 사실은 다가가고 있는 것입니다”
(내용 추가) ChatGPT라는 작명에 대한 개인 생각.
Chat은 대화형이고… Generative Pre-trained Transformer의 Generative는 재생성, Pre-Trained는 선행 학습, Transformer는 딥-러닝 분야의 알고리즘(학습 모델)을 지칭하는 단어이므로 풀어서 쓰면… ‘선행학습형 트랜스포머 모델을 이용한 재생성 대화 도구/수단/프로그램’ 정도가 된다? 열심히 가르치면 대충 알아듣고 새로운 것을 만들어낸다는.
그런데…
가만 생각하면, (본원적 의미에서 바라본) 극도로 개선된 검색 엔진으로 보기는 어렵다. (사실, MS는 그런 말을 강조하지도 않았다고 보고…) 그냥 검정 봉지 안에 들어간 작은 구슬을 잘 꿰매는 데 특화된 도구로 보는 게 어떨까 한다. 그에 반해, 구글 검색 엔진은 어떤 알고리즘으로 데이터베이스에 있는 것 그대로를 빠르게, 잘 찾아주는 도구.
상호 속성이 다르다. 현재형 구글 검색에서 재생성에 의한 결과는 없음.
작명이 내포하고 있는 속성 때문에 Pre-Trained가 부족하거나, 확률론적 추상에 의존하는 Transformer 처리에 부족함이 있으면 엉뚱한 대답을 하게 될 것이니… 자, 작금의 어수선한 틈을 이용해서, 요리조리 잘 물어보고 MS의 스위스 은행 비자금 정보를 알아낼 수 있으면 좋겠다.
아무튼, 거대 IT 공룡인 Google과 MS의 싸움은 정말 흥미진진함. 맥주와 팝콘을 준비하고 2023년을 심하게 관전하면 좋은… 결국은, 압도적으로 Pre-trained를 잘할 여건을 갖추고 있는 구글이 이긴다에 한 표. 지난 시간 MS가 나태한 면이 많았으니, 이 발 빠른 IT 세상에서 챗GPT 하나를 가지고 갑자기 구글을 따라잡기는…
(내용 추가) 이런 와중에 검색 결과 창에 판매 상품 좌판부터 걸고 시작하는 네이버 포털, 다음 포털 등은 BM을 개선하고 콘텐츠 소비자를 우선하거나 독식을 완화하지 않으면 야후나 라이코스처럼 한순간에 사라질 것이다. 앞으로 10년 내.
“거대한 쓰나미가 몰려오는데… 정신 좀 차리소!”