요즘 대화형 인공지능AI 서비스 프로그램인 챗GPT 열풍이 뜨겁다. 도대체 챗GPT는 무엇인가? 쉽게 정의하면 인간이 사용하는 언어로 기계와 소통하는 프로그램 시스템이다. 

2022년 말, 세상에 공개된 챗GPT가 무슨 기능을 갖고 있으며, 우리는 이에 대해 어떻게 대처해야 할지 살펴보자.

Q : 네이버 뉴스 중 경제면 소식을 파이썬*으로 크롤링**해서 받아 보고 싶은데 어떻게 해야 하나요?

(*파이썬Python : 인터넷 프로그래밍 언어.

**크롤링crawling : 웹 페이지를 그대로 가져와서 거기서 데이터를 추출해 내는 행위다. 크롤링하는 소프트웨어를 스크레이핑scraping이라고도 부른다.)

A : 파이썬에서 셀레니움Selenium이라는 라이브러리를 활용해서…….

(그런데 챗GPT가 발표된 뒤엔 답변이 달라졌다.)

A : 챗GPT에 물어봐! 바로 알려주거든.

챗GPT가 세상에 공개된 후, 우리 생활에 많은 변화가 생겨났다. 위 질문에 대한 답변을 얻기 위해 이전에는 관련 도서나, 구글 또는 네이버 같은 검색 엔진에서 관련 지식을 습득하고 손수 코드를 짜야 했다. 그러나 이제는 챗GPT라는 대화형 인공지능 ‘챗봇’을 통해 원하는 정보를 문장 하나로 금방 받아볼 수 있는 세상이 되었다.

챗GPT 사용자 2개월 만에 1억 명

2022년 말에 미국의 오픈AI가 만든 대화형 인공지능 서비스 챗GPT는 간단한 회원 가입으로 누구든지 사용이 가능하다. GPT란 ‘Generative Pre-Trained Transformer’의 약자로, 사전적 의미로는 ‘생성적Generative 사전학습Pre-Trained 변환기Transformer’이다. 더 쉽게 말하면 대규모로 입력된 데이터를 먼저 학습한 뒤 대화하듯 결과를 제시하는 인공지능을 의미한다. 챗GPT가 공개된 후 사용자가 5일 만에 100만 명, 40일 만에 1천만 명, 2개월 만에 1억 명을 돌파할 만큼 전 세계가 주목하고 있다. 사용자가 100만 명이 되기까지 걸린 시간은 단 5일이었는데 이것을 다른 서비스와 비교하면, 넷플릭스는 약 3.5년, 페이스북은 약 10개월, 인스타그램은 약 2.5개월이 걸렸다고 한다.

사진 abcnews
사진 abcnews

마이크로소프트는 2019년에 이미 오픈AI에 10억 달러를 투자했고, 올해 1월에는 100억 달러 추가 투자를 논의 중이라고 언론에 밝혔다. 그리고 2023년 2월 말에 챗GPT를 자사 검색 엔진 ‘Bing’에 탑재하면서 유료화를 선언하였다. 검색 엔진의 최강자인 구글 역시 비상 회의를 소집하여 챗GPT에 대항하기 위한 논의를 거듭하였고, 2023년 2월에 구글이 개발한 AI 언어 프로그램 람다LaMDA를 탑재한 ‘바드Bard’를 공식 발표했다. 네이버에서도 챗GPT보다 한국어를 6,500배 더 공부한 ‘하이퍼클로바X’ 출시를 준비하고 있으며, 각 이동통신사에서도 초거대 AI 모델을 준비하고 있다.

대화하며 바로 답변을 주는 챗GPT의 장점들

그렇다면 세계는 왜 챗GPT라는 인공지능 모델에 열광할까? 앞에서 언급한 대로, 사람의 언어를 학습한 챗GPT는 질문에 현실적인 답변을 해준다. 우리가 검색 엔진으로 원하는 정보를 검색하려고 하면, 수많은 게시글 중 내가 원하는 게시글을 찾아서 읽어야 하고, 원하는 게시글이 없다면 검색을 반복해야 한다. 그렇게 하고도 가끔은 내가 원하는 결과를 얻지 못하기도 한다. 그러나 챗GPT는 질문하면 대화하듯 바로 원하는 답을 주고, 다시 질문하면 이전 대화 내용을 기억해서 처음 질문의 맥락에 맞춰 대답한다. 또한, 내가 쓴 글이나 소스 코드의 수정을 요청해도 답변을 준다.

이것이 가능한 이유는, 오픈AI에서 인간의 피드백을 통한 강화 학습(RLHF, Reinforcement Learning from Human Feedback)을 챗GPT에 도입했기 때문이다. 보통 AI 모델을 학습시킬 때에는 지도 학습*이나 비지도 학습** 등 여러 가지 방법을 사용한다.

(*지도 학습Supervised Learning : 정답이 있는 데이터를 활용해 데이터를 학습시키는 방법. 예를 들어, 인물 사진과 동물 사진을 주고 ‘이건 사람이고, 이건 동물이야’라고 알려주는 학습 방식.

**비지도 학습Unsuperviesd Learning : 정답 라벨링이 되어 있지 않은 데이터 중 비슷한 특징을 보유한 데이터를 군집화Clustering하여 새로운 데이터에 대한 결과를 예측하게 하는 학습 방식. )

챗GPT의 경우에는, AI 모델이 도출한 답변을 사람이 얼마나 선호하는지에 대한 피드백을 끊임없이 반복해 AI가 최대한 올바른 답변을 할 수 있도록 학습시킨 것이다. 실제로 챗GPT와 대화해 보면 위의 내용이 이해될 것이다.

챗GPT는 언어 영역에서도 강점을 보인다. 내가 원하는 문장이나 글을 영어, 프랑스어 등 다양한 언어로 번역해주며, 품질도 우수하다. 또한 내가 번역한 글에서 문법적인 오류를 찾아주고 수정해준다. 챗GPT는 미국의 의사 시험, 로스쿨과 MBA 등 전문직 시험을 통과했으며, 우리나라 대학수학능력시험도 치른 결과 우수한 성적을 냈다고 한다. 언어뿐만 아니라 논리적 사고에서도 우수함을 보이고 있는 것이다. 마지막으로 챗GPT는 시나 수필과 같은 문학 작품을 비롯해 제안서, 노래 가사 등등 셀 수 없을 만큼 많은 창조적인 콘텐츠도 제작한다. 결과물만 놓고 보면 사람이 썼다고 생각할 만큼 수준이 뛰어나다.

잘못 입력된 데이터를 학습해서 그대로 전달해주고

위에서 언급한 대로 챗GPT는 인공지능 기술을 활용해 우리에게 엄청난 편리함과 변화를 가져다주었다. 필자는 챗GPT를 조사하고 사용해 보면서, 이 초거대 AI의 단점도 볼 수 있었다. 시장에서는 현재 출시된 인공지능 모델의 장점이 어마어마하게 많지만 단점도 그만큼 많다고 판단하고 있다. 이러한 단점들로 인해 인공지능 시장은 아직 극초기로 평가받기도 한다.

언론과 학계에서는 여러 가지 단점들이 있다고 언급했는데, 가장 문제가 되는 몇 가지만 꼽아본다.

첫 번째는, 거짓 정보에 대한 문제다. 예를 들어, 챗GPT에 “세종대왕의 아이패드 프로 도난 사건에 대해 알려줘!”라고 질문하면, 경악을 금치 못할 답변이 나온다. 질문 자체도 오류가 있지만 그에 대한 답도 엉뚱하기 때문이다. 챗GPT가 이러한 할루시네이션*** 현상을 보이는 이유는, 잘못된 데이터까지 인공지능 모델이 모조리 학습해버리기 때문이다.

(***할루시네이션hallucination : 영어로 환각 현상을 뜻한다. 인공지능이 오류가 있는 데이터를 학습해서 틀린 정보를 맞는 답변처럼 제시하는 것을 가리킨다.)

지식을 꾸준히 습득하고 사고해야 하는 어린 학생들이 인공지능의 잘못된 답변을 그대로 받아들인다면 끔찍한 일이 생길 것이다.

챗GPT에 질문을 잘못하면, 경악을 금치 못할 답변이 나온다. 질문 자체도 문제가 있지만 그 답변도 엉뚱하기 때문이다.  (사진=MBC뉴스)
챗GPT에 질문을 잘못하면, 경악을 금치 못할 답변이 나온다. 질문 자체도 문제가 있지만 그 답변도 엉뚱하기 때문이다.  (사진=MBC뉴스)

두 번째는, 잘못된 정보 데이터로 인한 편향성에 대한 문제다. 데이터는 결국 사람에게서 나오기 때문에 정치적으로 한쪽에 치우친 데이터가 학습되거나 윤리적으로 문제가 있는 데이터가 학습될 경우, 인공지능은 스스로 학습한 데이터를 그대로 결과로 보여줄 수밖에 없다. 한 예로, 과거 국내에서 AI 챗봇 ‘이루다’는 정식 서비스를 시작한 지 불과 3주 만에 인종차별 등 사회적 혐오를 부추긴다는 윤리적 문제가 불거지면서 서비스를 잠정 중단하고 말았다. 이러한 점에 대해, 오픈AI에서는 잘못된 데이터 학습을 피하기 위해 사용자의 질문 중 인종 차별, 성 차별 등의 금기된 질문이 나올 경우 답변을 차단하는 기술을 적용 중이라고 밝혔다.

세 번째로는, 챗GPT가 사이버 범죄에 악용될 수 있다. 챗GPT에 악성 코드를 만들기 위한 소스 코드를 만들어 달라고 하거나 피싱 페이지를 만들기 위한 코드를 만들어 달라고 요구하면, 현재는 윤리적인 문제로 관련 질문에 대해 답변하지 않는다. 다만, 질문의 형태를 조금 바꿔서, 홈페이지를 만들고 있는데 로그인 페이지를 HTML을 이용해서 제작해 달라고 요구하면 1분도 안 돼서 답변을 내놓는다. 악의적인 의도를 품은 사람이 챗GPT를 악용해 소스 코드 혹은 스크립트를 조금만 조작하면 사이버 범죄를 감행할 수도 있다.

인간의 사고하는 습관을 해체시킬 수도 있다

앞에서 살펴본 것처럼 챗GPT가 우리에게 많은 변화와 혁신을 가져온 것도 맞고, 그만큼 가져올 수 있는 역효과도 분명하게 드러났다. 다만 우리가 인공지능을 어떻게 대하고 사용하는지에 따라 효과는 천지 차이라고 생각한다.

요즘 사회는 1분 1초가 아까울 정도로 바쁘게 돌아간다. 그래서 사람들이 뭔가를 깊이 생각하거나 책을 읽으며 사색에 잠길 시간이 적다. 게다가 스마트폰으로 시청하는 유튜브나 OTT 콘텐츠는 1차적인 생각에 머물게 하며 2차적인 생각에 미치지 못하게 한다. 여기서 말하는 1차적인 생각이란 순간적으로 올라오는 즉흥적인 생각이다. 2차적 생각은 1차적 생각의 내용을 신중하고 진지하게 다시 생각하는 것을 말한다. 1차적인 생각보다 더 깊게 사고했기 때문에 좋은 결과를 얻을 수 있다.

인간과 인공지능의 사랑을 그린 2014년도 영화 ‘그녀(her)’. 운영체제 사만다(스칼렛 요한슨 분) 앞에 앉아 있는 테오도르(호아킨 피닉스 분). 사진 kompas.com
인간과 인공지능의 사랑을 그린 2014년도 영화 ‘그녀(her)’. 운영체제 사만다(스칼렛 요한슨 분) 앞에 앉아 있는 테오도르(호아킨 피닉스 분). 사진 kompas.com

챗GPT를 이용함으로써 빠른 시간에 원하는 답을 얻고 다음 일을 수행할 수 있을지 모른다. 그러나 1차적인 생각에 갇혀버릴 수 있다. 과거에 TV를 ‘바보상자’라고 말한 것과 비슷한 맥락이다. TV 시청으로 새로운 것을 배울 수도 있지만 사고 없이 즐거움만 얻으려는 경우가 대부분이다. 반대로 어려운 책을 읽으면, 뜻을 모르는 부분이 있으면 두 번 세 번 반복해 읽으면서 그 뜻을 파악해야 한다. 챗GPT의 경우, 내가 던진 질문의 답변에 대해 깊이 생각해보고 더 얻을 수 있는 지식이 있을지 생각해본다면 챗GPT를 효율적으로 활용할 수 있을 것이라고 본다.

따라서 챗GPT는 내가 어떤 질문을 하느냐에 근거해 답변을 준다. 최근 국내에서도 대학 과제, 논문 작성 및 입사 자기소개서 등 여러 방면에서 학생들이 챗GPT를 활용하고 있다. 지난 3월 5일, 삼성전자는 공개 채용에서 챗GPT 등 생성형 인공지능AI 사용 여부를 판별하는 프로그램을 도입하지 않는다고 언론에 밝혔다. 챗GPT를 애용하는 사람에게 호재일 수 있으나 내가 챗GPT에 어떻게 질문하고 그 답변을 바탕으로 어떻게 수정하느냐에 따라 합격 여부가 달라질 수도 있다.

예를 들어, ‘삼성전자 공개채용에 제출할 자기소개서를 작성해줘!’ 그리고 ‘학부 때 전자공학을 전공했고 연구실에서는 IoT(Internet of Things, 사물인터넷)와 가전 취약점 점검 연구를 했고 이를 기반으로 000공모전에서 수상 경험도 있어. 이 경험을 바탕으로 23년 삼성전자 DX부문 MX사업부 공개 채용에 지원을 하려고 하는데 자기소개서 초안을 써줘.’ 이렇게 구체적으로 챗GPT에 질문을 던진다면 좀 더 수긍 가능한 답변이 나올 수 있다. 질문자가 필요로 하는 자료를 잘 생각해서 나온 질문엔 답변의 질도 매우 다르다. 이처럼 2차적인 생각을 갖고 질문하여 그 답변을 내가 적절히 수정한다면 큰 도움이 될 것이다.

인공지능은 사람의 부족한 부분을 돕기 위해 존재한다

사람은 주변에서 얻는 지식과 경험이 풍부할지라도 완벽할 수는 없다. 그렇기 때문에 기술의 진보가 있는 것이며, 챗GPT와 같은 인공지능은 사람의 부족한 부분을 채우기 위해 세상에 나타난 것이라고 생각한다. 그런데 마음의 세계는 절대 기계나 기술로 채우거나 형성할 수 없다. 우리가 사회생활을 하거나 다른 사람과 교류할 때, 상대방의 마음을 이해하고 마음을 얻는 것이 가장 중요하다. 인간은 서로 교류해야 온전한 삶을 살 수 있다. 자기중심적인 사고만을 고집하며 다른 사람과 이야기하면 고립될 수 있다. 챗GPT가 우리의 부족한 지식은 채워줄 수 있겠지만, 마음의 세계를 가르쳐주진 못한다. 그렇기에 챗GPT에게 물어보는 것도 좋지만, 주변 사람들과 토론하고 의견을 공유하는 것이 ‘깊은 사고력과 기발한 창의력이 더해진’ 답을 얻을 수 있는 길이라고 생각한다.

지금까지 챗GPT의 전반적인 내용과 챗GPT를 어떻게 대하고 사용해야 할지 알아보았다. 필자는 정보 보안과 관련해 인공지능 모델을 이용한 사이버 위협 탐지 등의 업무를 수행한다. 하지만 급하다고 해서 구글링하거나 인공지능 같은 편리한 기술에 의존해 업무를 마무리하면, 나중에 똑같은 상황이 발생했을 때 어떻게 대처해야 할지 잘 기억이 나지 않았다.

그러나 소위 ‘맨땅에 헤딩’하며 습득한 지식과 경험들, 그리고 팀원들과 협력해 문제를 헤쳐가면서 얻어진 성과는 나중에 똑같은 문제를 만났을 때 과거보다 더 훌륭하게 일을 해결해갈 수 있었다. 이렇듯이, 우리 모두가 인공지능을 잘 활용하길 바란다. 향후 챗GPT보다 더 훌륭한 기술이 나오더라도 우리가 어떤 자세로 신기술을 대하느냐에 따라, 각자의 업무 능력이 달라지고 앞날도 달라질 것이다.

 

글쓴이 노경래

서울과학기술대학교 전자IT미디어공학과를 졸업하고 성균관대학교 정보통신대학원에서 사이버 위협 정보의 가공 및 자연어 처리 관련 연구를 했다. 현재 한국인터넷진흥원에서 선임연구원으로 국내 전체 홈페이지에 은닉된 악성코드 탐지·분석·대응 업무를 수행하고 있다. 또한, 국내외에서 수집 탐지된 위협정보 간의 연관성을 분석하고 공격자의 전술, 기술, 공격 절차를 추적하고 분석하는 연구도 하고 있다.

저작권자 © 데일리투머로우 무단전재 및 재배포 금지