초거대 AI는 글로벌 경쟁력 확보를 위한 핵심 기술 | 슈퍼컴, 빅데이터, 인재확보가 관건 인간의 뇌처럼 똑똑한 기계를 만드는 도전과제는 인류의 꿈이 다. 전 세계에서 인공지능(AI : Artificial Intelligence) 분야에 국 가적인 투자와 기업의 개발 경쟁, 과학자와 공학도의 연구와 노력이 집중되고 있다. AI는 4차 산업혁명의 꽃이다. AI 개발은 규모와 속도의 전쟁에 돌입했다. 첨단기술 경쟁력을 확보하지 못하고 대열에서 낙오하는 국가와 기업은 미래가 밝지 않다. 기계도 반복적 경험과 연습을 통해 지식을 습득한다. AI는 머 신러닝(Machine Learing)을 기반으로 구축된다. 머신러닝은 학습할 수 있는 지능적 기계를 만드는 것이다. 머신러닝 기 술의 발달로 보고 듣고 말할 수 있는 컴퓨터가 개발됐다. 컴 퓨터는 인간이 입력한 정보를 바탕으로 세상을 학습하고 이 해하며 평가한다. 지능형 기기는 데이터에서 패턴과 이상점 을 스스로 찾아내 학습할 수 있는 영리한 단계에 도달했다. 머신러닝은 한 차원 높은 딥러닝(Deep Learning)으로 발전 했다. 딥러닝은 뇌가 어떻게 복잡한 정보를 처리하고 일반화 하는지 이해하는 것이며, 뇌 신경망에서 영감을 받았다. 뉴 런(신경세포)을 연결하는 시냅스(신경접합부)에서 일어나는 현상에서부터 인간 의식과 행동에 대한 이해에 도달하는 것 이 연구 과제다. 사람이 어떻게 의식하고 기억하며, 주의를 기울이고 계획하고 상상하며 추리하는가, 그리고 다른 사람 과 교류하며 정보를 교환하는가에 대해 시뮬레이션하고 테 스트를 통해 알아내려는 노력이 요구된다. 기계가 텍스트로 된 정보를 학습하고 이해하며 추론할 수 있 더라도 출력된 정보를 인간의 말과 똑같이 전달하지 못하면 KCCI BRIEF vol. 152 2021. 11. 1. 1 아무 소용이 없다. 사람의 언어에 담긴 정보를 정확히 해석 하고 데이터로 변환해 알고리즘에 입력하는 일도 마찬가지 다. 자연어처리(NLP : Natural Language Processing)는 이용 자와의 자유로운 대화를 통해 이용자 의도를 컴퓨터가 파악 하고 정확한 정보를 다양한 형태의 데이터로 변환하는 데 활 용된다. 머신러닝에서 딥러닝으로 기술이 진보하면서 언어 모델 기능도 향상됐다. 자료 : SAS 다양한 비즈니스에서 AI 기능을 활용하는 사례 초거대 AI 개발 동향과 과제 홍기영 매일경제신문 월간국장/경제학박사 외부 필진 칼럼은 대한상의 견해와 다를 수 있습니다. 자연어 대화 사람이 직접 리포트를 작성하지 않고 소프트웨 어 애플리케이션이 매출액 예측 리포트를 생성 자연어 생성 대량으로 수집된 문서에서 분석된 모든 정보를 요약 정리 음성-텍스트 변환 고객 콜센터 음성 메시지를 텍스트로 변환하여 감정을 파악하고 추가 분석을 수행 이미지 인식 CT 스캔상의 결절을 인식하여 악성 및 양성 여 부 판별 패턴 인식 고객 금융 거래의 추이 또는 특성을 분석하고 고객 계좌의 소비 데이터에서 이상점을 탐지하 여 잠재적 부정행위 파악 예측 데이터의 장단기적 변동성을 파악하여 에너지 소비 예측의 정확도를 향상 분류 동물 이미지를 검사, 추적한 후 생물종 유형을 분류하여 야생동몰 보호활동 지원 인지 검색 유사 상품을 구매한 다른 고객과 매칭하여 온라 인 쇼핑 고객이 관심을 가질 만한 상품을 추천 이제 기계가 시각, 청각, 촉각, 후각 등 감각 센서를 활용해 정보를 처리한다. 특히 텍스트 및 음성을 통한 인간과의 상 호작용에 의해 학습하고 통찰력 있는 솔루션을 표현한다. 속 어와 풍자, 구어 표현 등 미묘한 언어 차이까지 분석해 인간 의 감정과 의도, 의미를 포착할 수 있게 되면서 자연어이해 (NLU : Natural Language Understanding)가 구현됐다. 딥러 닝과 NLU는 별도로 또는 함께 사용되는 AI 기술의 핵심이 다. 컴퓨터가 전문성 있는 '만능 비서' 자격을 갖추는 것이다. 컴퓨터 비전과 로봇 공학이 결합돼 학습되지 않은 상태에 서도 맥락과 인과관계를 이해하는 기초언어학습(Grounded Language Learning)으로 자연어이해 성능은 더욱 개선된다. 금융 제조/에너지 보건/생명과학 통신 정부 신용위험 분석 부정행위 적발 자동금융 자문 예측 진단 생체의학 영상처리 보건 모니터 공급망 최적화 불량제품 추출 에너지 예측 대화형 챗봇 맥락기반 마케팅 네트워크 분석 스마트 시티 센서 융합 안면 인식 초거대 AI 성능과 특징 인간처럼 생각하고 자연스럽게 대화하는 로봇의 역량은 초 거대(Hyperscale) AI에 의해 구현된다. 초거대 AI는 대용량 연 산이 가능한 컴퓨팅 인프라스트럭처를 기반으로 대규모 데 이터를 스스로 학습하는 기술이다. 더욱 정확한 알고리즘으 로 대규모 모델을 실행하며, 자율적인 판단까지 가능하다. 막대한 양의 데이터를 분석하여 읽고 듣고 관찰하며 고지능 인사이트를 창출하는 초거대 AI는 기존 AI보다 더 빠르게 더 적은 자원 투입으로 이전에는 상상하지 못한 일까지 처리한 다. 그래서 초거대 AI는 기술 판도를 바꾸고 경제사회 전반에 혁신을 가져올 '꿈의 AI'라는 평가를 받는다. 초거대 AI가 갖 춰야 할 요건은 초고성능 컴퓨팅, 복합 인공지능, 자율지능 공존기술 등 세가지다. 첫째, 초고성능 컴퓨팅은 대용량 연 산이 가능한 슈퍼컴퓨터(혹은 양자컴퓨터) 인프라스트럭처 에 기반한 대규모 데이터를 신속히 처리하는 능력을 뒷받침 한다. 둘째, 복합 인공지능은 자율적 사고·학습·판단·행 동이 가능한 인간 뇌 구조를 닮은 초고성능 AI 역량을 뜻한 다. 셋째, 자율지능 공존 기술은 고객 응대·콘텐츠 창작· 첨단소재 발굴 등 고차원적이며 다방면에서 활용이 가능한 창의적인 기술을 의미한다. 이처럼 초거대 AI는 다양한 문제를 척척 해결해내는 만물박 사다. 초거대 AI는 성능을 가늠하는 파라미터(매개변수)가 1 조 개에 달할 수 있다. 기존 AI보다 수백, 수천 배 이상 많은 규모다. 파라미터는 뇌에서 뉴런 간 정보 전달 통로 역할을 하는 시냅스와 비슷한 기능을 한다. 파라미터 규모가 커서 지능이 높은 초거대 AI는 기존 AI와는 다르게 특정 역할에만 국한되지 않고 스스로 생각하고 학습하며 판단한다. 더욱이 초거대 AI는 자연어 모델의 순차적 학습에서 병렬처 리(트랜스포머)의 등장으로 패러다임 전환을 맞았다. 트랜스 포머는 이미지 처리(컴퓨터 비전) 분야에서도 성능 개선에 활용된다. 또한 자기지도학습을 통한 AI 모델은 데이터 라벨 링에 의존하는 지도학습의 한계를 극복하고 원시 데이터로 모델을 스스로 학습함으로써 비용 절감과 시간 단축 측면에 서 획기적인 성과 개선을 이뤘다. 상용화 단계 진입한 초거대 AI 기술 초거대 AI 시장을 선점하기 위한 기업 간 경쟁이 치열하다. 초거대 AI는 기업들이 글로벌 경쟁력을 갖추기 위해 반드시 KCCI BRIEF 2 자료 : SAS AI의 분야별 활용 기회 확보해야 하는 핵심 기술로 꼽힌다. 글로벌 빅테크 기업들은 이미 초거대 AI 서비스 상용화에 나섰다. 기업들이 초거대 AI 에 주목하는 이유는 개발, 운영 과정에서 다양한 신기술과 혁신 서비스가 탄생할 수 있기 때문이다. 2020년 6월 미국 ‘오픈A’가 언어모델 ‘GPT-3(Generative Pre-Training 3)’를 공개하면서 세계적으로 초거대 AI 개발 경쟁이 본격화되었다. 오픈AI는 일론 머스크 테슬라 최고 경영자(CEO) 등이 주도해 설립한 AI 연구기관이다. GPT-3 는 1750억 개의 파라미터를 갖췄다. 파라미터가 15억 개였 던 GPT-2보다 117배나 많다. GPT-3는 소설·에세이를 쓰거 나 장문의 글을 요약하는 능력이 탁월하며 일상 언어를 번역 해서 애플리케이션 개발에 필요한 코딩까지 해준다. GPT-3 기반 AI는 서류 요약, 외국어 번역, 보고서 작성, 이메일 작성 등 사람 수준의 작업이 가능하다. 오픈AI는 지난 1월 GPT-3 를 활용해 일상 언어를 입력하면 이미지를 생성하는 기술을 내놨다. GPT-3 기반 AI 애플리케이션은 이미 300개를 넘는 것으로 알려졌다. 오픈AI는 2030년경 파라미터가 100조 개 에 달하는 GPT-4를 선보일 계획이다. 구글은 2021년 2월 파라미터 수가 최대 1조 6,000억 개에 달 하는 초거대 AI ‘스위치 트랜스포머’를 공개했으며 컴퓨팅 계 산 비용을 늘리지 않고도 성능을 향상시킨 혁신적인 모델 설 계구조를 적용했다. 아울러 중국 정부의 지원을 받고 있는 베이징 지위안 인공지능연구원(BAAI)은 2021년 6월 파라미 터 수가 1조 7,500억 개에 달하는 ‘우다오 2.0’을 선보였다. 우다오 2.0은 중국 전통 문체로 한시를 창작하고, 이미지 생