지난 5월 미국 네바다에서는 특이한 운전면허가 발급되어 화제를 모았다. 발급 대상이 여타 운전면허와는 달리 사람이 아닌 스스로 운전할 수 있는 무인자동차(Driverless car), 즉 일종의 기계 장치이기 때문이다.
구글이 도요타 프리우스에 각종 센서와 비디오 카메라, 레이더, 인공지능 소프트웨어 등을 탑재하여 개발한 이 무인자동차는 전 세계에서 공식적으로 운전면허를 취득한 첫 차량이다.
작년 출시된 아이폰 4S의 음성 지원 소프트웨어 시리(Siri)의 경우 ‘한 시간 뒤에 깨워줘(Wake me up in one hour)’라고 말하면 휴대폰 알람 기능이 자동 설정될 정도로 영특하다.
이러한 성과에 인공지능 기반 음성지원 소프트웨어에 대한 시장의 관심이 높아지고 있다. 이에 LG경제연구원의 성낙환 선임연구원은 특히 인공지능의 기계학습, 에이전트, 자연어처리, 패턴인식 분야는 수 년 내로 크게 확산될 분야로서 주목할 필요가 있다고 분석했다.
인공지능의 주요 기술
인공지능이 컴퓨터 공학은 물론 수학, 철학, 심리학, 언어학, 생물학, 로봇 등 다방면에 걸쳐 있는 만큼 다양한 인공지능 기술이 개발되어 사용되어 왔다. 그 중 대표적인 세 분야를 살펴보면 다음과 같다.
먼저 발견적 방법(Heuristic method)이다. 정형화되거나 명확한 절차가 없는 문제를 풀 때 사람들은 어떻게 하는가? 어림잡아(Rule of thumb) 다수의 시행착오(Trial and error)를 통해 해결하는 것이 일반적이다.
인공지능도 마찬가지이다. 정확한 논리와 알고리즘으로 모든 경우의 수를 고려하여 완벽한 해를 구하기보다는 탐색 기준을 세워 일정 시간 내에 찾을 수 있는 최적의 해를 구하는 것이 보통의 방법이다.
체스를 예로 들어보자. 전체 체스 말의 움직임을 모두 가정한 경우의 수는 10120개로 우주에 존재하는 전체 원자 개수 1075개보다도 많다. 아무리 컴퓨터 기술이 발전했다 하더라도 인공지능이 모든 경우의 수를 일일이 계산하는 것은 불가능하다.
따라서 전체 체스 판세가 상대방으로 넘어가 그 뒤의 수를 생각하는 것이 불필요한 경우를 차례로 제외하면서 적정 범위 내에 최적의 수를 구하는 것이 지능적인 해결책이라고 할 수 있다.
두 번째로 전문가 시스템(Expert system)을 구축하는 것이다. 사람들이 논리를 세워 문제를 스스로 해결하는 것보다 더 빠르고 정확한 방법은 그 문제를 잘 아는 전문가에게 가서 답을 구하는 것이다.
이와 똑같이 인공지능에서도 알고리즘을 만들어 문제를 해결하기 보다는, 인간 전문가의 지식을 컴퓨터에 입력하여 데이터 시스템을 구축한 다음 다양한 추론 엔진이나 데이터 마이닝 기술을 통해 활용하는 것이 효율적일 수 있다.
대표적으로 1970년대 개발된 의료진단 전문가 시스템 MYCIN을 들 수 있다. MYCIN은 입력된 기존 전문의들의 지식을 활용하여 질병을 진단하고 처방전을 내릴 뿐 아니라 그 추론 과정을 설명할 수도 있다.
물론 인간의 지식을 컴퓨터가 이해할 수 있게 정형화된 형태로 가공해야 하고 제한된 전문 지식 이외에 일반 범용 지식으로 확장하는 것에 한계가 있지만, 활용이 쉽고 실행 결과가 좋은 만큼 의료, 법률, 경영 등 많은 분야에 사용되고 있다.
세 번째로 인공 신경망(Artificial Neural Network)을 들 수 있다. 인공지능을 만들기 위해서 알고리즘을 짜거나 수많은 정보들을 컴퓨터에 저장할 수도 있지만, 가장 직관적인 방법은 사람의 뇌를 그대로 모방하여 만드는 것이다.
인간 두뇌는 1,000억 개의 뉴런(Neuron)으로 구성되어 있는데, 각 뉴런은 외부 자극을 받아 전기 신호를 발생시키고 이를 다른 세포에 전달하는 기능을 한다. 이러한 뉴런의 작동 방식을 모방하여 하나의 디지털 신경세포를 만들고 이것들을 네트워크로 묶어 인공지능을 구축하는 것이다.
인공 신경망은 인간의 뇌를 모방하는 만큼 뇌의 구조와 지능 활동에 대한 연구가 수반되어야 한다. 하지만 인간의 뇌는 아직 우주만큼 파악하지 못한 부분이 많고 복잡하기 때문에 인간의 두뇌를 그대로 복사한 완전한 인공지능을 구축하기 위해서는 가야 할 길이 멀다.
비록 걸음마 단계이지만 인공 신경망은 음성, 화상인식 같이 불규칙하고 다양한 패턴인식 분야에 강점을 보이고 있어 활용 분야가 늘어나고 있다.
인공지능의 최근 관심분야
인공지능이 빠르게 발전하고 있지만 공상과학 속 모습이 바로 실현되어 인간의 모든 일을 인공지능이 대신하리라 생각하는 사람은 드물 것이다. 똑똑한 기계들이 만능은 아니기 때문이다. 믿음, 신념, 사랑, 직관과 같이 기계가 쉽게 인간을 따라 하기 힘든 영역은 아직도 많다.
예를 들어 MYCIN 같은 의료 전문가 시스템이 발전하여 아무리 더 쉽고 빠르게 진단을 받는다 하더라도 환자와 의사 사이의 신뢰, 긍정적 마음가짐, 삶에 대한 의지 등은 얻기 힘들 것이다.
또 인간과 비슷한 수준의 지능을 지닌 로봇이나 프로그램이 바로 수년 내로 등장하여 인간의 자리를 금방 위협한다고 보기도 어렵다. 영화 터미네이터의 ‘스카이넷’이나 아이로봇의 ‘비키’처럼 자의식을 지니고 우리보다 더 똑똑한 기계들이 창조주인 사람을 해칠 수 있다는 생각은 아직 헛된 망상에 불과하다.
실제로 인공지능 기술 발전에 매우 낙관적인 미래학자 레이 커즈와일(Ray Kurzweil) 조차도 2020년은 되어야 인간의 추론 능력에 근접한 인공지능이 등장할 것이라고 주장하고 있다.
또 기술 예측 기관인 Techcast에서도 2025년이 되어야 인간의 반복적인 정신 노동의 약 30%정도를 인공지능이 대체할 것으로 예상하고 있는 상황이다. 이처럼 인공지능 연구자들도 인공지능이 인간지능을 단기간에 뛰어 넘기란 어렵다는 사실을 인정하고 있다.
하지만 인공지능을 아직은 먼 미래라고 미리 고민할 필요가 없다고 단정 짓지는 말아야 한다. 현재 시험 중인 구글의 무인자동차가 대중화된다고 한번 상상해보자. 출퇴근 시간 동안 차 안에서 책을 보거나 커피를 마시는 등 탑승자의 삶은 한결 여유로워질 터이고 교통사고 및 체증은 확 줄어들게 될 것이다.
한편 운전기사들은 설 자리가 줄어들면서 직업을 바꿔야 할지도 모른다. 이처럼 비록 각 기술 별로 상용화 시기가 다르고 아직 인간지능 수준에 도달하려면 멀었지만, 인공지능이 우리의 삶뿐 아니라 기업 및 사회에 미치는 영향력을 간과해선 안 된다.
특히 최근 기계학습, 에이전트 분야의 발전으로 인공지능의 사고 능력뿐 아니라 정보를 수집 및 행동하는 능력까지 빠르게 향상되면서, 자연어 처리와 패턴 인식을 탑재한 똑똑한 기계들이 우리의 삶에 미치는 영향력이 더욱 커지는 상황이다.
1. 기계학습(Machine Learning)
기계에게 모든 경우의 수나 규칙을 일일이 입력하기 어렵다면 스스로 학습하고 개선해나가도록 하는 것이 인공지능 개발의 핵심이 될 수 있다. 최근 기계가 알아서 지식을 축적, 수정 및 보완하는 기계학습 연구가 활발한 이유이다.
지도학습(Supervised learning), 준지도학습(Semi-supervised learning), 강화학습(Reinforcement learning) 등을 사용하여 기계에게 문제를 내주고 그것에 대한 해답 또는 보상 결과물(디지털 신호)을 주어 기계가 스스로 지식을 습득하게 만드는 것이다.
기계학습은 전문가 시스템, 자연어 처리, 패턴인식 등 인공지능 전반에 모두 연관되어 시너지를 낼 수 있다. 전문가 시스템을 예로 들어보자. 전문가의 지식을 컴퓨터에 입력하여 DB화하는 작업은 매우 번거롭고 손이 많이 가는 작업이다.
게다가 시스템을 유지하기 위해선 계속 수정 및 보완 작업이 필요하다. 하지만 기계학습을 이용하면 전문가 시스템이 새로운 지식에 마주하게 될 때 기존 DB를 수정 및 보완함으로써 시스템을 지속적으로 개선하기 때문에 질문에 대한 답의 정확도를 높을 수 있다.
MS의 CEO인 스티브 발머가 클라우드, 플랫폼, 폼 팩터, UI 등과 함께 디바이스가 방대한 사용자 데이터를 활용하여 사용자의 의도를 스스로 파악할 수 있는 기계학습을 IT업계 미래 화두로 선정하였듯이 기계학습은 빅데이터 시대에 더욱 빛을 볼 것이다.
수많은 데이터가 온라인상에 존재하는 오늘날 모든 정보를 기계에게 일일이 가르치는 것은 불가능하기 때문이다. 실제로 인간 지능에 관련된 거의 모든 정보를 DB화하고 추론엔진을 통해 인공지능을 개발하려는 사이크(CYC) 프로젝트의 효과성에 의문을 다는 사람도 존재하는 상황이다.
이와는 반대로 카네기 멜론 대학에서는 기계학습을 이용하여 인터넷에서 관련 웹사이트를 분석하면서 인간의 도움 없이도 단어의 뜻을 스스로 학습할 수 있는 Never-Ending Language Learning (NELL)을 2010년 발표하였는데, 정확도가 약 90%에 가까웠다.
2. 에이전트(Agent)
특정 목적을 위해 독립적으로 작업을 수행하는 자율 프로세스인 에이전트의 발전도인공지능 확산의 큰 축이다. 에이전트는 프로그램에 따른 사용자별 환경 설정, 사이트 자동 검색 및 인증, 사물 인식과 같은 일종의 작은 자동화 프로세스로 생각할 수 있다.
하지만 문제 해결 시스템으로서 외부 정부를 수집하고 그 변화에 자율적으로 유연하게 대응할 수 있기 때문에 약한 인공지능에 포함된다.
인간과 비슷한 수준에서 여러 지능적 행동 들을 모두 처리할 수 있는 이상적인 형태의 인공지능을 개발하기 쉽지 않은 상황에서 개별 에이전트들이 협력(Cooperation), 조정(Coordination), 타협(Negotiation) 등의 상호작용을 통해 네트워크로 묶이고 보다 큰 작업을 수행하는 일종의 분산 인공지능(DAI, Distributed Artificial Intelligence)을 구축할 수 있다.
즉 에이전트들은 각각이 독립적으로 행동할 수 있을 뿐만 아니라, 분산 인공지능의 말단에 위치해 정보를 수집하고 직접 행동을 하는 역할을 하는 것이다. 따라서 다수의 에이전트 정보가 실시간으로 서버에 저장되어 활용할 수 있는 클라우드 환경에서 큰 힘을 발휘할 수 있다.
한편 휴대폰의 센서 탑재 확산도 에이전트 발전에 큰 도움이 되고 있다. 휴대폰에 MEMS 이외 다양한 센서가 탑재되면서 수집할 수 있는 정보가 빠르게 늘어났을 뿐만 아니라 휴대폰의 에이전트화도 가능하기 때문이다. 실제로 최근에는 각 휴대폰을 에이전트로 하는 모바일 에이전트에 대한 연구가 진행 중에 있다.
인터넷에 존재하는 무수한 에이전트들이 향후 하나로 묶여 거대한 ‘글로벌 인공지능’을 생성하면 사람들은 시간과 장소에 상관없이 스마트 서비스를 받을 수 있게 될 것이다. 또 개별 에이전트들의 조합으로 생길 다양한 지능화 시스템은 새로운 서비스 개발의 촉매가 될 전망이다.
개미처럼 각각의 능력은 미약하지만 군집을 통해 큰 힘을 발휘하는 것이다. 구글의 CEO인 래리 페이지가 ‘인터넷을 거대한 인공 지능으로 만드는 것이 구글의 목표’라고 밝힌 것도 이와 비슷한 맥락이라고 볼 수 있다.
3. 자연어처리(Natural Language Processing)
사람들이 일상적으로 쓰는 말을 컴퓨터가 이해하고 답할 수 있는 자연어 처리가 기계학습에 힘입어 빠르게 성장하고 있다. 일견 간단해 보이지만 C, Java 같이 컴퓨터의 언어는 사람의 언어와 다르기 때문에 기계가 사람의 말을 이해하기 위해서는 별도 작업이 필요하다.
초기에는 노암 촘스키(Noam Chomsky)와 같은 언어학자들을 중심으로 기본 유한 구문의 여러 변형을 통한 자연어처리 연구가 중심을 이루었다. 하지만 사람들이 사용하는 구어는 어순이나 문법에 어긋나는 경우가 많고, 사전에 없는 사투리, 신조어, ‘Art’(기술, 예술) 같은 중의어, 앞의 어떤 내용을 가리키는 대명사 ‘This’ 같이 정확히 파악하기 힘든 단어도 많다.
따라서 최근에는 의미 중심의 시멘틱 검색 같은 추론 기술과 대량의 말뭉치인 코퍼스(Corpus)를 이용한 방법의 연구가 활발하다. 사람이 언어를 습득할 때 최대한 많이 읽고 써야 하듯이, 인공지능도 실제 사람들이 사용하는 수많은 말과 글을 통계적으로 분석하고 그 의미가 무엇인지 파악하는 학습과정을 거치는 것이다. 따라서 대량의 비정형의 데이터를 저장하고 텍스트 마이닝을 통해 유용한 정보를 추출, 가공할 수 있는 빅데이터 기술의 등장은 자연어처리 기술 발전의 원동력이 되고 있다.
과거에 비해 자연어처리가 훨씬 매끄러워진 것은 사실이지만 아직 완벽하게 사람과 화제를 바꿔가며 자연스럽게 의사소통할 정도는 아니다. 튜링 테스트를 완벽히 통과하여 뢰브너 상의 최고 상금을 받아 간 사람도 아직 나타나지 않았을 뿐 아니라, 애플 시리의 기능도 허위 과대광고에 해당 된다며 올해 초 미국에서 소송을 당하기도 하였다.
모든 사람들에게서 완전히 인정을 받지는 못하는 것이다. 하지만 시간이 좀 걸릴 뿐 더 많은 음성, 문장 데이터가 쌓이고 이를 기계가 충분히 학습하게 되면 머지않아 인간과 자연스러운 대화가 가능하리라는 것이 전문가들의 예상이다. 실제로 Techcast에서는 인간과 컴퓨터 간의 의사소통이 가능한 Intelligent Interface가 2019년경 본격적으로 확산될 것으로 전망하고 있다.
4. 패턴인식(Pattern Recognition)
사람의 음성이나, 문자, 얼굴 등 다양한 정보를 기존에 축적된 데이터를 바탕으로 판단하는 패턴인식 연구도 활발하다. 스팸을 차단하기 위해 사람임을 확인하는 CAPTCHA라는 인증시스템에서 보듯 단순히 글자를 읽는 일도 기계에겐 버거운 작업이다.
실제로 다른 사람을 인식할 때 병렬 시스템인 인간의 두뇌는 눈이나 코의 모양, 목소리 억양 및 톤 등 다양한 정보를 종합하여 판단하나, 폰 노이만식의 순차적 연산을 하는 기계는 외부 데이터에서 특징을 뽑아내 유형화 한 다음 기존 데이터와 통계적으로 또는 구조적으로 비교하여 인식하기 때문에 프로세스가 복잡하다. 이외에 학습이 가능한 인공 신경망을 이용하는 등 패턴인식의 정확도와 효율성을 높이기 위한 연구가 활발히 진행 중에 있다.
그런데 최근 빅데이터를 활용한 기계학습은 패턴인식의 정확도 제고에 큰 도움이 되고 있다. 무인자동차를 예로 들어보자. 카메라와 센서를 통해 끝없이 들어오는 도로 상황 정보를 처리하기 위해서는 우선 자동차 밖의 물체가 무엇인지 파악하는 는 것이 중요하다.
차량인지 보행자인지 또는 가로수인지 구별할 수 있어야 멈추거나 방향을 바꾸는 등의 명령을 내릴 수 있기 때문이다. 이 때 보다 정확한 인식을 위해서는 많은 자료를 통한 학습 과정이 필요한데, 구글의 무인자동차는 20만 마일 이상의 테스트 기간 동안 쌓은 많은 도로 주행 데이터를 활용하여 스스로 학습하면서 외부 사물에 대한 인식의 정확도를 높일 수 있었다.
센서 기술의 발달과 빅데이터에 힘입어 점점 더 빠르고 정확해 지고 있는 패턴인식은 이제 기존의 음성, 문자, 안면, 동작을 넘어 다양한 분야로 확대되는 상황이다. 최근 MIT 미디어랩이 개발한 얼굴 표정을 분석하여 사람의 기분을 알아맞히는 프로그램과 같이 사람의 감정, 온라인 행동 패턴, 멀티미디어 파일, 생채 인식 등 적용범위가 빠르게 늘어나고 있다. 이러한 패턴인식의 발전은 기계들이 사람과 세상을 이해하고 활용하는 데 큰 도움이 될 전망이다.
LG경제연구원 www.lgeri.com
아이씨엔 매거진 2012년 08월호