2019년 12월에 열린 XDF 차이나(XDF China)에서 알리바바(Alibaba)의 엔지니어인 지안송 장(Jiansong Zhang)은 AI 플랫폼 및 이기종 컴퓨팅에 대한 흥미로운 내용을 발표했다.
알리바바는 다양한 AI 작업부하를 구현하기 위해 자일링스의 IP 및 쉘, 런타임, 드라이버, 컴파일러 및 모델을 이용해 FPGA 상에 딥러닝 스택을 개발했다고 밝혔다.
이 솔루션은 다음과 같은 기능을 가지고 있다:
· 최적화된 맞춤형 하드웨어 디자인
o 온칩 스트리밍 구조
o 600MHz에서 DSP 캐리 체인과 수퍼타일 설계를 최대한 활용하는 3D-시스톨릭 배열(Systolic-Array) 변환 엔진
o 구성 가능한 병렬처리 구조
· 런타임을 이용한 리소스 할당 및 작업 스케쥴링
· 컴파일러에서 소프트웨어-하드웨어 공동 최적화
· ONNX 및 Tensorflow를 위한 모델 파서(Parser)
또한 지안송 장은 다음과 같은 4가지 주요 적용 사례를 통해 탁월한 결과를 입증했다고 밝혔다.
사례 1: 공용 클라우드 서비스의 OCR(Optical Character Recognition)
사례 2: 스마트 리테일을 위한 엣지 솔루션
사례 3: 사설 클라우드 서비스
CPU 서버를 교체함으로써 최대 7배의 TCO 비용절감 달성
사례 4: 음성 합성
음성 합성은 1초의 오디오를 생성하기 위해 16,000번의 반복이 필요한 작업이다. NN-기반 TTS(Text-to-Speech)는 사람의 음성과 구별하기 어려울 정도다. 알리바바는 TTS를 위한 최신 NN 모델인 실시간 WaveNet을 위해 자일링스 FPGA 기반 솔루션을 개발했다. 하드웨어 상에 구현된 짧은 지연시간의 맞춤형 자동회귀 IP와 컴파일러로 구현된 맞춤형 온칩 루프를 통해 알리바바는 GPU로 구현했던 것에 150배의 빠른 속도를 달성했다.
[자료제공: www.xilinx.com]