원활한 AI 모델 구현, 클라우드플레어 마이크로소프트와 협력

IT | 원활한 AI 모델 구현, 클라우드플레어 마이크로소프트와 협력

권경욱 기자 IT 0 0 2023.10.05 11:17

커넥티비티 클라우드 기업인 클라우드플레어(Cloudflare)가 마이크로소프트(Microsoft)와 협력을 통해 기업이 AI를 더 쉽게 실행할 수 있도록 지원한다고 밝혔다.

AI 추론 작업이 점점 더 분산되고 있는 가운데, 클라우드플레어는 이번 협력을 통해 기업들이 디바이스, 네트워크 엣지, 클라우드 환경을 아우르는 컴퓨팅 연속체 전반에 걸쳐 AI 모델을 원활하게 배포하여 중앙 집중식 및 분산 컴퓨팅 모델의 이점을 극대화할 수 있도록 지원한다.

또한 양사는 오닉스 런타임(ONNX Runtime)을 활용함으로써, 초대형 클라우드에서 초분산 네트워크 엣지, 장치 자체에 이르기까지 이 세 단계 아키텍처 중 처리가 가장 적합한 곳에서 AI 모델을 실행하여 특정 애플리케이션이나 서비스의 대역폭, 지연 시간, 커넥티비티, 처리, 배터리/에너지, 데이터 주권 및 현지화 요구 사항을 가장 잘 해결할 수 있도록 보장한다는 계획이다.

AI 모델 학습을 위해서는 서로 근접해 있는 컴퓨팅 및 스토리지 리소스가 요구된다. 따라서 중앙 집중식 클라우드 플랫폼은 모델 학습에 필요한 집중적인 계산을 위한 최적의 환경을 제공한다. 트레이닝은 계속 중앙 집중화되는 반면, 추론 작업은 더 분산된 위치, 특히 디바이스 자체와 엣지 네트워크에서 수행된다. 예를 들어, 일부 추론 작업(예: 보행자를 발견한 자율 주행 차량이 제동)은 지연 시간을 최소화하기 위해 물리적 디바이스에서 실행되는 반면에 컴퓨팅, 스토리지, 배터리 전원과 같은 디바이스의 한계를 극복하기 위해 점점 더 많은 작업을 엣지 네트워크에서 실행해야 한다. 엔드 유저 및 디바이스와 지리적으로 가까운 엣지 네트워크는 컴퓨팅 리소스, 속도, 데이터 프라이버시 간의 최적의 균형을 제공해 준다. 일부 애플리케이션은 엔드 유저에게 최상의 경험을 제공하기 위해 디바이스, 엣지 네트워크, 클라우드 환경이 함께 작동하여 컴퓨팅 연속체의 세 가지 단계를 통과해야 할 수도 있다.

매튜 프린스(Matthew Prince) 클라우드플레어 CEO 겸 공동 창업자는 “클라우드플레어와 마이크로소프트는 모든 조직의 정확한 요구와 필요에 맞춰 AI 추론을 구현하기 위해 AI 트래픽과 작업이 이동할 철로를 구축하고자 한다"며 "속도 또는 정확성이 요구되는 상황이나, 에너지 혹은 연결 대역폭 문제를 해결해야 하는 상황뿐만 아니라 지역 로컬라이제이션 요구 사항을 준수하고자 하는 기업들에게 AI 작업에 가장 적합한 위치를 찾을 수 있도록 지원할 계획이다”고 말했다.

래쉬미 미스라(Rashmi Misra) 마이크로소프트 데이터, AI 및 신흥 기술 담당 제네럴 매니저는 "기업들이 각자의 필요에 따라 고유한 방식으로 생성형 AI의 성능을 활용할 수 있는 최선의 방법을 모색하는 오늘날, 장소에 구애받지 않고 AI 모델을 실행할 수 있는 역량이 매우 중요해졌다”며 “클라우드플레어의 글로벌 네트워크, 그리고 마이크로소프트가 애저(Azure) 클라우드를 통해 선도적인 AI 워크로드를 훈련하고 배포한 경험을 활용함으로써 기업들이 AI 추론을 위한 탁월한 유연성과 성능을 갖추게 될 것으로 기대한다”고 말했다.

클라우드플레어와 마이크로소프트는 기업이 워크로드에 가장 적합한 장소에서 AI를 손쉽게 실행할 수 있도록 협력할 계획이다. 이러한 목표를 구현하는 두 가지 요소는 다음과 같다.

마이크로소프트의 오닉스 런타임은 장치(윈도우, 모바일 또는 브라우저 내), 분산 네트워크 엣지(클라우드플레어), 애저의 중앙 집중식 클라우드 플랫폼 등 모든 환경에서 동일한 모델을 배포할 수 있는 표준화된 솔루션을 생성한다.

클라우드플레어는 커넥티비티, 지연, 규정 준수 또는 기타 요건에 따라 다양한 환경에서 트래픽을 라우팅할 인프라를 제공할 수 있다.

기업은 직면해 있는 성능, 비용 및 규제 요건에 따라 장치, 엣지 네트워크 및 클라우드의 연속체 전반에 걸쳐 추론 작업을 진행하기를 원한다. 마이크로소프트의 AI 역량과 초대형 클라우드 인프라를 클라우드플레어의 초분산 엣지 네트워크와 결합한다면 AI의 전체 수명 주기에 걸쳐 혁신과 효율성을 향상할 수 있다. 이로써 기업은 다음과 같은 역량을 갖출 수 있다.

AI 작업 별 최적의 위치 파악: 목표를 달성하기 위해 처리가 가장 적합한 곳에 AI 추론을 배포하도록 선택함으로써 중앙 집중식 컴퓨팅 모델과 분산 컴퓨팅 모델 모두의 이점을 극대화할 수 있다. 예를 들어, 보안 카메라 시스템은 엣지 네트워크를 활용해 사물 감지를 수행할 수 있다. 이로써 데이터를 중앙 서버로 보내 처리할 때 발생하는 지연이 사라지며, 장치 자체의 리소스 제약을 극복할 수 있다.

변화하는 요구사항에 대응: 세 위치 모두에서 모델을 실행하고 가용성, 사용 사례 및 대기 시간 요구 사항에 맞춰 조정 또는 교체가 가능하다.

단 몇 번의 클릭만으로 클라우드플레어에서 배포: 마이크로소프트 애저 머신러닝(Machine Learning)을 통해 워커스 AI(Workers AI)에서 쉽게 배포 가능한 모델 및 ML 도구 기능을 활용할 수 있다.

위 내용에 대한 보다 자세한 정보는 다음 자료를 통해 확인할 수 있다.

워커스 AI(Workers AI) 액세스 등록하기

블로그: 워커스 AI: Cloudflare 네트워크의 GPU에서 실행되는 추론 클라우드

블로그: 지역 내 최고의 위치: 추론을 위한 기반

이 밖에 클라우드플레어로 풀 스택 AI 애플리케이션을 구축하는 방법은 AI.cloudflare.com에서 확인할 수 있다.