인사이트

10배 더 빠른 DSP의 인프라 이점

2025년 9월 2일

저자 소개

투샤르 파텔은 아키(Aarki)의 엔지니어링 담당 수석 부사장으로, 메탈에서 모델에 이르기까지 DSP의 사고방식을 혁신하는 데 기여하고 있습니다. 30년간 엔지니어링 분야에서 리더십을 쌓아 온 투샤르는 SaaS, 엔터프라이즈, 광고 기술 분야에서 플랫폼을 구축하고 확장하며 4개 대륙에 걸쳐 350명 이상의 팀을 관리해 왔습니다. 그는 기업 회생, 인수, 그리고 심각한 조정이 필요한 기술 스택 등 모든 것을 경험했습니다.

클라우드 네이티브가 기본인 업계에서 Aarki는 의도적인 아웃라이어입니다. 전 세계에 걸쳐 있는 4개의 데이터 센터는 Google AdX, Unity, Fyber와 같은 주요 거래소와 물리적으로 인접해 있습니다. 초당 500만 건 이상의 입찰 요청과 최대 20ms의 빠른 응답 시간을 처리할 수 있도록 설계되었습니다. 이러한 처리량은 단순한 기술적 우위가 아닙니다. 이러한 우위 덕분에 Aarki DSP는 압박 속에서도 빠르고 정확하며 응답성이 뛰어납니다. 

지난 2년 동안 저희는 이를 전략적 우위로 발전시켜 왔습니다. 모델 학습, 추론, 광고 게재까지 모두 하나의 플랫폼에서 운영됩니다. 이러한 인프라 덕분에 DSP의 입찰 시간은 클라우드 기반 DSP보다 4~10배 더 빨라집니다.

실험 비용 제거

인프라를 소유함으로써 얻을 수 있는 즉각적인 이점 중 하나는 실험에 드는 한계 비용이 전혀 들지 않는다는 것입니다.

쿼리당 가격 책정 및 이탈 수수료에 제약을 받는 클라우드 호스팅 ML 및 분석 팀과 달리 당사 팀은 비용에 따른 마찰 없이 운영됩니다.

  • 입찰자 작업 부하: 높은 QPS에 대한 패널티는 없습니다. 당사의 인프라는 최대 처리량에 맞춰 프로비저닝되어 있습니다.
  • 모델 학습/추론: 학습 및 실시간 추론을 위해 전용 GPU를 활용합니다.
  • 데이터웨어하우스 쿼리: 분석가와 ML 엔지니어는 스캔한 테라바이트당 비용을 걱정하지 않고 자유롭게 쿼리를 실행할 수 있습니다.

그 결과, 실험 루프가 가속화되어 반복 횟수가 늘어나고, 통찰력이 깊어지며 학습 속도가 빨라집니다.

입찰 응답 시간은 수익 레버입니다

프로그래매틱 입찰은 근본적으로 경쟁이며, 지연 시간이 승리의 핵심입니다. 입찰 요청에 더 빨리 응답할수록 더 많은 노출을 확보할 수 있습니다. 저희는 이를 위해 특별히 인프라 스택을 설계했습니다.

  • 하드웨어 수준에서 최적화된 4개 데이터 센터 간의 저지연 백본입니다.
  • 중요 시스템(예: Aerospike, Kafka, 입찰자 서비스)의 배치 인식 라우팅.
  • 인터럽트 오버헤드와 네트워크 지터를 줄이기 위해 특별히 조정된 NIC 설정입니다.

당사의 평균 입찰 응답 시간은 클라우드 기반 DSP보다 4배에서 10배 빠릅니다. 응답 속도가 빠를수록 고객의 성공률과 ROI가 향상됩니다.

복잡성을 뚫고 인프라에 대한 숙련도를 높이다

스택을 소유한다는 것은 엔지니어가 복잡성을 추상화하지 않고, 오히려 복잡성과 직접 상호 작용한다는 것을 의미합니다.

새로운 서비스를 프로비저닝하는 것은 "클릭하고 바로 시작하는" 것이 아닙니다. 용량 계획, 배치 결정, 튜닝, 그리고 실제 IOPS 또는 초당 패킷 수 제한에 대한 이해가 필요합니다. 이를 통해 성능, 비용 상충 관계, 그리고 시스템 장애 발생 원리를 깊이 이해하는 더 나은 엔지니어를 확보할 수 있다고 믿습니다.

우리는 도전과제를 받아들이고 있습니다

단점도 있습니다.

  • 메모리, 디스크 또는 컴퓨팅 용량에 대한 리드 타임이 더 길어졌습니다. 여기에는 "확장" 버튼이 없습니다.
  • 숙련된 인프라 및 네트워크 엔지니어를 고용하여 베어메탈 수준에서 운영할 수 있는 것은 쉽지 않기 때문에 인재 제약이 있습니다.

하지만 이는 우리가 설계할 때 고려하는 알려진 제약이지, 방해 요소가 아닙니다.

클라우드 대 콜로케이션: 교조주의가 아닌 데이터

저희는 매년 이 전략을 재평가합니다. 클라우드는 지속적으로 발전하고 있으며, 다음 데이터 센터는 가상화될 가능성이 높습니다. 가상화가 실현되면 두 환경을 나란히 실행하여 비교해 보겠습니다.

  • 입찰 지연 시간: 시스템이 광고 거래소의 입찰 요청에 얼마나 빨리 응답할 수 있는지를 나타냅니다. 지연 시간이 짧을수록 더 많은 경매가 이루어지고, 낙찰률도 높아집니다.
  • ML 처리량: 전달 속도를 늦추지 않고 시스템에서 한 번에 얼마나 많은 모델 학습 및 추론을 처리할 수 있는가.
  • 쿼리 성능: 분석가와 ML 엔지니어가 비용이나 속도 병목 현상에 부딪히지 않고 얼마나 빠르고 자유롭게 데이터 쿼리를 실행하여 통찰력을 추출할 수 있는지.
  • $ 매출당 비용: 1달러의 매출을 창출하는 데 필요한 총 인프라 비용입니다. 1달러당 비용이 낮을수록 마진이 높아집니다.

그때까지는 우리의 현재 인프라가 계속해서 더 나은 성능을 보일 것입니다.

금속으로부터 이익을 얻는 것은 마케터입니다

인프라를 직접 소유하는 것은 결코 매력적인 일이 아닙니다. 확장하기도 어렵고, 인력을 채용하기도 어렵습니다. 하지만 퍼포먼스 마케팅이 밀리초 단위의 시간과 마진으로 귀결될 때, 우리는 차이를 만들어내는 변수들을 직접 소유하는 것이 중요하다고 믿습니다.

저희 인프라는 속도, 제어력, 그리고 자유라는 세 가지 핵심 이점을 제공합니다. 이를 통해 다른 업체의 클라우드 용량에 의존하지 않고도 빠르게 움직이고, 빠르게 훈련하고, 빠르게 대응할 수 있습니다. 이는 캠페인에서 더 높은 성공률, 더 낮은 CPI, 그리고 더 스마트한 최적화로 나타납니다.

초당 더 많은 입찰을 확보하는 동일한 인프라를 통해 매일 모델을 재학습시켜 지속적으로 학습하고 적응하며 이전 버전보다 더 뛰어난 성능을 발휘하도록 할 수 있습니다. 이 인프라는 GPU로 학습된 모델이 매일 업데이트되어 스택 내부에서 직접 실행되는 딥 러닝 파이프라인을 구동합니다.

실제로 후드 아래에서 실행되는 것은 완전히 재구축되었습니다. 훈련부터 입찰까지 모든 것을 구동하는 더 빠르고 스마트한 엔진입니다.

저희는 클라우드를 반대하는 것이 아닙니다. 업무에 가장 적합한 방식을 사용하는 것이 중요합니다. 현재로서는 베어 메탈이 여전히 저희에게 우위를 제공합니다. 그리고 데이터가 더 나은 결과를 보여줄 때까지는 베어 메탈을 계속 사용할 것입니다.

이 블로그에 대한 생각이 있으신가요? 좋은 아이디어를 놓치지 마세요. Tushar에게 이메일로 연락주세요. 투샤르파텔@aarki.com.

ko_KRKO