에어비앤비의 옵저버빌리티 내재화: 대규모 마이그레이션 전략

에어비앤비(Airbnb)가 최근 발표한 기술 블로그를 읽으면서 깊은 공감을 느꼈습니다. 14년 넘게 자바와 코틀린 기반의 백엔드 시스템을 운영하며 가장 골머리를 앓았던 지점이 바로 옵저버빌리티(Observability)였기 때문입니다. 처음에는 간단히 외부 벤더사의 솔루션을 도입해 해결하려 하지만, 서비스 규모가 커지면 결국 비용과 데이터 파편화라는 거대한 벽에 부딪히게 됩니다. 에어비앤비는 이 문제를 해결하기 위해 뱅가드(Vanguard)라는 자체 플랫폼을 구축하며 주도권을 되찾아왔습니다. 왜 에어비앤비는 잘 쓰던 외부 솔루션을 버렸을까? 대부분의 스타트업이나 중견 기업은 데이터독(Datadog)이나 뉴렐릭(New Relic) 같은 서비스형 소프트웨어(SaaS) 솔루션으로 옵저버빌리티를 시작합니다. 저 역시 과거 여러 프로젝트에서 이런 도구들을 적극적으로 활용했습니다. 설치가 쉽고 UI가 미려하며 초기에는 관리 부담이 거의 없기 때문입니다. 하지만 에어비앤비가 지적했듯, 기업이 성숙해질수록 벤더사의 비즈니스 모델과 기업의 기술적 요구사항은 서로 다른 방향으로 흐르기 마련입니다. ...

March 19, 2026 · 4 min · 749 words · gnosyslambda

여행지 추천 시스템 설계: 개인화 모델과 탐색 알고리즘 구현

에어비앤비(Airbnb)가 목적지를 정하지 못한 탐색형 사용자를 위해 머신러닝 기반의 여행지 추천 시스템을 어떻게 구축하고 최적화했는지 그 과정과 실무적 통찰을 공유합니다. 한 줄 요약 — 구체적인 계획 없이 여행을 탐색하는 사용자의 모호한 의도를 파악하여, 개인화된 여행지 후보를 제안하고 예약 전환율을 높이는 추천 모델링 전략입니다. 이 주제를 꺼낸 이유 대부분의 커머스나 예약 플랫폼은 사용자가 무엇을 원하는지 명확히 알고 있다는 가정하에 검색 결과를 보여줍니다. 파리에 가고 싶은 사람에게 파리의 숙소를 보여주는 것은 기술적으로 명확한 문제입니다. 하지만 현실에서 많은 사용자는 “어디로든 떠나고 싶다” 혹은 “유럽 어딘가로 가고 싶다"와 같은 막연한 상태로 탐색을 시작합니다. ...

March 18, 2026 · 4 min · 713 words · gnosyslambda

MCP(Model Context Protocol) 생태계 구축 및 핀터레스트 적용 사례 정리

한 줄 요약 — 핀터레스트는 모델 컨텍스트 프로토콜(MCP)을 활용해 파편화된 AI 도구 생태계를 표준화하고, 단순 질의응답을 넘어 엔지니어링 업무를 자동화하는 에이전트 인프라를 구축했다. 이 주제를 꺼낸 이유 대규모 언어 모델(LLM)을 사내 데이터나 도구와 연결하려는 시도는 많지만, 매번 새로운 모델이 나올 때마다 혹은 새로운 내부 API를 붙일 때마다 개별적인 연동 코드를 짜는 것은 매우 비효율적입니다. 핀터레스트(Pinterest)가 선택한 모델 컨텍스트 프로토콜(Model Context Protocol, MCP)은 이러한 병목을 해결할 수 있는 강력한 대안으로 떠오르고 있습니다. ...

March 17, 2026 · 4 min · 757 words · gnosyslambda

Text-to-SQL 성능 최적화: 통합 임베딩과 RAG 기반 구현 가이드

데이터 웨어하우스에 수만 개의 테이블이 쌓여 있는 환경에서 사용자의 질문을 정확한 SQL로 변환하는 작업은 단순히 LLM 성능에만 의존할 수 없는 고난도 과제입니다. 핀터레스트(Pinterest)는 10만 개가 넘는 분석 테이블과 수천 명의 사용자가 공존하는 복잡한 데이터 생태계에서 텍스트 투 SQL(Text-to-SQL)의 한계를 극복하기 위해 통합 컨텍스트-의도 임베딩(Unified Context-Intent Embeddings) 기술을 도입했습니다. 한 줄 요약 — 핀터레스트는 대규모 데이터 환경에서 정확한 SQL 생성을 위해 사용자의 질문 의도와 테이블의 구조적 문맥을 하나의 벡터 공간에 매핑하여 검색 정확도를 극대화했습니다. ...

March 14, 2026 · 5 min · 919 words · gnosyslambda
Cover image

스포티파이 2025 Wrapped: 하이라이트 생성 기술 분석

TL;DR — 스포티파이(Spotify)는 2025년 ‘Wrapped’를 통해 3억 5천만 명의 사용자에게 개인화된 음악 여정 이야기를 제공하기 위해 14억 개의 LLM 리포트를 생성했습니다. 대규모 데이터 파이프라인과 모델 증류(Distillation), 그리고 동시성 문제를 해결한 정교한 스토리지 설계를 통해 전 세계 동시 출시라는 극단적인 트래픽 요구사항을 성공적으로 해결했습니다. 배경과 문제 정의 매년 전 세계 수억 명의 리스너에게 제공되는 ‘Wrapped’는 스포티파이의 가장 상징적인 캠페인입니다. 2025년에는 단순한 통계 수치를 넘어, 사용자의 청취 기록 속에 숨겨진 특별한 순간들을 하나의 이야기로 들려주는 ‘Wrapped Archive’ 기능을 기획했습니다. ...

March 13, 2026 · 4 min · 818 words · gnosyslambda