Unified Context-Intent Embeddings for Scalable Text-to-SQL
Your Analysts Already Wrote the Perfect Prompt Authors: Keqiang Li, Bin Yang In our previous blog post , we shared how Pinterest built Text-to...

요약
Your Analysts Already Wrote the Perfect Prompt Authors: Keqiang Li, Bin Yang In our previous blog post , we shared how Pinterest built Text-to...
Unified Context-Intent Embeddings for Scalable Text-to-SQL
원문: Unified Context-Intent Embeddings for Scalable Text-to-SQL (Pinterest Engineering, 2026-03-06)
오늘의 결론
"내가 오늘 해결하고 싶은 문제는 데이터 분석 질문에 대한 신속하고 정확한 SQL 생성을 보장하는 방법"이며, "Pinterest의 접근 방식에서 배운 바와 같이, 통합된 컨텍스트-의도 임베딩을 활용함으로써 분석 의도를 명확히 이해하고 유용한 SQL을 생성할 수 있다"는 것이다.
이 글이 "성능 자랑"이 아닌 이유
이 글은 단순히 기술의 성능을 자랑하는 것이 아니라, 데이터 기반 의사결정의 복잡성을 해결하기 위한 접근 방식을 제시하고 있다.
내가 본 것:
- [의도 인식]: Pinterest는 단순한 키워드 매칭을 넘어서, 분석가의 질문이 지닌 비즈니스 의도를 이해하는 시스템을 구축했다. 이는 단순히 테이블 이름이 비슷하다고 해서 관련된 테이블을 제공하는 것이 아닌, 질문이 담고 있는 깊은 의미를 파악하는 데 중점을 두었다.
- [데이터 거버넌스]: 대량의 데이터 테이블을 관리하고 정리하는 과정에서, Pinterest는 데이터 거버넌스라는 체계를 마련해 신뢰할 수 있는 테이블을 우선적으로 노출할 수 있는 기반을 마련했다. 이는 올바른 데이터 활용을 위한 필수적인 요소로 작용한다.
- [사전 지식 활용]: Pinterest는 과거의 분석 쿼리를 활용해 지식 베이스를 구축하고, 이를 통해 새로운 질문에 대한 답변을 제공하는 구조를 만들었다. 이는 단순히 새로운 데이터를 분석하는 것이 아니라, 과거의 경험을 바탕으로 문제를 해결하는 데 집중하는 방식이다.
내가 가져갈 실행 포인트 3개
(1) [의도 기반 쿼리 생성]: [비즈니스 질문의 이해]
Pinterest는 각 SQL 쿼리를 의미 있는 자연어 설명으로 변환하고, 이를 통해 비즈니스 질문의 의도를 파악한다. 이는 기존 SQL 쿼리를 재사용할 수 있는 기회를 제공한다. 내 경험상, 비즈니스 질문의 정확한 해석 없이는 효과적인 데이터 분석이 불가능하므로, 이를 위한 체계적인 접근이 중요하다.
(2) [거버넌스 체계 구축]: [신뢰할 수 있는 데이터 소스 확보]
Pinterest는 데이터 거버넌스를 통해 수많은 테이블을 정리하고, 이를 통해 사용자가 신뢰할 수 있는 데이터 소스를 확보하였다. 이 과정에서 신뢰성 있는 테이블을 우선적으로 노출하는 체계는 사용자로 하여금 더 나은 의사결정을 내리도록 지원한다. 나 역시 이를 통해 데이터 관리의 중요성을 다시 한번 인식하게 되었다.
(3) [지속적인 학습 시스템]: [지속적인 데이터 활용]
Pinterest는 과거 분석 쿼리를 통해 새로운 분석 패턴을 학습하고 이를 적용하는 시스템을 구축하였다. 이는 매번 새롭게 시작하는 것이 아닌, 축적된 경험을 바탕으로 효율을 높이는 데 기여한다. 나의 팀에서도 이를 적용하여 지속적으로 데이터 활용 능력을 향상시켜야 한다는 교훈을 얻었다.
내가 설계할 기준
이 기술/접근법을 사용하기 좋은 일
- 복잡한 데이터 분석 질문에 대한 신속한 SQL 생성
- 다양한 소스의 데이터를 통합적으로 관리할 필요가 있는 경우
- 과거 데이터를 기반으로 한 의사결정 지원 시스템 구축
이 기술/접근법이 맞지 않는 경우
- 데이터 사용 목적이나 요구 사항이 명확히 정의되지 않을 때
- 비즈니스 의도가 분명하지 않은 질문이 자주 발생할 경우
실패를 줄이는 운영 체크리스트
- 쿼리 의도가 명확하지 않은 질문을 피하라.
- 신뢰할 수 없는 데이터 소스를 사용하지 말라.
- 과거 쿼리의 패턴을 무시하지 말라.
- 데이터 문서화 작업을 소홀히 하지 말라.
- 가이드라인 없이는 SQL 쿼리를 임의로 작성하지 말라.
이번 주에 할 1가지
- 대상: 팀 내 데이터 분석 질문에 대한 SQL 생성을 위한 프로세스 검토
- 측정: 분석 질문에 대한 SQL 생성 속도와 정확도 측정
- 성공 기준: 1주일 내에 SQL 생성 시간 단축이 확인되면 "됐다"고 볼 것
마무리
Pinterest의 사례에서 배운 핵심은, 데이터 분석에 있어 단순한 도구의 사용을 넘어, 의도와 의미를 명확히 이해하고 활용하는 것이 중요하다는 점이다. 이러한 접근 방식을 통해 Timeware가 고객들에게 실질적인 문제 해결을 제공할 수 있기를 바란다.
FAQ
Q. 왜 이 접근 방식이 데이터 분석에서 중요한가요?
이 접근 방식은 비즈니스 질문의 깊은 이해를 통해 의미 있는 분석 결과를 도출할 수 있기 때문에 중요합니다.
Q. 실무 적용 시 가장 많이 막히는 부분은 무엇인가요?
정확한 비즈니스 의도를 파악하는 것이 가장 큰 도전 과제가 될 수 있습니다. 이를 위해서는 지속적인 커뮤니케이션이 필요합니다.
Q. Timeware는 이것을 어떻게 활용하나요?
Timeware는 데이터 분석 요청 시 이 접근 방식을 통해 보다 신속하고 정확하게 SQL을 생성하고 있습니다.
Q. 이 흐름은 앞으로 어떻게 전개될까요?
앞으로 AI와 머신러닝의 발전으로 인해 데이터 분석의 자동화와 효율성이 더욱 높아질 것으로 기대하고 있습니다.