수요예측 모델 고도화의 현재와 미래
MEMBERS
2025-02-14
This is some text inside of a div block.

글로벌 공급망의 불확실성이 증가하면서 기업들의 수요예측 및 재고관리의 중요성이 그 어느 때보다 커지고 있습니다. 특히 제조업과 유통업계에서는 원자재 수급부터 완제품 재고관리까지, 전 과정에서 정확한 수요예측의 필요성이 날로 증가하고 있습니다.

하지만 전통적인 수요예측 방식은 과거 데이터에만 의존하는 한계를 보여왔습니다. 코로나19와 같은 예측 불가능한 상황이나 급격한 시장 변화에 대응하기 어렵다는 점이 대표적입니다.

더욱이 산업별, 기업별로 상이한 특성을 반영하지 못하는 획일화된 접근방식은 실질적인 비즈니스 가치 창출에 제약이 되어왔습니다.

임팩티브AI는 이러한 문제를 해결하기 위해 산업 특화된 AI 기반 수요예측 솔루션 '딥플로우’를 개발했습니다. 특히 주목할 만한 점은 단순한 수요예측을 넘어 기업별 맞춤형 인사이트를 제공하고, 예측 결과에 대한 설명 가능성을 높여 실무자들의 의사결정을 돕는다는 것입니다.

윤진섭 리서처는 임팩티브AI의 창립 멤버로서, 2년 6개월간 딥플로우의 핵심 기술 개발을 이끌어왔습니다. 시계열 데이터 증강 분야의 전문가인 그는 현재 AI 시스템의 예측 모델 개발과 데이터 전처리를 총괄하고 있습니다.

이번 인터뷰에서는 딥플로우의 기술적 특징과 차별점, 수요예측 분야의 최신 연구 동향, 그리고 AI 기반 수요예측의 미래에 대해 깊이 있게 다뤄보고자 합니다.

수요예측 솔루션, 딥플로우의 기술적 강점

딥플로우만의 특별한 기술적 강점은 무엇인가요?

딥플로우는 기존 기업들의 예측 방식과는 다른 두 가지 핵심적인 접근법을 가지고 있습니다.

첫째는 모델 측면입니다. 기존에는 단순히 과거 데이터를 기반으로 미래 판매량을 예측했다면, 저희는 데이터의 특성에 맞는 최적의 모델을 선별하고, 이를 통해 예측의 정확도를 높이고 있습니다.

두 번째는 데이터 측면입니다. 현재 약 2천 개의 외부 데이터 피처들을 활용하고 있는데, 이러한 피처들의 다양한 조합을 통해 최적의 예측 시나리오를 만들어냅니다.

예를 들어, 어떤 피처 조합에서는 모델 성능이 이렇게 나오고, 다른 조합에서는 또 다른 결과가 나오는데, 이런 모든 경우의 수를 자동으로 테스트하고 평가하여 최적의 조합을 찾아냅니다.

딥플로우가 다른 오픈소스 모델과 비교했을 때의 차별점은 무엇인가요?

수요예측 솔루션, 딥플로우의 기술적 강점

딥플로우는 일반적인 모델과는 달리 산업에 특화된 모델을 개발하고 있습니다.

예를 들어 철강 산업의 경우, 원자재 가격 추이, 판매 패턴, 입출고 데이터, 그리고 원자재 구매나 생산에 영향을 미치는 거시경제 지표 등 다양한 시장 데이터를 분석합니다. 이를 통해 철강 산업에 특화된 모델을 만드는 것이죠.

또한 고객의 피드백을 지속적으로 반영하여 모델을 발전시키고 있습니다. 고객사의 판매량이나 발주 시 영향을 주는 요인들, 재고 관리나 발주 프로세스상의 특징들을 데이터로 확보하여 모델에 반영합니다.

이를 통해 큰 변동성이 발생하는 상황에서도 효과적으로 대응할 수 있는 데이터 기반의 접근 방식을 구현하고 있죠.

파운데이션 모델을 기반으로 한 수요예측과 비교했을 때 딥플로우만의 장점은 무엇인가요?

파운데이션 모델을 평가할 때는 먼저 어떤 데이터로 성능을 입증했는지 살펴봐야 합니다. 대부분 날씨 데이터, 거시경제 데이터, 전력 수요량 데이터 등을 사용하는데, 이는 기업의 실제 판매량 데이터와는 큰 차이가 있습니다.

특히 B2B 데이터의 경우, 계약을 통해 판매가 이루어지고 발주사의 패턴에 따라 판매량이 결정되기 때문에, 일반적인 시계열 특성을 거의 띠지 않습니다.

어떤 날은 2천 개가 판매되다가 갑자기 8천 개가 판매되기도 하고, 때로는 전혀 팔리지 않는 날도 있죠. 이런 불규칙한 패턴에는 일반적인 파운데이션 모델이 적절하지 않습니다.

B2C 데이터의 경우에도 프로모션의 영향을 많이 받아 급격한 증감이 발생하는데, 이는 기업마다, 프로모션의 성격마다 다른 패턴을 보입니다. 이런 특성을 고려하여 저희는 산업군별로 특화된 파운데이션 모델을 개발하는 방향으로 연구를 진행하고 있습니다.

수요예측 선도자, 딥플로우의 고도화

현재 진행 중인 연구 프로젝트들은 어떤 것들이 있나요?

수요예측 선도자, 딥플로우의 고도화

크게 네 가지 방향으로 연구를 진행하고 있습니다. 첫 번째는 데이터 패턴 자동 분석 시스템입니다. 데이터의 트렌드, 계절성, 변동성, 판매의 간헐성 등을 자동으로 진단하고, 각 패턴에 최적화된 모델을 매칭하는 기술을 개발하고 있습니다.

현재는 모델 성능이 떨어질 때 알람이 발생하고 재학습하는 방식을 사용하고 있는데, 앞으로는 데이터 패턴과 최적 모델 간의 자동 매칭 시스템을 구축하여 품목별 최적 모델을 더욱 효율적으로 선정하려고 합니다.

두 번째는 리스크 예측과 시뮬레이션 모델링입니다. 예를 들어 환율 급등이나 대외 신인도 하락과 같은 상황에서 기업에 미치는 영향을 예측하고, 이에 따른 적정 재고 수준을 제안하는 등 내외부적 리스크에 대응하는 의사결정 지원 모듈을 개발하고 있습니다.

또한 기존의 양적인 접근 방식에서 벗어나 문제 중심의 접근을 시도하고 있습니다.

예를 들어, 소요량 패턴이 품목마다 매우 다양한데, 한 달 주기로 꾸준히 판매되는 품목이 있는가 하면, 2-3달에 걸쳐 간헐적으로 판매되는 품목도 있습니다. 이런 각각의 패턴에 가장 적합한 모델이 무엇일지 연구하고 있죠.

이외에도 신제품처럼 데이터가 부족한 경우에 대한 예측 방법도 연구하고 있습니다. 이처럼 문제의 특성에 따라 최적화된 접근 방식을 개발하는 것이 현재 저희의 주요 연구 방향입니다.

데이터 전처리 방식은 어떻게 발전시켜 나가고 계신가요?

데이터 전처리는 크게 다섯 가지 측면에서 접근하고 있습니다.

첫째는 누락된 값들을 처리하는 정책, 둘째는 이상치 처리 방법, 셋째는 피처 가공 방식입니다. 예를 들어 판매량 데이터의 경우, 이전 시점의 판매량이나 평균값들이 중요한 변수가 될 수 있습니다.

또한 거시경제 지표들도 단순히 원본 데이터를 사용하는 것이 아니라, 적절한 가공 과정을 거칩니다. 환율의 경우, 각 시점별 변동폭을 입력 변수로 활용하는 식이죠.

타겟 변수에 대한 적절한 변형도 중요합니다. 변동성이 너무 큰 경우 모델이 이를 잘 식별하지 못하는 문제가 있어서, 정규화나 표준화 같은 처리 과정을 거치고 있습니다.

데이터 증강에 대한 연구도 진행 중이라고 들었습니다.

제 박사 논문이 데이터 증강기였는데, 시계열 데이터의 특성을 고려한 증강 방법을 연구했습니다. 단순히 데이터를 늘리는 것이 아니라, 시간적 종속성을 잘 포착할 수 있도록 설계하는 것이 중요합니다.

특히 데이터 패턴이 불안정하거나 데이터양이 적을 때, 이를 해결하기 위한 방법으로 데이터 증강과 딥러닝 모델을 결합한 예측 프레임워크를 개발했습니다.

이런 기술을 바탕으로 저희는 딥테크 팁스에도 선정되었고, 현재도 시계열 데이터의 특성에 맞는 증강 모델을 지속적으로 연구하고 있습니다.

시계열 예측의 미래 방향성에 대해 어떻게 전망하시나요?

현재 저는 트랜스포머 모델의 고도화 방향에 주목하고 있습니다.

시계열 예측 분야는 다른 AI 도메인보다 새로운 기술 적용이 다소 늦은 편인데, 예를 들어 트랜스포머 모델도 등장 후 2-3년이 지나서야 시계열 모델에 적용되기 시작했죠.

특히 저희는 장단기 예측을 동시에 고도화하는 방향으로 연구를 진행하고 있습니다. 장기 예측에 특화된 아키텍처와 단기 예측에 특화된 아키텍처를 하이브리드로 결합하는 방식입니다.

이를 통해 수요 예측에서 발생하는 단기적 불확실성과 장기적 패턴을 모두 효과적으로 포착하고자 합니다.

설명 가능한 AI를 향한 도전

설명 가능한 AI를 구축하게 된 배경은 무엇인가요?

설명 가능한 AI를 향한 도전

딥플로우는 단순히 예측값만 제공하는 것이 아니라, 그 결과가 도출된 과정과 근거를 함께 제시하는 것을 목표로 하고 있습니다.

기존에는 예측값과 모델 성능 중심으로 접근했다면, 이제는 실제로 이 외부 지표가 해당 회사나 산업에 얼마나 영향을 미치는지를 시계열적 특성으로 분해해서 평가하고 있죠.

예를 들어, 환율 변동이 있을 때 이 변동이 실제 산업에 얼마간의 시차를 두고 영향을 미치는지 분석합니다. 이를 통해 실제 산업에 유의미한 영향을 주는 변수들을 필터링하고, 이 변수들을 기반으로 다시 피처 조합을 평가하여 모델을 만듭니다.

이렇게 하면 해석 가능성도 높이고 모델의 성능도 향상시킬 수 있습니다.

해석 가능성을 높이기 위한 주요 연구 방향은 무엇인가요?

크게 두 가지 방향으로 접근하고 있습니다. 첫째는 모델이 예측을 도출하는 과정에 대한 해석이고, 둘째는 실제 판매량에 인과적 영향을 미치는 요인들을 파악하는 것입니다.

작년에는 모델의 예측 과정을 설명하는 기능을 개발했는데, 올해는 인과적 영향력이 있는 피처들을 식별하는 연구에 집중하고 있습니다.

인과 발견 방법론을 활용해 변수들 간의 인과관계를 파악하고, 이를 토대로 예측 변수를 선택하는 구조를 만들고 있죠. 이를 통해 모델의 설명 가능성과 예측 정확도를 동시에 개선하고자 합니다.

설명 가능한 AI가 실제 비즈니스에 어떤 가치를 제공하나요?

기업들이 수요 예측을 하는 근본적인 이유는 불확실성을 줄이기 위해서입니다. 이러한 관점에서 저희는 단순히 예측값을 제공하는 것을 넘어서, 다양한 리스크 요인을 예측하고 시뮬레이션할 수 있는 모델링을 구현하고 있습니다.

예를 들어, 환율이 급등하거나 대외 신인도가 하락하는 상황에서 우리 회사에 어떤 영향이 미칠지 시나리오를 만들어볼 수 있습니다.

또한 원자재 공급망이 불안정해질 경우, 적정 재고를 어떻게 유지해야 할지에 대한 제안도 가능합니다. 이처럼 내외부적 리스크 요인에 따른 의사결정 지원이 가능한 것이 설명 가능한 AI의 핵심 가치라고 할 수 있습니다.

해석 가능성을 높이는 과정에서 겪은 어려움은 무엇인가요?

AI 기술로 서비스를 만들다 보니 기술적 내용을 추상화하여 설명하는 것이 가장 큰 과제였습니다. 예를 들어, 피처 선택 방법 중 SHAP value나 Feature Importance와 같은 방법론을 사용할 때, 이러한 방법들이 어떻게 다르고 산출물이 어떤 의미를 갖는지 설명하는 것이 쉽지 않았죠.

이를 해결하기 위해 저희는 실제 사례를 중심으로 설명하는 방식을 채택했습니다. 특정 산업이나 기업의 실제 데이터를 통해 모델의 예측 과정과 결과를 단계별로 보여주면서, 비전문가도 이해할 수 있는 수준으로 설명하려 노력하고 있습니다.

협업과 조직 문화

임팩티브AI의 조직 문화는 어떤가요?

저희는 굉장히 자유로운 분위기에서 일하고 있습니다. 의사소통도 주로 슬랙을 통해 자유롭게 이루어지고 있죠. 조직은 크게 기획팀, 프로덕트팀, 개발팀으로 구성되어 있는데, 각 팀이 유기적으로 협력하면서 프로젝트를 진행합니다.

특히 저희 회사의 시니어 레벨 분들 중에는 학계 출신 전문가도 포함되어 있습니다. 홍참길 이사님(CSO)은 피츠버그대 전산학과를 나오셔서 신경망 모델을 연구하셨고, 최혜봉 이사님(CDO)도 데이터 사이언스 분야에서 연구하고 계십니다. 

탄탄한 학문적 배경을 가진 리더십 덕분에 연구 중심의 문화가 자연스럽게 형성되어 있습니다.

팀 간 협업은 어떤 방식으로 이루어지나요?

새로운 AI 모듈을 개발할 때는 정해진 프로세스가 있습니다.

먼저 리서치팀에서 검증을 진행하고, 그 결과를 바탕으로 개발팀에서 규격을 정의합니다. 정의된 규격에 따라 플로우가 만들어지면 실험 포털에서 검증을 거친 후, 최종적으로 모듈이 탑재되는 방식이죠.

또한 기획팀에서 정의한 KPI나 사용자 경험 관련 요구사항들도 중요하게 고려됩니다. 유저들이 더 심리스하게 서비스를 이용할 수 있도록 하기 위해 여러 팀이 함께 고민하고 있습니다.

이 과정에서 엄청난 커뮤니케이션이 필요한데, 다행히 팀원들 모두가 AI에 대한 지식을 충분히 갖추고 있어 원활한 소통이 가능합니다.

지식 공유는 어떤 방식으로 이루어지나요?

'수요 미식회'라는 사내 기술 세션을 정기적으로 진행하고 있습니다. 여기서는 각자가 연구하고 있는 내용들을 공유합니다. 예를 들어 제가 시계열 데이터 증강에 대해 연구하고 있다면, 어떤 목적으로 이 연구를 하고 있고, 어떤 문제를 해결할 수 있으며, 앞으로의 계획은 무엇인지 공유하죠.

매년 초에는 각자 모델링 연구 계획을 세우고 이를 공유하는 시간도 가집니다. 여기서 나온 연구 결과들은 상황에 따라 특허 출원을 하거나 해외 저널, 컨퍼런스에 제출하기도 합니다. 이런 방식으로 연구 결과를 공유하고 발전시켜 나가고 있습니다.

개발자, 기획자 간의 의견 충돌은 없나요?

리서처는 기획과 개발의 중간 다리 역할을 한다고 볼 수 있습니다. 예를 들어 작년에 해석 가능성 기능을 개발할 때, 처음에는 없던 기능이었는데 이를 추가하는 과정에서 제가 연구를 진행했고, 기획팀에서는 결과물이 어떤 의미를 가지는지 규격화하고 정리해주었습니다.

그 다음 저희가 사용하는 방법론에서 나오는 결과물이 이 규격과 잘 매핑되는지 검증하고, 실제 화면에 구현해보면서 사용자가 직관적으로 이해할 수 있는지 테스트했죠.

이렇게 실험 포털에서 검증하고, 실제 데이터로 테스트한 후, 고객 피드백을 받아 기획팀과 함께 고도화 방향을 논의하는 식으로 협업이 이루어집니다.

AI 리서처를 꿈꾸는 후배들에게 해주고 싶은 조언이 있다면?

수요 예측이나 재고 관리 분야의 리서처가 되고자 한다면, 무엇보다 문제 정의 능력이 중요합니다. 같은 수요 예측이라도 산업과 기업마다 해결하고자 하는 실질적인 문제가 다를 수 있기 때문입니다.

이를 위해서는 세 가지 역량이 필요합니다.

첫째, 알고리즘과 모델의 원리를 이해하고 이를 실제 문제에 맞게 구현할 수 있는 기술적 역량, 둘째, 산업과 기업의 수요에 영향을 미치는 요인들을 파악하고 설계할 수 있는 분석적 역량, 마지막으로 이러한 문제를 해결하는데 대한 적극성과 흥미입니다.

이 세 가지를 균형있게 발전시킨다면 좋은 AI 리서처가 될 수 있을 것입니다.