コンサルティングサービス
経営コラム
経済・政策レポート
会社情報

会社情報

ニュースリリース

2020年11月04日

各位

株式会社日本総合研究所


時系列データ予測における世界トップレベルの競技大会Kaggle「M5 Competition」で日本総研社員が4位入賞
~小売店舗の売り上げを正確に予測するAIモデルを構築~

 株式会社日本総合研究所(本社: 東京都品川区、代表取締役社長: 谷崎勝教、以下「日本総研」)の社員である森正和(先端技術ラボ所属)が、時系列データの予測分野における世界トップレベルの競技大会「M5 Competition」 (注1)で、4位に入賞し、金メダルを獲得しました。

 「M5 Competition」(2020年3~6月)は、今回初めてKaggle(注2)プラットフォーム上で開催され、100カ国を超える国々から8,229名という、過去5回の中で最大の参加者が集まりました。これは、Kaggleで行われた競技大会としても、過去4番目の規模(2020年10月時点)となるものです。
 森が参加した部門(M5 Forecasting - Uncertainty)の課題は、米ウォルマートの実際の10店舗における3,049種類の商品の過去の売り上げデータを基に、将来の売り上げの中央値と4つの信頼区間(50%, 67%, 95%, 99%)を求め、その正確性を競うものです。この課題では、売り上げだけではなく、商品性や外部要因によって生まれる確率的な変動の幅を信頼区間として予測し提示する必要があります。商品の多くは散発的に売り上げが発生するランダム性が強いものである上に、その売り上げは気象条件などの様々な外部要因によって大きく変動します。
 この課題に対して、森は、予測対象28日間の売り上げの確率分布を出力する2つのニューラルネットワークのAIモデルを構築したうえで、売り上げの曜日ごとの周期性を表現可能な独自の構造を加えることで、日別の売り上げ予測の正確性を向上させることに成功しました。
 森は、日本総研での企業や個人に対する与信業務のデータ分析で獲得した知見などを活かした様々な工夫によって、上記部門において参加909チーム中4位に入賞しました。また、森は、上記部門と同じデータを用いて売り上げそのものを予測する部門(M5 Forecasting - Accuracy)においても、銀メダル獲得(5,558チーム中75位)という好成績を同時に収めています。

 森が所属する先端技術ラボは、AIやデータサイエンス、ブロックチェーンなどITの先端技術分野を、できるだけ早期に業務に適用させるための企画・推進を目的として2017年に設立された、日本総研の研究組織です。専門機関や大学などアカデミアの先行研究をリサーチし、金融分野への応用が期待される技術を対象とした検証・評価などの活動を行っています。また、AIの中核技術である機械学習やデータ分析の能力向上と専門人材の育成を目的として、Kaggleのほか国際学会やカンファレンスなどに積極的に参加し、それらへの取り組み成果を基にした研究発表や情報発信にも取り組んでいます。
 なお、森が今回のKaggleで構築した解法やAIモデルは、機械学習・データ分析技術の一層の発展に貢献するため、すべてオープンソースソフトウェアライセンスの下、GitHub(注3)上で公開しています。

■表彰式について
 表彰式(M5 Virtual Awards Ceremony 2020)は、現地時間10月29日にオンライン上で行われました。(注4)


【コンペティションの概要】
・名称
 M5 Forecasting – Accuracy
  https://www.kaggle.com/c/m5-forecasting-accuracy
 M5 Forecasting – Uncertainty
  https://www.kaggle.com/c/m5-forecasting-uncertainty

・課題
 米3州(カリフォルニア州、テキサス州、ウィスコンシン州)に存在するウォルマート10店舗における、3,049種類の商品の売り上げ(販売数量)を予測し、その正確性を競う。売り上げそのものを予測するAccuracyと、売り上げの不確実性(確率分布)を予測するUncertaintyの2つの部門から構成される。Uncertainty部門では予測分布の中央値と4つの信頼区間(50%, 67%, 95%, 99%)を求め、独自の評価指標であるWSPL(Weighted Scaled Pinball Loss)によって評価された。

・分析データ
 参加者には、以下の3種のデータが与えられた。
 ①売り上げ(各店舗・各商品における過去5年間の日別販売数量)
 ②カレンダー(行事やスポーツなどのイベント開催日および補助的栄養支援プログラムが利用できる日)
 ③販売価格(店舗ごと・商品ごとの週単位)

・森の解法について
 直近28日間の売り上げ・カレンダー・販売価格および予測対象28日間のカレンダー・販売価格を入力データとして使用し、予測対象28日間の売り上げの確率分布(負の二項分布、または、スチューデントのT分布)を出力するニューラルネットワークのモデルを構築した。
 個別商品の時系列データに対しては、負の二項分布と呼ばれる確率分布を適用することで、散発的な売り上げに対処可能なAIモデルを構築した。一方、カテゴリー単位および全商品で集計した時系列データに対しては、スチューデントのT分布と呼ばれる確率分布を適用することで、外れ値にも対処できるAIモデルを構築した。
 さらに、曜日ごとに異なるFC層を用意することで、週単位で繰り返される売り上げの周期性を表現可能な構造を実現させた。


(注1)「M5 Competition」は、時系列分析による予測手法の研究機関としてキプロス共和国ニコシア大学マクリダキス教授が設立したMOFC(The Makridakis Open Forecasting Center)が主催する、時系列データの予測分野において世界トップレベルの競技大会。MOFCが主催する予測手法の競技大会である「M Competition」は過去4回開催されており、今回の「M5 Competition」はその5回目となる。
 https://mofc.unic.ac.cy/m5-competition/
(注2)Kaggle(カグル)は、米グーグルの子会社Kaggle(本社:米サンフランシスコ)が2010年から運営する、機械学習・データ分析競技大会のプラットフォーム。Kaggleには世界各国から10数万人にも上る優秀なデータサイエンティストが集まっており、機械学習・データ分析に関する様々な競技大会が開催されている。
 https://www.kaggle.com
(注3)https://github.com/marisakamozz/m5
(注4)M5 Virtual Awards Ceremony 2020の模様は、YouTubeに掲載されています。
 https://youtu.be/cQ_xPo9F9h4

以上

■本件に関するお問い合わせ先
 広報部 山口: 03-6833-5691

 
会社情報
社長メッセージ

会社概要

事業内容

日本総研グループ
ニュースリリース

国内拠点

海外拠点
環境への取り組み
ダイバーシティへの取り組み
メディア掲載・書籍
インターンシップ

会社情報に関する
お問い合わせ