オピニオン
【社会・環境インフラにおける政策・事業革新】
上下水道事業におけるデータサイエンスの活用に必要な視点
2023年03月27日 中嶌泰介
1. AIブームとデータサイエンス活用の広まり
ディープラーニングの実用化に端を発する第三次AIブームは今や産業界に広く浸透し、データサイエンスはさまざまな用途に活用されるようになった。小売業では顧客の購買履歴や行動データを分析して、顧客のニーズや嗜好を把握することで需要予測や販売戦略の改善を行っている。エネルギー業界では、気象データやイベントデータなどを分析して、需要・供給を高精度に予測しエネルギーマネジメントの最適化を実現する取り組みが行われている。
上下水道事業においても、データサイエンスを活用した取り組みが始まっている。厚生労働省等が進めるIoT活用推進モデル事業を利用して、兵庫県朝来市では管路情報や環境ビッグデータのAI解析により管路1本ごとの劣化状況を可視化し、管路の予防保全に役立てる取り組みを行っている。また福岡県福岡市では、ポンプに取り付けたIoT振動センサーから取得した振動データを解析し、故障検知や設備劣化状況の分析に役立てている。
ここで、注目されているデータサイエンスと、データ分析は何が違うのだろうか。上下水道事業の視点で言えば、相関分析など古典的な統計的手法によるデータ分析と、ディープラーニングに代表される近年のデータサイエンス手法の大きな違いは、ビッグデータと呼ばれる大量のデータを扱い、「機械学習」と言われるより高度な手法によりデータを分析することで、現場に対してより具体的な行動を促すことができるようになった点にある。「データサイエンス活用」とは、データの高度な分析から実際の行動変化までを含む一連のプロセスであると言える。
2. 上下水道事業へのデータサイエンス活用に向けた課題
しかしながら上下水道事業の現場におけるデータサイエンス活用の試みは、敬遠されたり、取り組みが行われたとしても実証事業にとどまり、実際の事業の具体的改善につながらないケースも多いのが現状である。その理由は以下の3点に集約されると考えている。
①適切な目的の設定が困難であること
データサイエンスの活用において、適切な目的の設定は実は難しい課題である。適切な目的を設定するためには、生じている課題は具体的にどういうものであるか、その改善に向けて取り得る行動の選択肢は何か、どのような分析結果があれば適切な行動を促せるのか、という視点で課題を要素分解した上で解決方法を検討する必要がある。例えばアセットマネジメントの場合、単に「アセットマネジメントの高度化」を目的としていては具体的なデータ活用の道筋は見えてこない。「機器が故障により稼働しなくなる前に予防保全を行う更新計画を立案したい」など具体的な目標を見据え、そのためには「劣化度が一定以上になる前に更新を促す」システムが必要であり、そのためには「機器の劣化度をセンサーデータから分析する手法が必要」となるように、課題をデータ分析の問題に帰着させる一定のステップを踏んだ上で目的を設定する必要がある。
適切な目的設定の難しさについて、データサイエンティストから実務者への注意喚起として、よく「AIを使えば何でもできる訳ではないことを理解することが重要である」と言われることがある。しかし、逆にAIを使えば何ができるのか、という問いに答えることもまた難しいのが事実である。課題を要素分解してデータ分析による解決方法に落とし込むには、データサイエンスに対する肌感覚も必要であり、事業の側から適切な目的設定を行うには一定のハードルがある。
②適切な分析手法の選択肢を持っていないこと
データサイエンスを使いこなすには、その方法論に関する一定の理解も必要である。近年の複雑化されたデータ分析技術では、入力データの種類も定量・定性データや画像データ、音声データなどさまざまな形式が考えられる上に、分析手法は一変数データの統計量分析や時系列分析、多変数データの決定木分析(※1)や、近年脚光を浴びるニューラルネットワークを用いた判別分析等、挙げればきりがない。これらのデータや分析手法ごとの得意分野や留意点を体系だって把握していなければ、そもそもデータサイエンス手法を用いて課題を解決するという発想になりづらいのではないだろうか。それは、例えるなら「包丁」「鍋」「コンロ」など調理器具についての知識がない状態で材料だけを渡され、料理を作れと言われているようなものである。
③分析結果を適切な政策立案や事業計画につなげづらいこと
データ分析の結果に基づいて実際の政策立案を行ったり事業計画を策定したりする際には、必ず現実とモデルの差異に伴うトラブルが発生する。例えば物価の高騰により、データに基づいて立案した計画の実行経費が想定より増大し、予算をオーバーしてしまう場合などである。このような場合、データ分析により生み出された付加価値を損なわないことに留意しながら、現実的な行動の意思決定をしていく必要がある。これには、データ分析結果が示す本質的な示唆をすくい上げて現実に可能な範囲内でこれを実現させるよう工夫したり、現実的な制約の範囲を明確化してデータ分析側にフィードバックし、モデルを柔軟に更新させ、より現実に即した分析を行ったりする試みが必要になる。
また、データ分析結果の解釈においては必ずメリットとリスクのトレードオフが存在する。その際に分析結果に基づくメリットを確保しながら過大なリスクを避けるよう、適切な行動を選択することが必要となる。例えばアセットマネジメントの例では、機器の劣化度をより安全側に判定するようにモデルを組み立てれば、その分だけ機器の更新費用はかさむことになり、これらの間の微妙なバランスを取ることが求められる。解釈の難しいデータ分析モデルを理解しながら上述のように結果を柔軟に捉えて行動につなげるには、事業とデータ分析の両方の分野に関する十分な知見が必要である。
3. 上下水道事業へのデータサイエンス活用に向けて
以上、上下水道事業へのデータサイエンスの活用において乗り越えるべき課題を述べてきた。データサイエンス活用はその専門家に任せておけばよいという意見もあるが、ここに挙げた課題の検討は、メーカーやゼネコンが抱えるデータサイエンスの専門家に任せきりにせず、上下水道事業を管理する公共側が主体となって議論に参加し、事業のかじ取りを行えるよう一定の知見を備えておく必要があると筆者は考える。メーカーやゼネコンによるデータ活用ではどうしても自社利益に一定のフォーカスが置かれがちなこともあり、上下水道事業全体を俯瞰した価値向上の視点は公共側が主体的に持っておくことが望まれるからだ。
急速な進化を遂げるデータサイエンスが全国の上下水道事業体に浸透し、上下水道事業を取り巻く施設老朽化、職員減少、料金収入減少といったさまざまな難題の解決の一助となることを期待したい。
(※1) 決定木分析…ツリー構造による分類・回帰を行うことで目的変数の説明要因を解析するデータ分析手法。
以上
関連リンク
連載:社会・環境インフラにおける政策・事業革新
・「社会・環境インフラにおける政策・事業革新」~連載開始にあたって~
・アウトカム起点のPDCAサイクルを導入した自治体まちづくりの革新~島田市金谷地区生活交流拠点整備運営事業の挑戦~
・水道事業のデジタルトランスフォーメーションの現場推進に向けた考察
・広域化・脱炭素に資する民間メタンガス化事業を生かした事業モデル
・廃棄物・資源循環分野での2050カーボンニュートラルに向けた三つの革新
・インフラ事業の価値を高める新しいインセンティブ導入の可能性
・需要側の参加を通じた水道インフラの脱炭素化手法
・農村インフラの課題解決に向けたDX推進の着眼点
・上下水道事業におけるデータサイエンスの活用に必要な視点
・廃棄物処理PPP事業体の潜在資産を生かし、地域防災減災機能を高める