これがなければ自動運転車は超危険! GPSを脇役にしたベイズ統計学とは
2023年12月2日
近年、ビジネスのさまざまなシーンで統計学が使われるようになった。特に、人工知能の分野で注目されているのが「ベイズ統計学」だ。これは18世紀にイギリスの牧師トーマス・ベイズによって作られた統計学だが、なかなか応用される機会がなく、21世紀になりコンピューターの発展と共に一気に実用化が進んだ。インターネットの検索エンジンや迷惑メールフィルタ、AIによる自動運転、お客さんが商品を買う確率の予測、がん検査など、多くの分野で応用されている。冨島佑允氏の新著『東大・京大生が基礎として学ぶ 世界を変えたすごい数式』(朝日新聞出版)『東大・京大生が基礎として学ぶ 世界を変えたすごい数式』(朝日新聞出版)では、この「ベイズ統計学」について記されている。一部を抜粋、再編集し、紹介する。
■事前確率と事後確率
迷惑メールフィルタにはベイズ統計学が応用されていて、「このメールが迷惑メールである確率は〇〇%である」というふうに分析結果を確率として出力します。このようにベイズ統計学では、分析した結果を確率として出力します。
ベイズ統計学は、新しいデータを学習することで今までの分析をアップデートしていくのが特徴です。ですので、新しいデータを読み込む前の分析結果(=確率)を「事前確率」、新しいデータを学習した後の分析結果(=確率)を「事後確率」と呼んで区別しています。
新しいデータを読み込む前(事前)か後(事後)かで、分析結果を明確に区別しているということですね。
このベイズ統計学は、絶え間なく追加される膨大なデータを次々と処理・判断していく現代のAIを支える重要なテクノロジーになっています。
というと何やら複雑な数式が出てくるのかと警戒してしまいますが、何のことはありません。数式を見ていただくと、単なる掛け算になっています。
ベイズの定理
事後確率=新しいデータの影響×事前確率
この式は「ベイズの定理」と呼ばれていて、ベイズ統計学の根幹を成す重要な数式です。新しいデータの影響を掛け算するだけで確率をアップデートできてしまいますよということです。
この定理の便利なところは、事後確率を計算してしまったあとは、計算のもとになったデータはもう不要になるという点です。
従来の統計学では新しいデータがくると、それをもともとあったデータに加えて計算をやり直す必要がありました。
それはつまり、もともとあったデータを全てとっておかないといけないということです。
そのデータ量が少なければ何も問題はないのですが、今はビッグデータ時代で、膨大なデータが際限なく生み出されています。新しいデータがやってきたときのためにそれらを全部とっておけと言われてしまったら、コンピューターの記憶容量がいくらあっても足りません。
しかし、ベイズの定理では、新しいデータを使って事後確率を計算してしまえば、そのデータはもう捨ててかまわないのです。
このため、コンピューターの記憶容量を節約できます。
さらに、このベイズの定理は繰り返し使えます。
つまり、新しいデータに基づいて事後確率を計算したあと、さらに新しいデータが入ってきたら、その事後確率を事前確率とみなしてベイズの定理をもう一度当てはめればOKです。
そうやって、新しいデータが入ってくる度に予測をアップデートしていくことが可能です。そして計算後は、そのデータをどんどん消していけばいいのです。
新しい経験(=データ)から学んでいくという点は、人間の学習とも似ていますね。
受験対策は教科書を読むだけでは不十分で、模試や過去問を解く経験を積むことで力をつけていきます。スポーツだって、ルールを学んだだけで上手にプレーできるわけではなく、試合の経験を重ねることで上達していくでしょう。
ベイズの定理は、このような経験の重要性を伝えています。ベイズの定理が捉えている本質は、“経験から学べば賢くなれる”ということです。
■GPSを脇役にしたベイズ推定
ここで応用例を紹介しましょう。日常生活で素早い判断が要求される状況といえば、車の運転が最たるものとして挙げられます。
時速数十キロというスピードで移動しながら、周囲の状況を見て的確に判断していかなければたちまち事故につながってしまいます。
こうした「運転」というタスクは、従来は人間にしか行えないものでしたが、近年になってAIが代わりに運転してくれる自動運転車の研究開発が進んでいます。この、自動運転車に搭載されているAIにはベイズ統計学が応用されています。
自動運転は、車間距離や歩行者の動きなど次々と入ってくる新しいデータを学習しながら判断(=運転)していく必要があるので、ベイズ統計学と相性がよい分野なのです。
車間距離を保ちつつ、対向車線にはみ出さないよう安全に走行するために必要なのは、車体の現在位置の正確な把握です。
自動運転車には、ビデオカメラやレーザー・レーダー(レーザーを使って障害物を検知する機器)など、周囲の状況を感知できるいろいろな種類のセンサーが搭載されていて、車に内蔵されているAIがそれらのセンサーから届けられる情報をもとに車体の現在位置を把握しています。
GPS(全地球測位システム)の位置情報も利用していますが、あくまでセンサーからの情報が主役でGPSは脇役です。
というのも、はるか上空のGPS衛星から得られる位置情報は誤差もそれなりに大きく、自動車の運転というタスクに用いるには精度が粗いからです。そのため、GPSでは大まかな位置の把握を、センサーで細かい位置の把握を行っています。
ただし、センサーから送られてくるデータにはノイズ(ブレや乱れ)が含まれているので、この情報だけでは細かい位置の把握を十分な精度で行うことはできません。
そこで、自動運転車のAIは、自分自身が出した運転の命令に基づいて位置の推論(先ほど右に30cm移動するように命じたから、今は30cm動いているはずだ、といったように)を行い、それをセンサーのデータと照合することで精度を上げています。
車が動くと、すべてのセンサーから、どんどん新しいデータが入ってくるので、AIはこれらを使って、随時新しい現在位置を推定し、それが“本当の現在位置”に一致する確率をはじき出していきます。ここで使われているのがベイズ統計学なのです。
●冨島佑允(とみしま・ゆうすけ)
1982年福岡県生まれ。京都大学理学部卒業、東京大学大学院理学系研究科修了(素粒子物理学専攻)。MBA in Finance(一橋大学大学院)、CFA協会認定証券アナリスト。大学院時代は欧州原子核研究機構(CERN)で研究員として世界最大の素粒子実験プロジェクトに参加。修了後はメガバンクでクオンツ(金融に関する数理分析の専門職)として各種デリバティブや日本国債・日本株の運用を担当、ニューヨークのヘッジファンドを経て、2016年より保険会社の運用部門に勤務。2023年より多摩大学大学院客員教授。著書に『日常にひそむ うつくしい数学』(朝日新聞出版)、『数学独習法』(講談社現代新書)、『物理学の野望――「万物の理論」を探し求めて』(光文社新書)などがある
著書に『日常にひそむ うつくしい数学』(朝日新聞出版)、『数学独習法』(講談社現代新書)、『物理学の野望――「万物の理論」を探し求めて』(光文社新書)などがある。