google-site-verification: googlec11dd3c59de6bdc4.html
人工知能はどこまで人間に迫るのか
How close will artificial intelligence get to humans?
深層学習

3)データ収集

熱水性鉱床探査の指標となる変質鉱物など数十種類を同定対象として、まずは変質鉱物を収集していく。長年の山歩きで採集したもの、鉱物収集者から分けてもらったり、変質鉱物の販売を生業としている方から購入などを行い、鉱物収集を重ねていく。

こうして次第に蓄積されていくわけであるが、明礬石として入手したものが本当にそうなのかのチェックが必要である。

手っ取り早いのは分光反射スペクトル計で測定すれば、まったく違う鉱物なのか、不純物まじりのものなのか、ピュアな明礬石なのか判断がつくが分光反射スペクトル計は高価でたきぶんあたりで安い分光器を購入してカスタマイズしていくしかないが変質鉱物同定が可能な波長幅を有していることが肝要である。

他方、鉱物のスペクトルデータベースを収集していく方法もある。国内外に鉱物のスペクトルデータベースは存在している。

研究に用いれるDBは国内・海外にあり、その中でもUSGSのものは秀逸である。今回は自分で分光反射スペクトルメータで測定したデータとインターネットで収集したものでDBを作成した。

入手した変質鉱物を各変質鉱物を多様な方向から数十回測定したり、粒度を変化させて測定したりした。データオギュメンテーションをマニュアルで行った訳である。

これらのデータに対して数十倍のデータオーギュメンテーションを施していく。通常画像のオーギュメンテーションだとインテルの画像処理用ライブラリopenCVを使ってヒストグラムイコライゼーション、ヒストグラム均一化、ノイズ加算、回転、アフィン変換などを施していくことになるが、分光反射スペクトルデータの場合そのようなオーギュメンテーションは不適である。

そのような拡張されたデータが世の中に存在しないからである。どのようなオーギュメンテーションを行っていくのかは次回で。

トップページへ