渋谷で働くSEのブログ

渋谷で働くSEのお粗末なブログです

位相的データ分析(TDA)にハマってます

次の自主研究の課題を

「コード(chord)が書いてあるテキストファイルを解析し、新しいコードを作成する」

と設定し、基本情報ギジュ者試験が終わり次第着手しようと思っていました。

 

しかし…

今は、「位相的データ分析」(Topological Data Analysis)に完全にハマっています。

 

位相的データ分析は何かというと、

データを「点」としてみなし、それらをどんどんつなげていきながら形を見ていくようなものです。

 

ちょうど、高分子の物質や結晶が、原子同士で繋がっている構造をしていることから、

原子一つ一つを点とみなして、その点からつくられる図形の変化を見るという研究が盛んに行われているそうです。

 

応用分野としては、今は医療系・生物系・化学系が多いみたいですね。

 

画像処理・自然言語処理・音楽分析などといった分野の論文も出てます。

しかし、まだそこまで多くもないような気が…

 

一応音楽のTDAにはちょっと興味あります。

やっぱまたSan JuanitoとTobasを分析してみるとなんか面白いのが見えるんじゃないかな…とか思ったり。

でもまだ論文読んでなかったりします、実はw

 

 

詳しい説明はしません。

リンクだけ貼っときます。

 

1. すっごい参考になった本

タンパク質構造とトポロジー ―パーシステントホモロジー群入門― (シリーズ・現象を解明する数学)

タンパク質構造とトポロジー ―パーシステントホモロジー群入門― (シリーズ・現象を解明する数学)

 

 

2. 結晶分析

www.jst.go.jp

 

3. クラインボトル

http://math.uchicago.edu/~shmuel/AAT-readings/Data%20Analysis%20/mumford-carlsson%20et%20al.pdf

 

(これを理解するためには、

https://dash.harvard.edu/bitstream/handle/1/3637108/Mumford_NonlinStatPatches.pdf?sequence=1 これも一緒に読んでおくといいです)

 

4. 自然言語処理

http://pages.cs.wisc.edu/~jerryzhu/pub/homology.pdf

 

5. 音楽

https://arxiv.org/abs/1307.1201

 

だいたいこんな感じですかね…

 

応用先とかは…

経験の浅い私にはまだ思いつかないので…

とりあえず音楽とか、タンパク質の構造とか見てみようと思います。

 

これを書きながらまた調べて見ると、

画像のノイズを取り除くのに応用されているみたいですので、

そこらへんもちょっと調べてみようかと思います。

 

あと、音楽のpersistent homologyもちょっと覗き見できたらいいですね。