C4W4 - けろろぐ

CourseraでAndrew Ng氏のDeep Learning Specializationを受講しています。

course4: Convolutional Neural Networksのweek4が終わったので自分用のまとめをあげます。

f:id:kerolog:20180624171103j:image

今回の"Neural Style Tranfer"は始める前から楽しみでした。やっとここまで来られた！　画像生成は楽しくて、あれやこれやしつこく試しました。それは別の記事であげたいと思います。

weightsではなくpixel valuesをupdateしていくのも新しい。NNっていろんな手法があるんだなぁ。

でも、私にとって仕組みを理解するのは簡単ではないです。

style costについて、、、

Gram matrixの各要素は同じ層のチャネル間の相関を表しているっていうところまではわかりました。でも、チャネル間でのactivationsの相関がなぜ必要なのか。フィルタiとフィルタjが似ていればGijが大きくなるのか。似てても小さいことはないのか。なぜこれでstyleが掴めるのか。

ビデオも何度も見て、programming exerciseも繰り返して、discussion forumも探しました。元の論文も読み、わからないのでネット記事を日本語も英語も読みあさり、動画も見て・・。それでもなんだかもやもやしてます。こんな時、誰かに聞けたらなぁ。あぁ、誰か教えてくださいorz

それでも、論文を読んでみるのはいい経験になります。ネットで手に入る良い時代だと思います。Andrew先生は元の論文をあげてくれるので、今はすらすらとは読めないけれど、もっと読めるようになりたいです。

それからもう一つの"Face Recognition"、こちらはきっちりわかりました。

こうやって先人が大量のデータを使ってNNをtrainし、そのパラメータをオープンソースにあげて誰でも使えるようにしてくれているのは、すごいことだなと思います。

オープンソースにあげるようなものは信頼して使えますが、でも、悪意をもった人がデータに正しくないものをいれて学習させてしまっても、NNは中味がみえないから気づかないのではないでしょうか。例えば、ある人物を判断できないようにしたり、ある物を認識しないようにもできるのかな。そんなことも考えてしまいました。

こちらのprogramming exerciseは、以前のThe Happy Houseの続きです。ストーリーの設定がおもしろくて！　こういうところにもこのコースの魅力があると思います。