AI
フォント生成のトイプロジェクトを始めようと思います。 私がやりたいのは、多言語フォントづくりです。 たとえば、日本語明朝体から、ゴシック体をつくるとき、英語のゴシック体を参照するとか。 今までの研究だと、ゴシック体の「太さ」しか学習できず、「…
人工知能。 響きがいいですね。 コンピュータが世界トップレベルの棋士、イ・セドルさんに勝ったとき、世界中が興奮していましたね。 自動運転とかかっこいいですね。 ところがですね… 人工知能というのを実現するためには、目や耳が抜けそうになるぐらいの単…
昨日はInterBEE(放送機器展)に行ってきました。 いろんな放送機器やVR機材、音響機材がたくさん展示されていました。 まず、うちの会社のやつはこちら。 悲しいことに、顔を見つけては全部隠してくれてます(笑) なかなかシュールですね。 そしてすごかった…
次の自主研究の課題を 「コード(chord)が書いてあるテキストファイルを解析し、新しいコードを作成する」 と設定し、基本情報ギジュ者試験が終わり次第着手しようと思っていました。 しかし… 今は、「位相的データ分析」(Topological Data Analysis)に完全に…
基本情報技術者試験もあったもんで、報告が大分遅くなりました。 10/5にGTC Japanがありました。 うちの会社もNVIDIAの製品を使っていますので、NVIDIAの製品を使った展示を行いました。 セッションも一杯ありました。 お医者さんが医療データ分析にAIを使っ…
やっと交差検定1回目が終わりました。 なので、早速テスト。 テスト結果に爆笑しました。 K`ala Markaの曲が2曲も誤判定されていたからです。 ちなみに、 ラベル0がSan Juanito、 ラベル1がTobas です。 T005はなんとcuando floresca el chunoです。 K`ala…
昨日は「もう学習あきらめる」と言っていましたが、まだまだ続けております…実は。やっぱり「最初の120秒」は時間がかかるので、 convolutionの一番浅いhidden layerは4×400から100×16に 最初の30秒だけ tframeは150 にすることにしました。そうしましたら、…
layerとかいろいろ変えてみました。kyosuu1.hatenablog.jpちょうど全編で言っていたとおりプログラムをいじってみて、またnetworkの方も変えてみましたが、 1epochに1時間以上かかりそうです。かけてみたところ、まったく反応がありません…最初の30秒ではな…
自分の理解にちょっと間違いがあったようです。時系列そのものを一つの塊にするとか、100分割するとかではなく、時系列の方も分割しておいて、それを一つずつ見ていくか、それとも100個ずつ見ていくか、という問題でした。例の論文で使われた手法だと、時系…
音声データや画像データなどといった連続データを扱うためには、コンピュータが認識できる離散データに落とす必要がありますね。どういうことかというと、「ド」と「レ」の間には、中間の音なんかがいくらでもあるわけです。C4=261.63Hz,D4=293.66Hzだそうな…
画像の分類についてはいろいろ研究されています。 しかし、音楽については、画像ほどは進んでいないようです。 そんな中で見つけた論文がこちら。 「Deep Learning and Music Adversaries」C. Kereliuk 外 です。 この論文で紹介された手法を実行するための…
今回は、人工知能の勉強に役立つ資料をちょっと紹介したいと思います。 1. データ分析についてざっくりと見たいとき:『データマイニングと集合知』 最近流行っているニューラルネットワークの勉強に入る前に一読するといいです。いろんな話題を盛り込んでい…
今回は、San JuanitoとTobasの波形を覗き見しようと思います。 kyosuu1.hatenablog.jp ここで紹介した2曲を例としてあげたいと思います。 まずSan Juanito. youtu.be 上の曲の波形を、0秒から120秒まで描画してみました。 ツールはsoxを使っています。 聞き…
最近、C. Kereliuk et al. Deep learning and music adversariesという論文に紹介された音楽ジャンル分類のソースコードを使って、中南米音楽のジャンル分類の実験をしています。 私は、10年ほど前から中南米のアンデス山脈の音楽をやっていました。 中南米…