伴奏リズムパターンの評価(主観ですが)を学習させてみた[2]
前の記事から、少し手直しを行いました。
学習データ・テストデータ(x)を作る際、音の鳴っている具合を数値化した(音符の始まり=3,前の音符を伸ばす=2,休符=0)のですが、
8分音符の始まりと、前の音符からのタイと「どちらが、より音が鳴ってると言えるのか」という疑問が湧き、
結局下図のように修正しました。
例えば4分音符は8分音符の「鳴り始め+伸ばし」なので、今まで「2,3」と表していたのが「3,2」と変わります。自分にどう聴こえているかを機械に伝える正確さを高めるための変更です。一方、私の主観的評価(y)は前回と変えていません。
このように修正したデータ100曲分をランダムに「学習データ80曲」と「テストデータ20曲」に分けて前回同様scikit-learnのSVMにて機械学習を行い、修正前後で正解率を比較しました。
すると多くの場合で正解率が5~20ポイント上昇する結果となりました。
次の図は、前回の「最初の80曲と後の20曲に分けた場合」で、機械の評価予測がどう変化したかを示したものです。
この場合は正解率が60%から70%へと上昇しました。
結論としては「アタックのあるなしの方が、私の主観の中で音の鳴り具合数値が高いと(無意識に)評価していて、それが機械にも伝わった」という感じでしょうか。
最近のコメント