夏休みのようなもの
今週はずっとごろごろしたりドライブしたり論文読んだりとぷらぷらしていた
論文は,思ったよりはというか予定よりも全然読めなかったけど,なんとなく次の研究テーマとして扱いたい内容(博士でやる内容)はイメージ出来てきたかな
博士では音声認識の研究に何か一石を投じてみたいのだが
しかし,僕が考え付くようなことが今やられていない理由は
1) 天才が考えるとうまくいかないことは自明
2) 実はやられてるがうまくいかなかった
3) 出来ればうまくいくが,実現が難しい.そして天才にはそれがわかっている
4) 皆今の方向性でうまくいくと思っているから,まだ誰も考えてない
てな具合か
3)なら希望が多少はあるわけだ
4)なら最高だけど,似たようなだけど美しくない論文はちらほら見かけたことがある
もう少し考えてみるか
しかし,Googleの研究者をみると有名人ばかりだ
C/C++でマイク入力
waveファイルをプログラムで扱う方法は結構簡単に調べられるが,マイクからデータを取得する方法はあんまり情報がない.
音声認識プログラムをOnlineで動かすためにマイクからの音声入力を行う必要があったので,ネットで頑張って調べた.
結論だけ言うと,Unix系でマイクからのデータを取得するには以下のページが非常に参考になった.
http://homepage3.nifty.com/rio_i/lab/oss/index.htm
感謝
ワイドディスプレイ欲しい
研究室では15インチのディスプレイを2つ使ってデュアルヘッドにしてるんだけど,2つ使うとディスプレイの境界のところをうまく使えないので,今はセンターにメインのディスプレイをおいて,左側にサブ的な扱いでもう一枚置いている
使い方としては,メインの方でWeb閲覧やプログラムの作成を行って,サブの方でターミナルを起動してシェルを動かしている
こういう使い方をしていると,シェルでの作業がある程度続くと首が疲れてきてつらい
しかし,かといっていちいちターミナルをセンターに持ってくるのも煩わしい
そんなこんなで,ディスプレイをワイド型の大きなやつ1枚にしたい
15型2枚で1280x1024を2つ使っているわけであるが,1枚で同程度の描画サイズを実現するためには,1920×1200のWUXGAディスプレイが欲しくなる
研究室で僕だけ買ってもらうというわけにもいかないと思うので,個人的に買おうと思うが,それなりに値が張るわけである
それでも,調べてみると時代は進んでいるもので,24インチでも3万円くらいで買えてしまう
現実的に買えそうとなると心が動くな...
ただ,店舗で実際にWUXGAのディスプレイを見てみるとかなり巨大で,奥行きもそれなりにあるので,研究室の机には少々大きすぎるかもしれない
いずれにせよ研究環境の向上は研究促進のためには非常に重要なので,もう少し検討してみよう
reallocにやられた
割り当てたメモリ領域のサイズを変更することができるreallocでやられた.
reallocでは,再割り当てするメモリ領域のサイズが従来のサイズよりも小さい場合にはメモリ位置は変化しないと思い込んでいたが,いかなる場合でもメモリ位置が変化することがあるようだ.
確かに,マニュアルをみると
Note that realloc() and reallocf() may move the memory allocation, resulting in a different return value than ptr.
と書いているので,そのようだ.
思い込みはいくない
メモリの指す内容が変化しないのと,メモリの指す先が変化しないのはまったく別問題だ
rallocで確保した先をポインタで参照していて超はまった
こういうことはしない方が良いんだろうなあ..
継承ってすばらしい
継承って素晴らしい,仮想関数美しい
異なったフォーマットのデータを読み込むときに継承を使うとプログラムが綺麗に書ける
最近は専ら音声認識プログラムを作成していてブログに書くネタがない
↑のプログラムの方はどんどん完成度が上がってきて,ある程度精度を犠牲にすれば実時間動作が可能になってきた
今はガウス分布にブロック型共分散を使用しているので音響尤度の計算でかなり時間をくってしまっているが,対角共分散を使えばかなり早くなりそう
現在研究室には旧形式のモデル(今はこれしか読めない)で対角のものはなく,対角共分散のHMMはHTK形式でしかないので,HTK形式のモデルを読み込めるように"The HMM Definition Language"を解釈するためのパーザを書いている
試しにこれでも使ってみるかと思ったが,気力がなく断念
せっかくなのでマルチストリームも扱えるようにしようと思うとかなり面倒い
今週中,てか明日にはこれを完成させたい
実際のところ認識エンジン自体は研究になりそうもないので(過去の技術の再実装なので),これを使った研究をしていくことを目標にしているわけであるから,早々と完成させたい
目標は7月中なんだけれども…