研究用ツールをソフトウェアとして公開するということ

わたしはSPOJUS++という音声認識器(デコーダ)を作っている.*1最近tri-phoneにも対応したので,そろそろ公開しても大丈夫かなという状況になりつつある.とりあえず夏までにドキュメントを書いて,公開したい.

もちろんソースコード込みでOSSとして公開するつもりなのだが,研究用ソフトウェアを公開するということには恐れもある.

何故かと言ったらバグが怖い.

バグによって本当は有効だった手法が有効でないと判断されたりすることも有り得ないわけではない.

普通の日曜プログラミングの成果を公開するなら別にどうってことないのだが,研究用となるとちょっと躊躇するところがある.もちろん,日曜プログラミングとかでも,セキュリティ上損害を与えたりするとなると問題だが.

もちろんバグとか保障しないよという意味でのオープンソースという側面もあるとは思うけど,ツールとして使うだけなら普通はソース読まないと思う.

絶対これはおかしいと思ったら読むかもしれんが,通常はバグなんかないと思って使うんじゃないかなあ.

ということで,主に研究用途のプログラムを公開してる人とか尊敬しますよね.

まあ,SPOJUS++はわたしが始めて書いたC++のプログラムなので,恥ずかしすぎて公開に躊躇するというのも大いにあるんですけどね.


いつも酒を飲んでからブログを書き出すので,まとまりとかないのだが,まあ,それも一興ということで.

*1:近年の音声認識システムは,音響的な尤もらしさを表現する音響モデルと,言語的な尤もらしさを表現する言語モデルからなり,これらのスコアを組み合わせることで入力音声が何と発話されたか判断します.デコーダは,音響モデルと言語モデルを組み合わせ,入力音声が何と発話されているのかを探索するためのものです.