輪講準備

来週担当の輪講のために原稿読み

Structured Models for Joint Decoding of Repeated Utterances
G. Zweig, D. Bohus, X. Li and P. Nguyen
Interspeech2008, pp 1157-1160

RedmondのMicrosoftリサーチの方々による,電話番号案内のシステムや音声検索などで間違いの訂正のために良く起こる繰り返し発話に対処するための方法を紹介した論文

普通のシステムではターン毎に独立に認識を行っているけど,繰り返し発話が起こる場合には,発話間の関係をモデル化して,該当の2発話を同時にデコーディング(joint decoding)した方が良いという結果

感想としては,繰り返し発話に限定して実験してそこをちゃんとモデルに組み込めば良くなるのは当然かなあという感じ

この論文で扱っているような,音声認識システムの頭の悪さに起因する繰り返し発話への対処はユーザの満足度を上げるためにも非常に重要な問題である

何回言ってもわからんとストレスたまるもんなー