かなり前に公開されていたらしい。
単語分割込みの機械翻訳の話がいくつか。
Can We Translate Letters?
文字列単位のフレーズベース機械翻訳
An Iteratively-Trained Segmentation-Free Phrase Translation Model for Statistical Machine Translation (Robert Moore and Chris Quirk)
Efficient Handling of N-gram Language Models for Statistical Machine
Translation Marcello Federico and Mauro Cettolo
これは言語モデルの扱いの話。
巨大なモデルのパラメータ推定、デコードの実装よりの話がある。
<http://www.isi.edu/natural-language/mt/aimag97.ps>
前半の概論が分かりやすいとのこと。