~matubara/ChangeLog / 2007-03

2007-03-29 Thu

■ 音声の構造的表象を通して考察する幼児の音声模倣と言語獲得 [audio][sr][nlp]

AIチャレンジ研究会２４回の資料の峯松先生の論文。

「定理」として最初にあげられるのがバタチャリヤ距離、カルバックライブラー距離、の変換不変性と、
N個の点集合が作る形とNxNの距離行列の等価性。
参考：距離 - 朱鷺の杜Wiki

注目している集合が閉じている（音素、音韻）ことと開いている（語彙）ことが、
音声処理と言語処理のあつかう対象の大きな違いだと思った。

第一著者は絶対音感を持っており、この階名での書き起こしが全くもって理解できない一人である。異なる音高に同一の音ラベルを振ることなど、全く理解不能である。
異なる話者間で「あ」の同一性が感覚できない人がいるのだろうか？
感覚できない「機械」が（中略）音声認識器である。
感覚できない「人」として、一部の自閉症者がいる。

極端な音声の絶対音感を持つと考えられる自閉症者にとって、物理的に異なる特性を持つ話者Aの音とBの音を「同一音」として認知する健常者の感覚こそ、想像を絶するものではないかと推測する。
異なる二音を「あ」と感覚できる健常者の認知能力が、音の絶対項に基づくものなのか、あるいは、音間の相対項に基づくものなのか

音声コミュニケーションに障害のある自閉者に対する健常者を、
絶対音感をもつ人に対する健常者に並行させる議論は魅力的だと思った。

彼らのグループが作った「音声から単語をメロディーのようにして認識する」システムは、
非シンボル的な相対音感に対応する。（と思う）

「構造表象」生得主義のようにも見えるけれど
この論文だけでは詳細が分からないので、参考文献をあたる必要がある。

峯松先生の過去の招待講演から
http://www.gavo.t.u-tokyo.ac.jp/%7Emine/paper/PDF/2006/speech_as_music.pdf

~matubara/ChangeLog / 2007-03 →移動しました

■ 音声の構造的表象を通して考察する幼児の音声模倣と言語獲得 [audio][sr][nlp]

■ Gilad Mishne [people][ir][net]

■ 無限級数頻度による文脈拡張にもとづく言語モデル [lm][neta]

■ 無限級数頻度素性をもちいたベクトル空間モデルによるNBテキスト分類 [learning][neta]

■ Failure Trends in a Large Disk Drive Population [hw]

■ アンケート詳細：Googleの大規模日本語データ公開に関する特別セッション [corpus][net]

■ Levenshtein Automata を用いた顔文字コピペの認識とクラスタリング [neta]

■ anond.hatelabo.jp をトポロジカルソート [neta]

■ X(7) manual page -- Display Names [linux][net]

■ UIMA 101 -- 前編 - UIMAことはじめ [markup][java][net]

■ Cygwin でソースから入れるときの依存確認 [cygwin][net]

■ 大山崇のホームページ [people][geom][net]

■ 位置情報を数値1つで表す手法「Z-ordering」 [ir][net]

■ Sparse Matrix [programming]

■ コミュニケーション能力を高めるために [lx][net]

■ Prof. Mark Johnson の Dirichlet processes and unsupervised grammar learning [segmentation]

■ MLS は Voronoi 図 に落とせるんじゃないの？ [lm][neta]

■ 私のブックマーク「Web内容マイニング」人工知能学会誌, vol.22, no.2 (2007) [nlp][net]

■ プログラミングを独習するには10年かかる [programming][net]

■ 浮動小数点演算を非lazyにする strictfp [java]

■ MLS は Voronoi 図に落とせるんじゃないの？ [lm][neta]