01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
<http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html>
IR本 by Schütze
<http://www.stanford.edu/~sgwater/>
D論ゲット
Nonparametric Bayesian Models of Lexical Acquisition
いわゆるひとつの Unsupervised Morphological Segmentation です。
#! /usr/bin/env perl use strict; use warnings; my %count; my $print_line_num = 0; use Getopt::Long; GetOptions('line-num' => \$print_line_num); my @lines = <>; my $count = $print_line_num ? sub { $_[1] - $_[0] } : sub { scalar grep /^\t\* /, @lines[$_[0] .. $_[1]] }; $. = 0; my $last_line = 1; my $date; my $writer; foreach (@lines) { ++$.; chomp; if ( m/^(\d{4}-\d{2}-\d{2})\s+(.*)/ ) { my $n = $count->($last_line, $.); print "$date\t$writer\t$n\t", q{#}x($n) ,"\n" if $n > 0; ($date, $writer, $last_line) = ($1, $2, $.); $date =~ tr/-/\t/; $writer = sprintf '%.18s', $writer; } }
<http://www.ep.sci.hokudai.ac.jp/~minobe/class/bad_eng_expressions.html>
<http://www.citeulike.org/user/float/article/917508>
<http://jp.citeulike.org/article/305755>
CFの一次文献らしい
あとで読む。
<http://jp.citeulike.org/>
ソーシャル文献リストサービス
http://www.bibsonomy.org/ も
集合知は査読を超える、のかな?
Collaborative filtering には何ができないのか
<http://latexdev.knobs-dials.com/>
アクセントって意外に標準のLaTeXでも入れられるものが多い。
\'o \`o \^o \"o \~n \=o \.o \u{o} \v{o} \H{o} \r{u} \.Z \t{oo} \c{c} \d{o} \b{o} \ae ~ \AE \oe ~ \OE \o ~ \O \aa ~ \AA \l ~ \L \ss \c{\ss}
<http://www.cs.umass.edu/~fuchun/publication/thesis.pdf>
Fuchun Peng さんの博士論文ふたつめ
[2006-01-24-3]
<http://www.chasen.org/~taku/software/darts/>
suffix array とかの template library つくるのにも参考にできると思う。
NodeType Trie の各ノードの型です. 一般的な C 文字列の検索なら, char 以外に設定する必要はありません.
NodeUType Trie の各ノードの型を符号無し整数に変換した型です. 一般的な C 文字列の検索なら, unsigned char 以外に設定する必要はありません.
ArrayType Double-Array の Base の要素に使用される型です. 通常は signed の 32bit 整数に設定します
ArrayUType Double-Array の Check の要素に使用される型です. 通常は unsigned の 32bit 整数に設定します
LengthFunc NodeType の配列を引数にしたときに, その配列のサイズを返す関数オブジェクトを 指定します. 内部呼び出しに operator () を使っている ので, () を overload しておく必要があります. NodeType が, char の場合は, strlen を wrap した関数オブジェクトが, それ以外は 0 を終了条件とみなして配列のサイズを計算します.
<http://www.ipsj.or.jp/09sig/kenkyukai/innyou.html>
情報処理学会研究報告の論文を引用する場合
<http://chaosweb.complex.eng.hokudai.ac.jp/~hagi/contents/memo-meadow-tex.html>
latexmk とか reftex の使い方 with YaTeX
<http://www.geocities.jp/whitekeyhole/ronbun/frame.html>
yet another TeX と 論文作成 tutorial
<http://bakera.jp/hatomaru.aspx/ebi/topic/2769>
任意の時点でHTTPリクエストする方法
var data = clipboardData.getData("Text"); var a= new Image(); a.src = "http://bakera.jp/?" + data;レスポンスを取れない
<http://www.cs.fit.edu/~mmahoney/dissertation/corpus.html>
<http://www.gutenberg.org/catalog/world/search>
Project Gutenberg が全文検索可能になっていた件について
たとえば Chrismas carol のあのことばも一発で
いつからあった?
全部落とす方法
import java.util.*; public class A { public static void main(String[] args) { Set<Integer> s = new HashSet<Integer>() { { // instance initializer. System.out.println("constructed."); super.add(0); } @Override public boolean add(Integer x) { System.out.println("added " + x); return super.add(x); } }; s.add(1); s.add(11); System.out.println(s); } }
Note that an instance initializer is only called once for a class.
は間違いっぽい。
すべてのコンストラクタの先頭にコピーされると思えばいい
Profiling Perl [perl][net]:
<http://www.perl.com/pub/a/2004/06/25/profiling.html>
perl -d:DProf script.pl
で実行するとプロファイルログ(tmon.out)が出る。
dprofpp
アブストラクトでは話し言葉の連語とかを獲得したい、というのが主眼。
で、どの程度適応するのかコントロールするところがキモになる。
設定した問題
適応は、実際に運用するときのデータに近い傾向の訓練データを使って、
その訓練データ上で過学習を起こさせること。
過学習というか過度の適応は避けたいのだけれど、
どの程度適応させるべきかは、
訓練データが実データにどの程度似ているかによる。
極端な話、実データそのものであれば、
いくら過学習してもいい。
実データは未知で、
だから初めて見る文字列があって。
云々
<http://www.xml.com/pub/a/2004/03/03/sgmlwiki.html>
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
最終更新時間: 2009-02-01 00:57
Powered by chalow