2012-01-01から1年間の記事一覧

SPIRE2012の効率的な文法圧縮のための可変長コードに関する論文とオンライン文法圧縮のソフトウェアー (olca++)を公開しました。

SPIRE2012で発表したメモリー効率の良い文法圧縮のための可変長コードに関する論文を公開しました。 Y.Takabatake, Y.Tabei, H.Sakamoto: Variable-Length Codes for Space-Efficient Grammar-Based Compression, Symposium on String Processing and Inform…

gwtのwavelet木の実装をwavelet行列に変更しました

大規模グラフ類似度検索のためのソフトウェアーgwtの内部で使われているwavelet木の実装をwavelet行列に変更しました。下のサイトからgwt-wm-3.0.0.tar.bz2をダウンロードできます。 http://code.google.com/p/gwt/gwtに関する説明は以前のブログ記事を参照…

MLAB2012で大規模化合物フィンガープリントの類似度検索のための簡潔データ構造に関する研究発表を行いました

8月6日,7日に北海道大学で開催された、機械学習とバイオインフォマティクスのワークショップMLAB2012にて研究発表を行いました。 http://www.cris.hokudai.ac.jp/takigawa/mlab2012/発表内容は大規模化合物フィンガープリントデータベースのための新しい簡潔…

ESPによる文法圧縮の実装を公開しました。

2012-02-04の記事 http://d.hatena.ne.jp/tb_yasu/20120204 のESPによる文法圧縮の実装に関して問い合わせが数件ありましたのでソースコードを公開しました。今後のアップデートのしやすさを考慮してgithubにアップロードしました。 https://github.com/tb-y…

文法圧縮 (Edit Sensitive Parsing (ESP))を実装してみた

ALSIPの時に聴いて気になっていた文法圧縮法Edit Sensitive Parsing (ESP)を実装しました。文法圧縮とは、与えられた文章から曖昧でない文脈自由文法*1をもとめることにより圧縮する手法です。文脈自由文法のサイズは、導出規則の右辺の終端記号と非終端記号…