機械学習

NIPS2013読み会で発表しました

東大で開催されたNIPS2013読み会で発表させていただきました. http://connpass.com/event/4728/参加者60人と大盛況で, 機械学習の人気の高さを再確認しました. 僕は, Scalable graph kernels for continuous attributesというタイトルの論文を発表しました. …

MinHashを用いたSketchSort

MinHashを用いたSketchSortの論文がMolecular Informaticsに採択されました。 論文は下のサイトからダウンロードすることができます。Yasuo Tabei and Koji Tsuda: SketchSort: Fast All Pairs Similarity Search for Large Databases of Molecular Fingerpr…

大規模グラフデータベースの類似度検索ソフトウェア(gWT:graph-indexing wavelet tree)を公開しました

昨日のブログで紹介した大規模グラフの類似度検索のC++による実装(gWT:graph-indexing wavelet tree*1 )を公開しました。googlecodeよりダウンロードすることができます。初めに、gWTはgwt-buildによりグラフデータベースの索引付けを行います。以下にサンプ…

SDM2011でwavelet木を用いた大規模グラフデータベースの高速類似度検索手法について発表しました

4月28日から4月30日に開催されたデーターマイニングの国際会議 SIAM Conference on Data Mining (SDM2011)にてwavelet木を用いた大規模グラフデータベースの高速類似度検索手法について発表してきました。Yasuo Tabei and Koji Tsuda: Kernel-based Similari…

Linear Graph Miner: 線形グラフのマイニングアルゴリズム

データマイニングの国際会議 PAKDD2011に線形グラフのマイニングアルゴリズムに関する論文がアクセプトされました。本研究は、PFIの岡野原さん(@hillbig)、産総研の廣瀬さん、津田さん(@kojitsuda)との共同研究です。 論文をarxiv.orgにアップしました。LGM:…

研究紹介 - SketchSort(スケッチソート)法

SketchSort(スケッチソート)法の論文が ACML2010にアクセプトされました。今年も採択率30%の難関でした。http://sugiyama-www.cs.titech.ac.jp/ACML2010/ Yasuo Tabei, Takeaki Uno, Masashi Sugiyama, Koji Tsuda: Single Versus Multiple Sorting in All P…

Locality Sensitive Binary Codes for Shift Invaliant KernelsとSpectral Hashingの比較

Locality Sensitive Hashing(LSH)とは、ベクトルとして表現されたデーターの集合を入力として、それらの2点間の距離を保存したまま、ハミング距離に基づく文字列の集合に射影する技術です。コサイン距離[1]、ユーグリッド距離[2]に基づくものや、機械学習法…

SACHICA(類似文字列列挙アルゴリズム)

SACHICA(類似文字列列挙アルゴリズム)のC++による実装を公開しました。 http://sites.google.com/site/yasuotabei/sachicasachicaは、同じ長さの文字列集合を入力として、ハミング距離がある閾値以下のすべてのペアーを超高速に出力します。 アルゴリズムは…

Gaussian Process(ガウス過程)

本日開催されたPRML読書会にて、6.4章から6.44章のガウス過程について発表しました。ガウス過程とは、訓練データー{(x_i,y_i)}が与えられた際、データーxに対する出力y(x)をP(y(x)|x_i,y_i)として確率モデルして、分類や回帰を行う手法です。ラベルのみの分…

LPBoostについて発表しました。

少し前になりますが、LPBoostについて機械学習勉強会で発表いたしました。LPBoostは線形計画法で定式化したBoostingです。特徴は、Ada Boostはハードマージンを最大化しているのに対して、LPBoostは、ソフトマージンを最大化しているので、ノイズに強いこと…