2014年12月17日 JJUGナイト 〜機械学習の変〜

よし。今回は参加してからブログにするのが早い!(普通に考えたら遅い)
今週水曜日、2014年12月17日に
JJUG ナイト・セミナー「機械学習・自然言語処理特集!」
に参加してきました。
若干遅刻気味だったんですが、1本目の自己紹介中に部屋に滑り込めたので良かったです。

今回は

というお話の3つを聞きました。

初心者向け!という機械学習はあちこちで何度もいろんな人の発表を聞きに行っているんですが、
毎度新しい発見がある。
いいことなんだけどそれだけ理解してないってことかな。。。あかんやつや。。。
同じ内容でも言葉や言い回し、見せ方が変われば、
理解の仕方もまた全く異なるわけで。

例えばAの勉強会では1の話と2の話が紐付いた形で見えるようにお話されてたのを聞いていたけど、
Bの勉強会では1の話はさらに3とも繋がってるんだぜ!(でもここでは2に触れてない)
みたいな感じ。
本当は全部繋がっているんだろうけど、
発表時間の関係や概要のまとめ方、フォーカスの当て方によって変わってくるんだと思います。
また、冒頭でも言いましたが、同じ1の話をしていても、選ぶ言葉によって自分の中への浸透度が全然違いますね。
多分これはその時選ばれた言葉が自分に馴染む言葉だったか否かにもよると思うし、
この「馴染む言葉」は人によって異なると思うので、
どれが正解ということはないのですが、
とにかく(自分にとって)「理解しやすい言葉の発表」と「理解が難しい言葉の発表」
というのは確実に存在するわけです。

そういった意味で、今回のJJUG初心者向けセッションは大変「理解しやすい言葉の発表」でした。
知り合いの方の発表だったというのもあるかもしれませんが。
とにかくしゅっと馴染んでくれたわけです。

Apache SparkとHadoopのお話は、最近社内でも話題沸騰!な分野だったので、一生懸命聞きました。
結論からいうと、、、
発表スピードに頭の処理能力がついていかず、、、
ぼんやーり概要が頭に入った、、、かな、、、?
という感じです。
今からHadoop使おうと思ってるなら辛いのでApache Sparkに(Sparkのいいところはそれだけではないですが、なんとなくそういう印象)
という教えが私の根底を流れていたんですが、
どうやら場合によってはそうでも無いようで。
用途によってきちんと使い分けや棲み分けができるっぽいです。
でも「いきなり両方を使いこなすのは無理ゲーだよぅ」という感じであれば、
やっぱりSpark選択になるんだろうな、と思いました。

最後にLuceneという検索ライブラリのお話、聞きました。
個人的にはとても興味ある内容。
1年前くらいにGroonga/Mroongaを使ってたことがある余波かもしれません。

  • Javaベースの高速な検索ライブラリで
  • Apache License2.0
  • 転置インデックスの作成と検索もできて
  • 近傍・フレーズ・範囲などの豊富なクエリがjavaから使えるよ!
  • デフォルトでkuromojiが内蔵されているので、形態素解析もやりやすいよ!

というもの。
転置インデックスについてもサザエさんの例をあげてわかりやすく説明いただきました。
ぼんやりとしか理解してなかったのが、ちょっと形になって脳みその引き出しに入った(気がした)。

Luceneは今年の年末年始のお勉強でいじってみようかな、、、と思ってます。

勉強は大きな会場の席がほぼ埋まるくらいの人数いたにも関わらず、
懇親会は20人くらい?のこじんまりした感じだったんですが、
Java女子部は3人も集まりまして。
初めまして!なJavaのすごい人たちともお話させていただくことができて、楽しかったです。

最後に発表者様の資料リンク貼っておきます。
このブログの上の方にあるリンクは発表時の映像リンクです!

Java でカジュアルにはじめる機械学習
Luceneと日本語の検索 の資料
Luceneと日本語の検索 のサンプルソースリポジトリ

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中