私が歌川です

@utgwkk が書いている

KMCの春合宿で「画像検索・閲覧システムの実装と全文検索SQL」の話をした

speakerdeck.com

スライド中のURLを踏んだりSQLをコピーしたりすることができるようにPDFも用意しました

(追記: SpeakerDeckのページにPDFをダウンロードできるリンクがあるのでそっちを使いましょう.クールなURIは変わらないのでこちらのURLも残しておきます.)

(追記: URLのフォーマットに一貫性を持たせるためにリンクを差し替えました.クールなURIは変わらないので前のURLも有効にしています)

内容

このブログでも度々言及している,自分用の画像保存・共有BOT,ならびに画像検索システム「救い」の話をしています. BOT部分の実装をざっと見たり*1全文検索SQLを検索窓への入力から組み立てる方法について言及したりしました. また,似たようなことをやっている人の様子や今後の課題についても言及しました. 最後に,Twitter Streaming APIの余命宣告や凍結騒動などを受けての代替としてのAccount Activity APIMastodonのStreaming APIについても軽く触れました.

反省など

  • 前提知識なしで作るのはめちゃくちゃ難しいので結局省略した
    • 裏番組も似たような話で初心者向けだったので助かった
    • ある程度の前提知識の説明を講座に詰めても時間は余った気がする
  • 60分枠だったけど45分ぐらいで講座が終わったので,もっと内容詰めてもよかったね
    • あるいはスライドを回すのや喋るのをもう少し遅くするか
  • 「画像をクエリとした検索」については一切触れてないが,触れてもよかったな?

質問・指摘されたこと

  • n-gramで検索できない文字」とは?
    • 私が引っかかったのは です
    • 誰か助けてくれ……
  • AWSにもCloud Visionのような画像認識APIがあるので,S3使ってるならそっちを使ったほうが便利そう
  • 料金について
    • ConoHaの1GB RAMインスタンス(900JPY/month)とS3(100JPY/month未満)で1,000JPY/monthも行ってない
  • ソースコード公開されてないの?
    • 検索部分は出てない
      • めちゃくちゃなコミットをしまくったので……
      • 整備されたら出るかもしれない
    • BOT部分は出てる

宣伝

KMCではコンピュータを使ったいろいろな活動がしたい部員を募集しています.KMCに入部制限はありません.どなたでも入部できます.詳しくは入部案内ページをご覧ください.

www.kmc.gr.jp

RDBMSのインデックスと全文検索SQLクエリの話がしたくなったらいつでも来てください.そうでない人もどんどん来てください.

最後に

Use the Index, Lukeは最高の文章なので読みましょう.

*1:検索システム部分の実装を持ってくるのを忘れたのでその話はあまりしていない.