タグ

タグ:SBM研究会

ツンデレ風「ソーシャルブックマーク研究用データセット」

カテゴリ:
先日の第2回SBM研究会で、「研究用のデータをどうするか」といった議題が取り上げられました。

SBM標準データの考察〜SBM研究の再現性を実現するために

ある研究者がデータA を使い、他の研究者がデータBを使う場合、お互いの研究をフェアに考察することが難しい。おまけにそのデータは各研究者が独自に入手(場合によって独自にツールを作成している!)場合が多いので比較するすべがない。

もし、研究者同士が同じデータXを使えば、各研究者は研究を比較しやすくなるし、結果的にSBM研究が促進されるだろう。

一方、ライブドアでは、「データ提供するのはいいけどニーズはあるのか?」という疑問があり足踏みをしていました。

第二回SBM研究会 & 研究用データの公開方法 - nabokov7; rehash

実はこれまでにも、blog, reader, clip といった弊社のサービスのデータのうち、もともと公開情報であるもの (サイトをスクレーピングすればいずれ入手可能なデータ) を、使いやすい形で提供しようという話はありました。

clipのデータは主に協調フィルタリングの研究用データとして、また、ブログのデータは自然言語処理の研究用のコーパスとして。

が、こちらとしても研究者側のニーズが掴めず、せっかく規約等を整えて鳴り物入りで公開したのに誰も使ってくれないってのでは寒いよね、というあたりで公開に漕ぎ着けていませんでした。

こんなデータが欲しい、といってもらえれば、提供する用意はあります。

というわけでタイミング的にいろいろ噛みあったので、livedoor ラボで「ソーシャルブックマーク研究用データセット」を提供することになりました。


データセット
(クリックで移動します)


それがごらんのようなクオリティになっていますw ただ単に萌え系イラストを使っているわけではなく、セリフのなかにツンデレである必然性が仕込まれているのが素敵ですね。これ考えた人は天才なんじゃないかと思います。

これについては後ほど担当プログラマーや担当ディレクターから熱いエントリがあがってくると思いますので、見つけ次第リンクして紹介します!

livedoorから研究用データを提供します - livedoor ラボ「EDGE」 開発日誌

今回は、DLsiteなどでもご活躍中のrefeia氏にキャラクタを書き下ろして
いただきました。ありがとうございます。
■左(緑の髪):ディタ
■右(赤い髪):セト
という名前です。夏コミに期待ですね。

名前まであるようです。

べっ、別にあんた達のためにやったんじゃないんだからねっ - 941::blog

次もすごいの出すからお楽しみに。

次の次もたぶんすごいよ!

というわけで、「Co.Lab」ともどもよろしくお願いします。

livedoor クリップのデータセットを公開しました - nabokov7; rehash
第2回SBM研究会の感想 - アルカンタラの熱い夏
第1回SBM研究会の感想 - アルカンタラの熱い夏

第2回SBM研究会の感想

カテゴリ:
SN370030

第2回SBM研究会に参加してきました。

前回はアカデミックな研究発表会といった趣が強かったのですが、今回は研究者(学生)と事業者の意見交流会がテーマだったようです。事業者側としては、熱意ある学生さんたちに会社のPRができてとてもありがたかったです。

というわけで以下は、事業者の立場から研究者(学生)へのメッセージといった感じのメモ書きです。


日本野望の会の人の発表に「URL on URL」というキーワードが出てきました。それを、「あるURLに対する付加価値をもつメタなURL」くらいに理解しておくと、ソーシャルブックマークのほかにもいつくかバリエーションがあります。

SN370031

* URL on URL
- ソーシャルブックマーク(はてなブックマーク、livedoor クリップ)
- スナップショット(Internet Archive、ウェブ魚拓)
- スクラップブック(Tumblr)
- URL短縮(TinyURL)
- etc

たぶんもっともっとありますが、これをもって言いたいことは3つです。


■1.SBM研究では、URL on URLなサービスすべてをスコープに入れるべきではないでしょうか。

■2.URL on URLを垂直方向に掘り下げて研究する場合は、「検索」と「レコメンデーション」のふたつにはぜひ取り組んでほしい。弊社(ライブドア)の井原が申し上げた「ビジネス視点」という意味でも、はてなのnaoyaさんがおっしゃっていた「参入障壁」という意味でも、研究対象としてホットな分野であることがあらかじめわかっているからです。

■3.URL on URLを水平方向に捉え直して研究するとして、たとえば「URI on URL」と考えてみるのはどうでしょうか。URIは「コンピュータが扱うデータに限らず、人や会社、書籍などを示すことも可能(Wikipedia)」なので、ウェブページに限らない実験的なソーシャルブックマークができるかもしれません。


ちなみに以下は今回の研究会にライブドアから参加したメンバーのブログです。

- nabokov7; rehash
- As Sloth As Possible
- みらい管理人の自習室

言いそびれてましたが、livedoor クリップのiPhoneアプリがでました。あと、開発者のみなさんを応援する「EDGE Co.Lab」というサービスもあります。ぜひお試しください。

以上。
個人的には知人とのひさしぶりの再会もあり、とても有意義な会でした。主催者と運営スタッフのみなさま、ありがとうございました。

カテゴリ:
第2回SBM研究会講師陣+参加者募集のお知らせ

お待たせしました、第2回SBM研究会講師陣がほぼFIXしましたので、素晴らしい講師陣をご紹介します。また参加者募集も開始していますので、早めに申し込みをお願い致します。

第2回SBM研究会の開催が決まり、上記のように案内が開始されているのですが、内容に不足があるので補います。

パネルディスカッション「SBM研究を加速・拡大するために−SBM事業者には何ができるのか」に、ライブドアから井原という者が参加します。つまりこんな感じになる(はず)。

* パネラー
- 伊藤 直也(はてな)
- 澤田 哲也(ヤフー)
- 須藤 洋一(ECナビ)
- 井原郁央(ライブドア)

ソーシャルブックマークだけではなく、「livedoor Blog」や「スパムちゃんぷるー」の担当でもありますので、その点からもいろいろな話ができるのではないかと思います。と、勝手にハードルを上げてみる(笑)。

▼関連リンク
増え続けるスパムブログの現状は ライブドアが検索に新技術、9割排除
統合スパムフィルタ「スパムちゃんぷるー」のデータに基づくDNSBL

もしよろしければご参加ください。

▼さらに関連リンク
SBM研究会の感想 : アルカンタラの熱い夏

カテゴリ:
東工大で開催されたSBM研究会に参加してきましたので、ちょっと感想をまとめてみます(ライブドアからは、私の他に id:faultier が参加してきました。彼の感想はこちら)。

参加するにあたっての一番の疑問は、「なぜいまのタイミングで?」というものだったのですが、それに対する解答は得られませんでした。私としては、

- 「フォークソノミーはなぜ失敗したか」の分析
- 「del.icio.us」や「Digg」を代表とする海外サービスの行き詰まり感と可能性の事例紹介
- ソーシャルブックマークとしての「Tumblr」研究

といったことに興味があったのですが、そのあたりは満たされませんでした。残念。

違和感があったのは、「はてなブックマーク」以外のサービスの名前がほとんど出てこないこと。「はてなブックマーク」は確かに魅力的なサービスですが、それをデファクトとして考えすぎるあまり、さまざまな可能性を閉ざしてしまっていることに、もっと敏感になるべきではないでしょうか。そうでなければ、2008年の今になってSBM研究会を開催する意味が薄れるし、建設的な議論にならないような気がします。

お話を伺ってみておもしろかったのは、みずほ情報総研でのイントラ・ソーシャルブックマークの導入事例。BtoBの可能性について詳細なデータを公開していただいたことで、BtoCの可能性をあらためて検討する有効な材料となりました。ありがとうございます。

「なぜmixi?」ということについては id:faultier のこの記事の通りです。

もうひとつ。「SBM研究会」ではなく、「ソーシャルブックマーク研究会」という表記のほうがよいのではないかと思います。SBMといえば「ソフトバンクモバイル」のことだと思う人も多いわけですし、「SBM」で一意に通じるほどメジャーなサービスじゃない、ということを痛烈に自覚する意味でも。

と、厳しいことばかり書いたようですが、アカデミックな研究発表の場として、交流会として、とても有意義だったと思います。その点については、なんら否定するものではありません。主催者のみなさま、参加者のみなさま、おつかれさまでした。第2回の開催と、その充実を期待しております。また、できることがあれば喜んで協力させていただきます。

あと、livedoor クリップもよろしくお願いします。

それと、秋元さんの感想に賛意のリンク。
第一回ソーシャルブックマーク研究会に行ってきた - 秋元@サイボウズラボ・プログラマー・ブログ

このページのトップヘ

見出し画像
×