祝 IBM Watson サミット 2016 開催記念!

本当は政治家相手のを作ってましたが、こっちの総選挙が近いので急遽AKB版を作りました。「自分と性格の近い/遠い総選挙メンバーを調べる」というサービスです:


僕個人のプロフィールを知っている人であればなんとなく想像しているかもしれませんが、このサービスは IBM WatsonPersonality Insights という、個人の性格分析 API を使って開発しています。

具体的には、今回の総選挙に立候補を表明したメンバー(http://sousenkyo.akb48.co.jp/member.php)の中で、ツイッターアカウントを持っている人を対象に上記 Watson API を使って性格を分析しています。この分析済みのデータと、利用する人(あなた)のツイッターデータから分析した性格を比較します。性格分析には Big 5 と呼ばれる5つの視点からの性格分析を行い、それぞれの項目ごとと全体とで利用者に似た性格のメンバーと、性格の遠いメンバーとを調べて図示します。

インプットデータにツイッターのツイートを使うため、ツイッターのアカウントを持っていること(そしてある程度の量をツイートしていること)が前提になります。ただツイッターアカウントを持っていなくても、各メンバーの性格を参照することは可能です(その場合、自分との比較はできません):
2016052203


実際に比較する場合は画面右上のツイッターアイコンをクリック(タップ)してツイッターにログイン、するだけで、結果を表示してくれます。スマホから利用する場合は結果のチャートが潰れてしまうのを避けるため、画面を横向き(横長)にして実行してください。


性格は客観的な分析が難しく、本人でもわかっていない部分があったりしますが、このサービスではツイッターというツールを使い、その中で使われている語彙や単語の傾向などから性格を分析します。なお、インプットデータは直近400件のツイートデータです。AKB メンバーの性格分析には2016/05/20時点での直近400データを使いました。利用者の性格はリアルタイムに直近400データを使います(なので、一度調査した後にいくつかツイートして、再度調べると結果が変わる可能性があります)。自分の推しメンと性格が近いのか遠いのか、そして自分の知らない一面に気付くと同時に、新たな増しメンの可能性を追求していますw

※400件ツイートしてないとダメ、というわけではないのですが、あまりにデータが少ないと性格分析ができないため、目安として400件を意識してください。


あとはまあ普通の同様のサービスのように、結果をシェアする、といった機能も含めました。ちなみに「フレッシュレモン推し」の僕の(2016/05/22 時点での)結果はこんな感じでした:
http://akb-finder.mybluemix.net/result.jsp?id=dotnsf

(全体的に似てるのは入山さん)
2016052201


(Big 5 個別だと東さんと森田さんが近そう。確かにレーダーチャート的にはそっくり)
2016052202


正直、まだ画面構成やデバッグなど不十分な点は自覚していますが、できれば総選挙前に(自分の票をどこに入れるのかの参考にするために)リリースしたかったので、この段階でリリースすることにしました。特に見栄えの未熟な点はご容赦ください。



以下はこのサービスで使っている技術についての解説です。こういう人工知能的なテクノロジーに興味がある人向けです。

まずこのサービスで使っている性格分析 API である IBM Watson Personality Insights について日本語で紹介している資料はまだあまり多くないのですが、以下の PDF はその技術解説や日本語化の裏話、将来的な可能性についての読み物として公開されているものです。興味ある方はご一読いただくことをオススメします:
http://www-01.ibm.com/common/ssi/cgi-bin/ssialias?htmlfid=CO113416JPJA

技術的な視点では、このような人の性格分析がウェブの API として、それも(日本語の)テキストをインプットするだけで性格をアウトプットしてくれる、という簡易さが今後のユーザー向けサービスを大きく変える可能性を秘めていると思っています。

PDF の中でも触れられていますが、人の性格を分析するのは決して簡単なことではありません。にも関わらず、多くのベータユーザーの皆さんの協力や、研究の成果によって、「一人の人が書いたテキスト」から性格の傾向を分析することに成功し、ある程度の実証ができるようになりました。そしてその機能が誰でも(ウェブ上に公開された API として)利用できるようになりました。まずこの点で画期的なブレイクスルーが実現しています。

「一人の人が書いたテキスト」をどのようにして集めるか、という問題もあります。ただウェブであれば、このサービスで実現したようなツイッターや facebook といった SNS のデータを使うことができます。企業内利用であればユーザーの送信メールや社内掲示板や電子報告書などからもデータを取得することが可能です(プライバシーポリシーにもよりますけど、技術的には簡単ですよね)。またサービス利用者からの問い合わせ内容を再利用することも可能です。

そして性格が分析できると、「似た人」や「遠い人」、「何が似ているのか?」といった要素がわかってきます。そして似た人の行動を(個人情報を開示しない形で)提供する、という新しいリコメンドの可能性も見えてきます。それらが(充分な量の)テキストから取得できるようになる、という可能性を秘めていることになります。

ただし、「性格分析結果のどこまでを個人情報として扱うべきか?」などの新しい問題も出てきます。「個人を特定可能なのか?」、「性格分析の精度は?」、「法の整備は?」、「会社としてのポリシーをどうすべきか?」などなど。 人工知能技術の発展によって、どこまでロボットの人格を認めるべきかという議論の必要性が考えられますが、同時にそのロボットの判断結果をどこまでセキュアに保護すべきか?という議論も必要になってくるわけです。

私も API を使ってアプリやサービスを作っている立場として、色々な意味で新しい世界に踏み込みつつあることを実感しています。


というわけで、言い出しっぺの役割もあると思い、今年はフレッシュレモンこと市川美織さんに加えて入山杏奈さんの2名に票を投じることを宣言します!