Innovenger イノベンジャー

Innovation + messenger = Innovenger イノベーション大好き。ITを通じた世界のイノベーションを発信

機械学習の可能性

Googleが公開した画像認識API

Googleが画像認識APIを公開した。

CLOUD VISION API

さて、このAPIで何ができるかと言うと、以下、サイトから引用。

画像に映るものを理解

画像内のさまざまな物体を簡単に検知できます。花や動物、乗り物など、一般的な画像に含まれる数千カテゴリの物体が検知可能で、Cloud Vision API は、新しいアルゴリズムの導入によって検知の精度が随時向上します。

不適切なコンテンツを検知

Google SafeSearch の機能を活用し、ユーザーがアップロードした画像などを容易にチェックできます。アダルト コンテンツから暴力コンテンツまで各種の不適切なコンテンツの検知が可能です。

画像の意味を分析

Cloud Vision API は、画像に写っている人物の喜び、悲しみ、怒りといった表情を分析できます。この機能と、Cloud Vision API が提供するその他の検知機能を組み合わせれば、さまざまな応用が可能です。

テキストを抽出

OCR によって画像内のテキストを認識し、抽出できます。言語の自動判定も可能です。この OCR 機能はは幅広い言語に対応しています。

画像認識もすでにここまでできているのかという印象です。

このAPIだけでも、色々なサービスに使えそうですね。

機械学習とは何か?

さて、上記のGoogle APIには機械学習と呼ばれる技術が使われている。 機械学習と合わせて聞く言葉にディープラーニングがある。 これは機械学習の手法の一種で、現在、急速に研究が進められている分野だ。

以下は、TEDでの講演である。 機械学習やディープラーニングでできること、医療分野への活用、サービス産業とそこで働く人たちの働き方の変化まで、分かりやすく述べられているので、ぜひご覧頂きたい。

The wonderful and terrifying implications of computers that can learn

これまで人間が膨大な時間をかけてやってきたことが、この技術によって実現されつつある。

これからの未来が楽しみだ。