Google DeepMindとは何ですか?

あなたが使っている製品にどの程度深い学習が組み込まれているか

DeepMindは、Googleの人工知能(AI)の背後にある技術と、その人工知能の開発を担当する企業の2つのことを指しています。 DeepMindと呼ばれる同社は、Googleの親会社でもあるAlphabet Inc.の子会社であり、DeepMindの人工知能技術は、数多くのGoogleプロジェクトやデバイスに活用されています

GoogleホームGoogleアシスタントを使用している場合、あなたの人生はすでにGoogle DeepMindといくつかの驚くべき方法で交差しています。

GoogleがどのようにしてDeepMindを買収したのか?

DeepMindは2011年に「知性を解決し、それを使って他のすべてを解決する」という目標で設立されました。創設者は、強力な汎用アルゴリズムを作成するという目的で、神経科学の洞察を得た機械学習の問題に取り組みました。プログラムする必要がなくて学ぶこと。

AI分野のいくつかの大手企業は、DeepMindが人工知能の専門家や研究者の形で集めた巨大な才能を見て、Facebookは2012年に同社を買収する劇をしました。

Facebookの契約は分断されたが、Googleは2014年にDeepMindを約5億ドルで買収した。 その後、DeepMind は2015年に行われGoogleの企業再編の際にAlphabet Inc.の子会社となりました。

DeepMindを購入する主な理由は、Googleが独自の人工知能研究を開始することだった。 買収後、DeepMindのメインキャンパスがロンドンに残っていた間に、DeepMind AIとGoogle製品の統合に取り組むため、カリフォルニア州マウンテンビューのGoogle本社に応募チームが派遣されました。

DeepMindを使っているGoogleは何ですか?

ディープマインドのインテリジェントな解決の目標は、キーをGoogleに渡しても変化しなかった。 仕事は、タスク特有ではない機械学習の一種である深い学習を続けました。 これは、以前のAIとは異なり、DeepMindが特定のタスクに対してプログラムされていないことを意味します。

例えば、IBMのディープ・ブルーは、チェスのGrandmaster Gary Kasparovを有名に破った。 しかし、Deep Blueはその特定の機能を実行するように設計されており、その1つの目的の外では有用ではありませんでした。 一方、DeepMindは経験から学ぶように設計されており、理論的にはさまざまなアプリケーションで役立ちます。

DeepMindの人工知能は、Breakoutのような初期のビデオゲームを最高の人間のプレーヤーよりも優れた方法で学び、DeepMindによって動かされるコンピュータGoプログラムはチャンピオンのGoプレーヤーを5対0で倒すことができました。

純粋な研究に加えて、Googleは、DeepMind AIを自宅やAndroidの携帯電話などの主力の検索製品や消費者向け製品に統合しています。

GoogleのDeepMindはあなたの日々の生活にどのような影響を与えますか?

DeepMindの深い学習ツールは、Googleの製品やサービスの全範囲に渡って実装されているため、Googleを何かに使用する場合、DeepMindと何らかの形でやり取りしている可能性が高いです。

DeepMind AIには、音声認識、画像認識、詐欺検出、迷惑メールの検出と識別、手書き認識、翻訳、ストリートビュー、さらにはローカル検索など、最も注目されている場所があります。

Googleの超高精度音声認識

スピーチ認識や音声コマンドを解釈するコンピュータの能力は長い間存在していましたが、 SiriCortanaAlexa 、Google Assistantのような人々は、ますます日常生活にそれをもたらしました。

Google独自の音声認識技術の場合、深い学習が大きな効果を発揮しています。 実際、機械学習によって、Googleの音声認識では、英語の正確さが人間の聴取者ほど正確であるという驚異的な精度が達成されています。

Android搭載端末やGoogleホームのようなGoogle端末をお持ちの場合、これはあなたの人生に直接、実際に適用されます。 「Okay、Google」の後に質問があるたびに、DeepMindは筋肉を曲げて、Google Assistantがあなたの言っていることを理解できるようにします。

この機械学習を音声認識に適用すると、特にGoogleホームに適用される追加の影響があります。 音声コマンドをよりよく理解するために8つのマイクを使用するAmazonのAlexaとは異なり、Google HomeのDeepMind搭載の音声認識には2つしか必要ありません。

Googleホームとアシスタントの音声生成

従来の音声合成では、連結テキスト読み上げ(TTS)と呼ばれるものが使用されています。 この音声合成方法を使用するデバイスと対話するとき、音声断片のデータベースを参照し、単語と文にアセンブルします。 これは奇妙な言葉につながり、人間の声の背後には人間がいないことは明らかです。

DeepMindはWaveNetと呼ばれるプロジェクトで音声生成に取り組んだ。 これにより、人工的に生成された音声、たとえば電話でGoogleホームやGoogleアシスタントと話すときに聞こえるような音声が、より自然に聞こえるようになります。

WaveNetは実際の人間の音声のサンプルにも依存しますが、直接合成するためには使用しません。 代わりに、人の音声のサンプルを分析して、生のオーディオ波形がどのように機能するかを学びます。 これにより、異なる言語を話したり、アクセントを使用したり、特定の人のように訓練されるように訓練することができます。

他のTTSシステムとは異なり、WaveNetは呼吸や唇の叩きのような非音声のサウンドも生成します。これにより、より現実的に見えるようになります。

連結テキスト読み上げとWaveNetで生成された音声の違いを聞きたい場合、DeepMindには面白い音声サンプルがいくつかあります。

ディープラーニングとGoogleフォト検索

人工知能がなければ、画像の検索は、タグ、ウェブサイト上のテキスト、ファイル名などの文脈の手がかりに依存します。 DeepMindの深い学習ツールを使用することで、 Googleフォト検索では実際にどのようなものかを知ることができ、タグを付けずに自分の画像を検索して関連性の高い結果を得ることができました。

たとえば、「犬」を検索すると、実際にラベルを付けたことがないのに、撮影した犬の写真が表示されます。 これは、人間がどのようなものかを知るのと同じように、どの犬がどのように見えるかを知ることができたからです。 そして、Googleの犬に執着したDeep Dreamとは異なり、あらゆる種類の異なる画像を識別するのに90%以上正確です。

Google LensとVisual SearchのDeepMind

DeepMindが作った最も素晴らしい衝撃の1つはGoogle Lensです。 これは本質的に視覚的な検索エンジンであり、現実の世界で何かの写真をスナップして即座に情報をプルアップすることができます。 DeepMindがなければ動作しません。

実装は異なりますが、これはGoogle+画像検索で詳細な学習が使用される方法と似ています。 あなたが写真を撮るとき、Googleレンズはそれを見て、それが何であるか把握することができます。 それに基づいて、それは様々な機能を実行することができます。

たとえば、有名なランドマークの写真を撮ると、ランドマークに関する情報が提供されます。また、地元の店舗の写真を撮ると、その店舗の情報が表示されます。 画像に電話番号やメールアドレスが含まれている場合、Google Lensはそれを認識して番号に電話をかけるか、メールを送信するかを選択できます。