「ビッグデータ」とは何ですか?

そしてそれはなぜ大きなディールですか?

「ビッグデータ」は、大量の非構造化データを研究することによって、人間の行動を理解し予測する新しい科学です。 大きなデータは「予測分析」とも呼ばれます。

Twitterの投稿、Facebookのフィード、eBayの検索、GPSトラッカー、およびATMマシンを分析することは、大きなデータの例です。 セキュリティビデオ、交通データ、気象パターン、飛行機の到着、携帯電話のタワーログ、心拍数トラッカーの調査は、他の形式です。 ビッグデータは毎週変わるばかげた新しい科学であり、少数の専門家だけがそれをすべて理解しています。

定期的に大きなデータの例は何ですか?

スクリーンショットhttp://project.wnyc.org/transit-time

ほとんどのビッグデータプロジェクトは非常にわかりにくいものですが、個人、企業、政府の日々の生活に影響を与える大きなデータの成功例があります。

ウィルスの流行予測:社会政治的データ、気象および気候データ、病院/臨床データを調べることにより、これらの科学者は現在4週間の予告でデング熱の発生を予測しています。

殺人喚起:この大きなデータプロジェクトは、ワシントンDCの犠牲者、容疑者、犯罪者を殺害します。 故人を敬うための方法としても、人のための意識のリソースとしても、この大きなデータプロジェクトは魅力的です。

Transit Travel Planning、NYC: WNYCラジオプログラマーのSteve Melendezは、オンラインの地下鉄のスケジュールと旅程のソフトウェアを組み合わせました。 彼の創造はニューヨーカーが地図上で自分の場所をクリックすることを可能にし、電車や地下鉄の旅行時間の予測が表示されます。

Xeroxは労働力の損失を減らしました。コールセンターの仕事は情緒的に疲れています。 Xeroxはプロのアナリストの助けを借りてデータの集積を研究しましたが、今では、コールセンターの雇用者が最も長く滞在する可能性が高いと予測できるようになりました。

カウンターテロ支援:ソーシャルメディア、財務記録、航空予約、セキュリティデータを調べることで、法執行機関は詐欺行為を行う前にテロ容疑者を予測し、見つけ出すことができます。

ソーシャルメディアのレビューに基づいてブランドマーケティングを調整する 人々は、パブ、レストラン、またはフィットネスクラブで自分のオンライン思考を鈍く迅速に共有します。 これらの何百万ものソーシャルメディア投稿を調査し、人々が自分のサービスをどのように考えているかについて会社にフィードバックすることは可能です。

誰が大きなデータを使用するのですか? 彼らは何をしますか?

多くのモノリシック企業は、顧客満足度を最大限に高めるために、ビッグデータを使って商品や価格を調整しています。

ビッグデータはなぜこのような大きな取引ですか?

4つの事柄は大きなデータを重要なものにします:

1.データが大量です。 単一のハードドライブには収まりませんが、 USBスティックはほとんどありません。 データの量は、人間の心が知覚できるものをはるかに上回っています(10億メガバイトを考え、それに何十億も増える)。

2.データが厄介で、構造化されていない。 大規模なデータ作業の50%〜80%は、検索可能でソート可能なように情報を変換して整理しています。 地球上の数千人の専門家だけが、このデータクリーンアップの仕組みを完全に理解しています。 これらのエキスパートは、HPEやHadoopなどの特殊なツールも必要としています。 おそらく10年後には、大規模なデータの専門家は10ダースになるだろうが、今のところ非常に希少なアナリストの種であり、彼らの仕事はまだ非常に不明瞭で退屈である。

3.データは、売買可能な商品になっています**。 企業や個人がテラバイトのソーシャルメディアやその他のデータを購入できるデータマーケットプレイスが存在します。 ほとんどのデータはクラウドベースです。単一のハードディスクに収まらないほど大きすぎるためです。 データの購入には、通常、クラウドサーバーファームに接続するサブスクリプション料金が含まれます。

**大きなデータツールやアイデアのリーダーは、Amazon、Google、Facebook、Yahooです。 これらの企業はオンラインサービスで何百万人もの人々にサービスを提供しているため、大規模なデータ分析の背後にある収集ポイントとビジョンを持つ企業になることは理にかなっています。

4.大きなデータの可能性は無限です。 たぶん医師はある日、心臓発作や脳卒中の発生を数週間前に予測します。 飛行機や自動車のクラッシュは、機械的なデータや交通や気象パターンの予測分析によって減少する可能性があります。 あなたに互換性のある人物がどれであるかの大きなデータを予測することで、オンラインデートが改善される可能性があります。 ミュージシャンは、ターゲットオーディエンスの変化する嗜好にどのような音楽構成が最も喜んでいるのかについての洞察を得ることができます。 栄養士は、店舗で買った食べ物のどの組み合わせが悪化し、人の病状を助けるかを予測することができます。 表面は傷がついているだけで、毎週大きなデータの発見が起こります。

大きなデータが厄介です

モンティラクセン/ゲッティ

大きなデータは予測分析です。膨大な非構造化データを検索可能でソート可能なものに変換します。 これは、特別な種類の知識と忍耐を必要とする乱雑で混沌とした空間です。

たとえば、モノリシックなUPS配送サービスを利用してください。 UPSのプログラマは、ドライバのGPSとスマートフォンからのデータを調べて、交通渋滞に適応する最も効率的な方法を分析します。 このGPSとスマートフォンのデータは膨大なものであり、分析の準備が自動的にはできません。 このデータは、さまざまなスマートフォンハードウェアデバイスを介して、さまざまなGPSおよび地図データベースから取り込まれます。 UPSのアナリストは、そのデータをすべて簡単に検索およびソートできる形式に変換するために何カ月も費やしてきました。 しかし、努力はそれに値するものでした。 今日、UPSはこれらの大規模なデータ分析を使用し始めて以来、800万ガロン以上の燃料を節約しています。

大規模なデータは扱いにくいため、クリーンアップと使用準備のために多くの努力が必要なため、データ科学者は、彼らがやっているすべての面倒な作業のために、「データ管理者」と呼ばれるようになりました。

しかし、大規模なデータと予測分析の科学は毎週改善されています。 大きなデータが2025年までに誰もが簡単にアクセスできるようになることを期待してください。

ビッグデータはプライバシーを侵害する脅威ではありませんか?

Feingersh /ゲッティ

はい、私たちの法律や個人のプライバシー保護を慎重に管理しないと、大きなデータが個人のプライバシーに侵入します。 現時点では、 GoogleとYouTube、Facebookはすでにあなたの毎日のオンライン習慣を追跡しています 。 あなたのスマートフォンとコンピューティングの生活は毎日デジタルフットプリントを残し、洗練された企業はその足跡を研究しています。

ビッグデータに関する法律は進化しています。 プライバシーは、もはやデフォルトの権利としてそれを期待することができないので、今あなたが個人的責任を負わなければならないということの状態です。

あなたのプライバシーを守るためにできること:

あなたが取ることができる最大の一歩は、VPNネットワーク接続を使って毎日の習慣を覆うことです 。 あなたの身元と場所がトラッカーから少なくとも部分的にマスクされるように、VPNサービスは信号をスクランブルします。 これは100%匿名にはなりませんが、VPNは世界があなたのオンライン習慣をどの程度観察できるかを大幅に減らします。

ビッグデータの詳細はどこで確認できますか?

Monty Raskusen /ゲッティ

ビッグデータは、分析心を持ち、技術を愛する人にとって魅力的なものです。 それがあなたなら、興味深い大きなデータプロジェクトのこのページに間違いなく訪れてください。