Googleインフルエンザの流行でインフルエンザを追跡

インフルエンザについての情報を病気のときに検索することは、驚くことではありません。 Googleはこの傾向を利用して地域別にインフルエンザの活動を推定する方法を見つけました。 彼らは、検索傾向データが、実際にインフルエンザ大流行追跡の伝統的なCDC(Center for Disease Control)方法より約2週間早かったことを発見しました。

Googleインフルトレンドでは、米国での現在のアウトブレイクレベルを推定したり、州ごとにアウトブレイクレベルを割り引いたりします。 また、過去数年間の傾向を見ることができ、あなたの近くのインフルエンザの発症場所を探すことができます。

ビッグデータ

Googleインフルトレンドは、従来の手法を使用して調べるには大きすぎると複雑すぎる膨大な構造化または非構造化データセットを表す用語である「ビッグデータ」で可能な発見の例です。

従来のデータ分析では、収集したものを管理可能なサイズに保つことが一般的でした。 研究者は、大きなグループについての情報に基づいた推測を行うために、非常に大きなグループの小さな統計サンプルを使用しました。 たとえば、政治投票は、比較的少数の人を呼び出し、質問することによって行われます。 サンプリングが大きなグループ(マサチューセッツ州のすべての有権者)に似ている場合、小グループの調査結果を使用して、より大きなグループについての推測を行うことができます。 あなたは非常にクリーンなデータセットを持っていて、探しているものを知っている必要があります。

一方、ビッグデータは、できるだけ大きなデータセット、たとえばGoogleのすべての検索クエリを使用します。 その大きなデータセットを使用すると、不完全なエントリ、キーボードを横切っている猫の検索エントリなど、「厄介な」データも得られます。 大丈夫だよ。 大規模なデータ分析では、これを考慮に入れることができ、それ以外の点では結論が出てこない場合もあります。

これらの発見の1つは、Googleインフルトレンドで、インフルエンザの症状の検索クエリが急上昇しています。 あなたはいつもグーグルではありません。「ねえ、私はインフルエンザです。OK Google、私の近くの医者はどこですか?」 あなたは「頭痛と発熱」のようなものを探す傾向があります。 非常に乱雑で大規模な検索クエリでは、若干上向き傾向があり、Googleインフルエンザの動向に影響します。

これは、CDCよりも急速にインフルエンザの蔓延を引き起こすので、これは単なるノベルティ以上のものです。 CDCは、医師や病院からの陽性のインフルエンザ検査に依存しています。 つまり、人々はインフルエンザの検査でスパイクを引き起こすのに十分な数の医師を診察するのに十分な病気になっていなければならず、その後、検査室はその傾向を報告しなければなりません。 あなたは治療を動員できる時までに既に病気になります。