BigDataとは

BigDataを定義する要素(3V)

  • 【Volume:データ量】
    BigDataとは、ただただ膨大なデータ量のことを指すことのではなく、「解析を用いてビジネスに有用な知見を見出すために必要なデータ量」という認識の方が正しいとされています。
    母数を確保しても、そこに利用する価値や正確性がしっかり確保されていなければ、データとして価値は低くなってしまいます。
  • 【Velocity:データ速度】
    データ速度は、言い換えるならば「データのリアルタイム性」と捉えることもできます。
    データには時間が経過するほど価値が低下するものも数多くあり、BigData解析全域において大変な重要な要素とされています。
  • 【Variety:データ範囲】
    データは多角的なほど新しい知見を見出すのに向いています。従ってBigData解析では単一データの分析よりも、バラエティ豊富なデータから導かれる結果にこそ価値があると言われています。
    最近ではこれに「Veracity:データ正確性」を足した「4V」、さらに「Value:データ価値」を追加し「5V」というように言われる場合もあります。

最近ではこれに「Veracity:データ正確性」を足した「4V」、さらに「Value:データ価値」を追加し「5V」というように言われる場合もあります。

BigDataの分類

BigDataと一口に言っても、それぞれのデータは出所により、様々な種類に分類され、最も大きい単位で考えると「構造化データ」と「非構造化データ」の2種類に分類されます。

「構造化データ」と「非構造化データ」

「構造化データ」 は商業活動などにおける数値化されたデータや、企業内で管理する顧客データといった、特定の構造を持ったデータ群を指します。一方、「非構造化データ」は、構造化されていない多種・多量なデータ全般を指す。この「非構造化データ」が、近年データベースの巨大化や分析技術の進歩により、新たに活用が期待できる情報群として、様々な業種や分野で注目されている。

「非構造化データ」の内訳

非構造化データを細かく分解すると、まずは電話・ラジオ放送等の音声データ、テレビ放送等の映像データ、新聞・雑誌等の活字データといった、以前から生成・流通していたものの、分析の対象とはなっていなかったデータ(非構造化データ【旧】)が挙げられます。
現在はそれに加え、ブログやSNS等に書き込まれる文字データ、インターネット上の映像配信サービスで流通している映像データを中心とした、近年急速に生成・流通が増加しているデータ(非構造化データ【新】)にも活用の範囲が広がっています。
BigDataが流通・蓄積・活用が経済に与える影響について分析する際には、「構造化データ」だけでなく、これら「非構造化データ」も含めた実態の把握が不可欠です。

BigDataの定義と範囲

政府:国や地方公共団体が提供する「オープンデータ」
「オープンデータ」は、BigDataとして先行している分野であり、政府や地方公共団体などが保有する公共情報のオープン化が推進されています。
企業:ノウハウをデジタル化・構造化したデータ(知のデジタル化)
「知のデジタル化」とは、農業やインフラ管理からビジネス等に至る、産業や企業が持ちうるノウハウなどが蓄積されたデータを指しています。今後、さらに多様な分野・産業、あるいは身の回りに存在する人間の知に纏わる情報が蓄積され、デジタル化されることが想定されます。
企業:M2M(Machine to Machine)から吐き出されるストリーミングデータ(M2Mデータ)
M2Mデータは、例えば工場の生産現場におけるIoT機器から収集されるデータや、橋梁に設置されたIoT機器からのセンシングデータ(歪み、振動、通行車両の形式・重量など)等が挙げられます。
この「M2Mデータ」と「知のデジタル化」の2つは、情報の生成及び利用の観点から「産業データ」として位置付けられます。こうした産業データに係る領域は、ここから大きく産業力が強化されていくと予想されています。
個人:個人の属性に係る「パーソナルデータ」
「パーソナルデータ」は、個人の属性情報、移動・行動・購買履歴、ウェアラブル機器から収集された個人情報を含む情報群です。
また、「改正個人情報保護法」により「匿名加工情報」として、特定の個人を識別できないよう処理された人流情報、商品情報等もこの項目に含まれます。
メールフォームはこちらから
  • サイトマップ
  • 個人情報保護方針
  • 個人情報の取扱について

このページの上部へ