初心者向け:未経験からデータアナリストになるには?

ビッグデータ時代の到来に伴い、さまざまな領域でビッグデータの活用が進んでいて、データアナリストなどの人材の需要はますます高まってきています。Indeed.comによると、この職業の成長率が4,000%以上に達しました。この記事では、未経験からでもデータアナリストを目指す方法を解説します。

 

データアナリストとは?

データアナリストとは、データ分析を行う専門家のことです。データ分析は、あらゆる業界の基本的な部分です。そのため、データアナリストはさまざまな業界で幅広いキャリアパスを持っています。

キャリアパス

 

 

以下のような業界では、データアナリストに大きな需要があります。

リサーチ・市場調査アナリスト:現在の市場の状況を分析する調査・リサーチを実施します。消費行動、購買習慣などを収集し、新製品の需要をに予測し、販売戦略の向上を実現できるようにします。エントリーレベルの給与は450万円~650万円です。

 

財務アナリスト:財務データを操作して、モデルと予測を提供します。銀行投資などの投資産業は、投資機会を探求するためにデータに大きく依存しています。エントリーレベルの給与は550万円~750万円です。

 

ビジネスアナリスト:データを実用的なビジネス洞察に変えます。 Excel、Power BI、およびSQLの広範なスキルが必要です。エントリーレベルの給与は500万円~700万円です。

 

 

入門するにはどのようなスキルが必要ですか?

 

  1. SQL構造化照会言語は、データベースにアクセス、管理、操作するように設計されているデータベース言語の一つです。これは、データアナリストに求められる基本スキルです。
  2. Excel軽量で迅速なデータ分析には、マクロやVBAのVLOOKUP関数などの高度なExcelスキルが必要です。
  3. 統計的プログラミング:R、MATLAB、SAAなどの統計言語によって、大きなデータセットを探索し、理解を深めるために派手なグラフで表示する必要もあります。
  4. データ可視化:結果を提示および説明する能力も不可欠です。Power BIやTableauなどのツールは、標準の分析ツールと見なされます。

 

これらすべてに加えて、分析を行われるようにするデータプールを作成する必要がありますね。

Webスクレイピング(Webデータ収集)は分析スキルの一種ではなく、それを補足するものです。ほとんどの場合、データアナリストは、データを見つけてきれいに抽出するより良い方法を知らない限り、乱雑なデータに対処しなければなりません。幸いなことに、OctoparseのようなWebスクレイピングツールを利用して簡単に始めます。他にも多くのオプションがありますので、この記事をご参考ください。

 

例を挙げましょう!

WebスクレイピングExcel、Tableauを併用してデータ分析を行う例を見てみましょう。ここでの最終目標は、国の一人当たりGDPとそのインターネットユーザーの成長率との関係を調べることです。



データを取得する

これを行うには、2種類のデータが必要です。

 

  1. 一人当たりGDP (https://www.cia.gov/library/publications/the-world-factbook/)
  2. インターネットユーザーの成長率 ( https://www.internetworldstats.com/top20.htm)

 

まず、Octoparseを使って、データ抽出のクローラーを設定します。Octoparseなら、簡単なクリックしてデータを抽出でき、プログラミングできない人にとても優しいです。使い方が分からい方はOctoparseの動画チュートリアルを参照することをお勧めします。

 これは、作ったワークフローです。クローラーの設定が完了したら、「抽出開始」ボタンをクリックするだけで、Octoparseは魔法のように動作し、データを取得してくれます。

 ワークフロー

 

 

この抽出のために、組み込みの正規表現ツールを使用して少し編集しました。Javascriptなどで正規表現モデルを作成する必要なく、時間を大幅に節約できますね。 

正規表現ツール

 

 

データをスクレイピングしてスプレッドシートに入れました。興味があれば、ご参考ください。

 

Excelで値を検索する

次に、 INDEX と MATCH 関数を組み合わせて、2つスプレッドシートから検索値と一致するデータ(インターネットユーザーの成長率と1人あたりのGDP)を取得する必要があります。

 

=INDEX(対象範囲, MATCH(検索値, 検索範囲, 0))

 

まず、MATCH関数を使って、シート2から「Country」を検索し、シート2から探すものを返します。

 次、INDEX関数を使って位置を検索し、シート1から対応する値を返します。

シート

 

Data1とData 2は、シート1から名前を付けた検索範囲です。

 データシート

 

この式を使って、使用して、MATCH関数から返された国の位置(DATA2)を検索し、GDP_per_capita(DATA1)から対応する値を返します。

 

データ可視化

値のマッチングが完了すると、データを可視化することができます。Tableauは簡単に手に入れることができます。目的の値をダッシュボードにドラッグするだけです。 次のチャートのように見えます。

分析結果

 

 

 

次の結論が得られます:

国のインターネット成長率と一人当たりGDPの間には、強い負の相関関係があります。 つまり、インターネットユーザーの増加が速いほど、一人当たりGDPが低くなる可能性があります。GDPの高い国は通常より発展しているため、成長する余地が限られている、それも理にかなっています。一方、GDPの低い国には、インターネットインフラストラクチャを拡大する可能性が十分にあります。したがって、インターネット全体の成長率は先進国よりも速く増加します。

 

 

まとめ

データアナリストになりたいなら、きちんとキャリアパスを計画することをお勧めします。上記のデータ分析に求められる基本的なスキルを磨きながら、データ収集と処理の能力も上げるほうがいいと思います。データ分析の効率を大幅に向上させるため、履歴書や面接でアピールできる「特別な売り」になるかもしれません。それに、 オンラインで利用可能な豊富な無料のリソースがあり、最大限活用してください。

 

 

元記事:https://www.octoparse.jp/blog/how-to-become-a-data-analyst/