資格部

資格・検定の試験情報、対策方法、問題解説などをご紹介

新資格「データサイエンティスト検定™」が発表!

検定詳細、模擬問題(予想問題)についてはこちら

発表内容

 2021年4月20日に、データサイエンティスト協会より「データサイエンティスト検定™(DS検定™)」を今秋に開始する旨の発表がありました。

www.datascientist.or.jp

 “データサイエンティスト”という業務・役割が、一般に認知されるようになって数年が経ちますが、これまではその能力を直接認定する資格や検定がなく、代わりとして「統計検定」や「ディープラーニングG検定」、「データベーススペシャリスト試験」などが活用されてきました。

 今回、明確にデータサイエンス能力を測る試験が設定されることになりましたので、データサイエンティストになりたい、またはデータサイエンティストのスキルを身につけたい・興味がある、という方々にとっては、良い目標になるのではないかと思います。

データサイエンティストに求められるスキルセット
f:id:trhnmr:20210423140623p:plain

出典:データサイエンティスト協会 プレスリリース(2014/12/10)

 

 なお、検定開始時点では、リテラシーレベル(見習いレベル)のみの提供になります。

f:id:trhnmr:20210423154351j:plain

出典:データサイエンティスト協会HP

検定概要

試験情報

 DS検定™について現在判明している内容は次の通りです。

申込関連
試験日 年2回(春・秋)
*第一回は2021年9月頃
申込期間 第一回は2021年7月頃
受験料 一般 11,000円(税込)
学生 5,500円(税込)
受験資格 特になし
申込方法 申込サイトよりWEB申込
試験関連
試験方式 CBT(@所定の試験会場)
試験時間 90分
出題形式 選択式
出題数 90問程度
合格基準 (不明)
合格発表 (不明)

試験範囲

スキルチェックリストの3カテゴリ
  • データサイエンス力★1
    統計数理基礎、線形代数基礎、微分・積分基礎、回帰/分類、評価、検定/判断、グルーピング、性質・関係性の把握、サンプリング、データクレンジング、データ加工、方向性定義、軸だし、データ加工、表現・実装技法、意味抽出、アプローチ設計、統計情報への正しい理解、データ確認、俯瞰・メタ思考、データ理解、洞察、機械学習、時系列分析、言語処理、画像処理、動画処理、音声/音楽処理、パターン発見
  • データエンジニアリング力★1
    システム運用、システム企画、クライアント技術、通信技術、基礎知識、テーブル定義、DWH、分散技術、クラウド、フィルタリング処理、ソート処理、結合処理、クレンジング処理、マッピング処理、サンプリング処理、集計処理、変換・演算処理、データ出力、データ展開、データ連携、基礎プログラミング、データインタフェース、分析プログラム、SQL、基礎知識、攻撃と防御手法、暗号化技術
  • ビジネス力★1
    ビジネスマインド、データ倫理、コンプライアンス、契約、MECE、言語化能力、ストーリーライン、ドキュメンテーション、説明能力、KPI、スコーピング、データ入手、データ理解、意味合いの抽出・洞察、評価・改善の仕組み、プロジェクト発足、リソースマネジメント、リスクマネジメント
数理・データサイエンス・AIにおけるモデルカリキュラム
  1. 社会におけるデータ・AI利活用
    1. 社会で起きている変化
      • ビッグデータ、IoT、AI、ロボット
      • データ量の増加、計算機の処理性能の向上、AIの非連続的進化
      • 第4次産業革命、Society 5.0、データ駆動型社会
    2. 社会で活用されているデータ
      • 調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
      • 1次データ、2次データ、データのメタ化
      • 構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
      • データ作成(ビッグデータとアノテーション)
      • データのオープン化(オープンデータ)
    3. データ・AIの活用領域
      • データ・AI活用領域の広がり(生産、消費、文化活動など
      • 研究開発、調達、製造、物流、販売、マーケティング、サービスなど
      • 仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成など
    4. データ・AI利活用のための技術
      • データ解析:予測、グルーピング
      • データ可視化:関係性の可視化、地図上の可視化、挙動・軌跡の可視化、リアルタイム可視化など
      • 非構造化データ処理:言語処理
    5. データ・AI利活用の現場
      • 流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ・AI利活用事例紹介
  2. データリテラシー
    1. データを読む
      • データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値)
      • 観測データに含まれる誤差の扱い
      • 相関と因果(相関係数、擬似相関、交絡)
      • 母集団と標本抽出(国勢調査、アンケート調査、全数調査、単純無作為抽出、層別抽出、多段抽出)
      • 統計情報の正しい理解(誇張表現に惑わされない)
    2. データを説明する
      • データの図表表現(チャート化)
      • データの比較(条件をそろえた比較、処理の前後での比較、A/Bテスト)
      • 不適切なグラフ表現(チャートジャンク、不必要な視覚的要素)
      • 優れた可視化事例の紹介(可視化することによって新たな気づきがあった事例など)
    3. データを扱う
      • データの集計(和、平均)
  3. データ・AI利活用における留意事項
    1. データ・AIを扱う上での留意事項
      • 個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウト

対象者像

 DS検定™ リテラシーレベルの受験対象者は以下のような方が想定されています。

  • データサイエンティスト初学者
  • これからデータサイエンティストを目指すビジネスパーソン
  • データサイエンティストに興味を持つ大学生や専門学校生など

注目ポイント

会場受験のCBT

 試験方式はCBTであり、会場受験になります。
 *G検定のような自宅受験(IBT)は不可

受験機会は年2回

 CBTではあるものの、通年受験できるわけではなく、春・秋の一定期間になります。

ボリュームは多め?

 試験時間90分に対し問題数が90問ですので、1問あたり1分程度しかありません。そのため各問の難易度・複雑度はそれほど高くないと想定されます。

試験に向けて

試験対策

 試験範囲が公開されているものの、今のところサンプル問題などはなく、問題のボリュームや難易度は不明です。

 試験範囲を見る限りでは、情報処理技術者試験G検定QC検定などと重複部分が多そうですので、それらの学習から始めても良いかもしれません。

 ただ、2021年7月頃に公式テキストを出版予定とのことですので、受験を考えている方は購入を検討してみてはいかがでしょうか?

今後の予想

 データサイエンススキルは、IT関連に限らず、様々なビジネスの現場で活用され得る能力です。そのため、幅広い業界から受験者が集まるのではないかと予想します。
 検定試験の認知度はまだまだこれからですが、ホットなテーマであることから、受験者数は年間1万人を超える規模になるのではないでしょうか。

 試験開始後には、当サイトでも試験対策方法、模擬試験問題など作成していきたいと思います!詳しくはこちらのページで!

qe.hpeo.jp