発表内容
2021年4月20日に、データサイエンティスト協会より「データサイエンティスト検定™(DS検定™)」を今秋に開始する旨の発表がありました。
“データサイエンティスト”という業務・役割が、一般に認知されるようになって数年が経ちますが、これまではその能力を直接認定する資格や検定がなく、代わりとして「統計検定」や「ディープラーニングG検定」、「データベーススペシャリスト試験」などが活用されてきました。
今回、明確にデータサイエンス能力を測る試験が設定されることになりましたので、データサイエンティストになりたい、またはデータサイエンティストのスキルを身につけたい・興味がある、という方々にとっては、良い目標になるのではないかと思います。
データサイエンティストに求められるスキルセット
出典:データサイエンティスト協会 プレスリリース(2014/12/10)
なお、検定開始時点では、リテラシーレベル(見習いレベル)のみの提供になります。
検定概要
試験情報
DS検定™について現在判明している内容は次の通りです。
申込関連 | |
試験日 | 年2回(春・秋) *第一回は2021年9月頃 |
申込期間 | 第一回は2021年7月頃 |
受験料 | 一般 11,000円(税込) 学生 5,500円(税込) |
受験資格 | 特になし |
申込方法 | 申込サイトよりWEB申込 |
試験関連 | |
試験方式 | CBT(@所定の試験会場) |
試験時間 | 90分 |
出題形式 | 選択式 |
出題数 | 90問程度 |
合格基準 | (不明) |
合格発表 | (不明) |
試験範囲
スキルチェックリストの3カテゴリ
- データサイエンス力★1
統計数理基礎、線形代数基礎、微分・積分基礎、回帰/分類、評価、検定/判断、グルーピング、性質・関係性の把握、サンプリング、データクレンジング、データ加工、方向性定義、軸だし、データ加工、表現・実装技法、意味抽出、アプローチ設計、統計情報への正しい理解、データ確認、俯瞰・メタ思考、データ理解、洞察、機械学習、時系列分析、言語処理、画像処理、動画処理、音声/音楽処理、パターン発見 - データエンジニアリング力★1
システム運用、システム企画、クライアント技術、通信技術、基礎知識、テーブル定義、DWH、分散技術、クラウド、フィルタリング処理、ソート処理、結合処理、クレンジング処理、マッピング処理、サンプリング処理、集計処理、変換・演算処理、データ出力、データ展開、データ連携、基礎プログラミング、データインタフェース、分析プログラム、SQL、基礎知識、攻撃と防御手法、暗号化技術 - ビジネス力★1
ビジネスマインド、データ倫理、コンプライアンス、契約、MECE、言語化能力、ストーリーライン、ドキュメンテーション、説明能力、KPI、スコーピング、データ入手、データ理解、意味合いの抽出・洞察、評価・改善の仕組み、プロジェクト発足、リソースマネジメント、リスクマネジメント
数理・データサイエンス・AIにおけるモデルカリキュラム
- 社会におけるデータ・AI利活用
- 社会で起きている変化
- ビッグデータ、IoT、AI、ロボット
- データ量の増加、計算機の処理性能の向上、AIの非連続的進化
- 第4次産業革命、Society 5.0、データ駆動型社会
- 社会で活用されているデータ
- 調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
- 1次データ、2次データ、データのメタ化
- 構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
- データ作成(ビッグデータとアノテーション)
- データのオープン化(オープンデータ)
- データ・AIの活用領域
- データ・AI活用領域の広がり(生産、消費、文化活動など
- 研究開発、調達、製造、物流、販売、マーケティング、サービスなど
- 仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成など
- データ・AI利活用のための技術
- データ解析:予測、グルーピング
- データ可視化:関係性の可視化、地図上の可視化、挙動・軌跡の可視化、リアルタイム可視化など
- 非構造化データ処理:言語処理
- データ・AI利活用の現場
- 流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ・AI利活用事例紹介
- データリテラシー
- データを読む
- データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値)
- 観測データに含まれる誤差の扱い
- 相関と因果(相関係数、擬似相関、交絡)
- 母集団と標本抽出(国勢調査、アンケート調査、全数調査、単純無作為抽出、層別抽出、多段抽出)
- 統計情報の正しい理解(誇張表現に惑わされない)
- データを説明する
- データの図表表現(チャート化)
- データの比較(条件をそろえた比較、処理の前後での比較、A/Bテスト)
- 不適切なグラフ表現(チャートジャンク、不必要な視覚的要素)
- 優れた可視化事例の紹介(可視化することによって新たな気づきがあった事例など)
- データを扱う
- データの集計(和、平均)
- データ・AI利活用における留意事項
- データ・AIを扱う上での留意事項
- 個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウト
対象者像
DS検定™ リテラシーレベルの受験対象者は以下のような方が想定されています。
- データサイエンティスト初学者
- これからデータサイエンティストを目指すビジネスパーソン
- データサイエンティストに興味を持つ大学生や専門学校生など
注目ポイント
会場受験のCBT
試験方式はCBTであり、会場受験になります。
*G検定のような自宅受験(IBT)は不可
受験機会は年2回
CBTではあるものの、通年受験できるわけではなく、春・秋の一定期間になります。
ボリュームは多め?
試験時間90分に対し問題数が90問ですので、1問あたり1分程度しかありません。そのため各問の難易度・複雑度はそれほど高くないと想定されます。
試験に向けて
試験対策
試験範囲が公開されているものの、今のところサンプル問題などはなく、問題のボリュームや難易度は不明です。
試験範囲を見る限りでは、情報処理技術者試験やG検定、QC検定などと重複部分が多そうですので、それらの学習から始めても良いかもしれません。
ただ、2021年7月頃に公式テキストを出版予定とのことですので、受験を考えている方は購入を検討してみてはいかがでしょうか?
今後の予想
データサイエンススキルは、IT関連に限らず、様々なビジネスの現場で活用され得る能力です。そのため、幅広い業界から受験者が集まるのではないかと予想します。
検定試験の認知度はまだまだこれからですが、ホットなテーマであることから、受験者数は年間1万人を超える規模になるのではないでしょうか。
試験開始後には、当サイトでも試験対策方法、模擬試験問題など作成していきたいと思います!詳しくはこちらのページで!