Ccmmutty logo
Commutty IT
20 min read

【ハックしないE資格対策記-01-】~ まずはE資格を知ろう編 ~

https://cdn.magicode.io/media/notebox/b6d56ea0-0023-4588-8c9c-d16550dc81fe.jpeg
※本記事は過去にQiitaで投稿したものを再編集したものです。

【ご挨拶】こんにちは!ぬかさんエンジニアリングです。

本記事をクリックしてくださってありがとうございます!
クリックしてくださったということはあなたもE資格に興味がある方、もしくは試験に向けて勉強されている方でしょうか。
初回は、E資格とは何かについて取り扱いたいと思います。
E資格はディープラーニングの知識と実装能力を認定する試験ですが、(2022#1時点で)まだ7回しか開催されていない上に過去問題も非公開なため情報があまり出回っていないのが現状です。そんな状態でE資格を受けるのは少し不安ですよね。ですので、現在公開されている情報を収集して少しでもE資格を知ろう!というのがこの記事の内容です。
丁寧に解説していきますので是非最後までご覧ください。

【本シリーズの概要】

▼ハックしない"って何?
ハック/-Hack-は…
〔物事をうまくやるための〕こつ、アイデア 1
と言う意味を持っています。
この意味合いで、世の中には生活術や仕事術としての「○○ハック」という言葉が広がっていますよね。 塾や予備校で学ぶ受験対策術も「お受験ハック」です。”傾向と対策”など、大学入試の際に私もお世話になりました。 しかし、本シリーズではそういった対策術だけを記事にすることはありません。 ”E資格合格のための5つのコツ”とか”○○時間で合格できるE資格”とか”覚えておきたいコスパ最強10の公式”などは期待しないでください。 ディープラーニングについて頭の中に体系を作り上げていただける様に、記事の内容もコツコツと必要な知識を述べ、体系的に整理して使えるような形を目指して作っていきます。
それが【ハックしないE資格対策記】です。
▼なぜハックしないのか
何故なら、資格試験の合格はゴールではなくあくまで客観的な知識と技術の基準として存在するものであり、合格後に知識と能力を活かせるかの方が遥かに大切だからです。
ここで一般社団法人日本ディープラーニング協会の公式ホームページからE資格の目的に関する記述を引用します。
ご挨拶
人工知能の分野は、良くも悪くも、「人工知能の定義がない」ということに由来する特徴があります。さまざまな技術を取り込む寛容性がある一方で、なんでもかんでも人工知能と言ってしまうことができ、過剰期待を生みやすい性質もあります。だからこそ、人工知能の分野においては、ある一定の知識レベル・技術レベルの基準を作るということが大変重要と考えます。本協会では、初期の重要な活動としてディープラーニングに関する資格試験を実施したいと考えています。ユーザ企業やエンジニアが、一定の知識レベルを担保することで、地に足の着いた議論や事業開発ができるものと考えています。2
E資格概要
ディープラーニングの理論を理解し、適切な手法を選択して実装する能力や知識を有しているかを認定する。3
E資格が目的としていることは引用の通りで、要するにディープラーニングについての能力と知識レベルを客観的な基準で認定して、一定のレベルを担保した上で議論や事業開発が出来るようにすために実施されているのです。
この資格が、合格後にディープラーニングを議論や事業に活かしてもらうためにあると分かった上でもう一度考えてみると、やはりハックせずにコツコツとディープラーニングについての体系を組み立てて長期的に役立つ方向に向かった方が良いなと思いませんか。
概要を読んで良いコンセプトだと感じて下さった方は是非これからのシリーズを見届けていってもらえると嬉しいです。 また、訂正、アドバイス、追加の参考資料の提案などなど、この記事をより良いものにするコメントをして下さるセカンドクリエイターの皆様をお待ちしております。
また、コメントで盛り上げて頂けるとモチベーションに繋がりますのでよろしくお願い致します!

【今回のテーマ】 ~ まずはE資格を知ろう編 ~

本シリーズ初となります今回は、E資格とは何かというテーマを扱いたいと思います。 目的は?難易度は?受験料は?などなど気になるポイントについてご紹介していきますのでどうぞご覧ください。

〔E資格の概要〕

E資格について一般社団法人 日本ディープラーニング協会公式HPより引用します。
概要:ディープラーニングの理論を理解し、適切な手法を選択して実装する能力や知識を有しているかを認定する。 受験資格:JDLA認定プログラムを試験日の過去2年以内に修了していること 実施概要:試験時間:120分、知識問題(多肢選択式・100問程度)、各地の指定試験会場にて受験 試験会場:お申し込み時に、希望会場を選択 出題範囲:シラバスより、JDLA認定プログラム修了レベルの出題 受験費用:一般:33,000円(税込)、学生:22,000円(税込)、会員:27,500円(税込)3
要約すると、E資格とは120分100問の選択式テストで、ディープラーニングの理論を理解して適切な手法を選択して実装する能力や知識を有しているかを測り認定する試験です。
・試験は年二回、8月中旬と2月中旬に開催されます。
・JDLAプログラム受講から2年間の間は何回でも受験可能です。
・試験は全国のテストセンターなどで受けられますが、希望場所は申し込み開始日からの先着順となります。
・申し込み開始日は毎回異なりますが受験日の2~3か月前の場合が多いです。各自公式ホームページをこまめに確認してください。

〔主催団体〕

名称:一般社団法人 日本ディープラーニング協会
英称:Japan Deep Learning Association (略称:JDLA)
理事長:松尾 豊  東京大学大学院工学系研究科 教授
理事長は、日本のディープラーニング研究の第一人者である”松尾豊”教授です。
の著者としても有名です。この本を読めばディープラーニングによって見出された「特徴量の可能性」がよくわかります。おすすめです。

〔JDLA認定プログラムとは〕

E資格の受験資格として、データサイエンスに関する教育事業者や一部の大学機関で行われているJDLA認定プログラムを受講する必要があります。(2021/12時点 17団体) 内容は、E資格のシラバスの内容に沿った講義と実践課題をPythonを用いて行うものになります。
カリキュラムの詳細は各事業者ごとに異なりますが、全てJDLAのカリキュラム審査に合格した内容になります。
私の場合は”東京大学 松尾研究室”の「深層学習 / Deep Learning 基礎講座」を受講しました。
内容は、シラバスの内容講義+実践課題+最新の研究紹介で全13回週100分間とかなりボリューミーなものでしたがその分理解は深まった印象です。
対象は現役学生のみに限定されてしまいますが、学生向けとだけあって無料で受講できますので現在学生の方には是非この「深層学習 / Deep Learning 基礎講座」をおすすめしたいと思います。
難易度は、募集要項に「大学の理系学部レベルの線形代数、微分積分、確率論・統計学に関する知識を有し、Pythonでの数値解析の経験を有する者」と記載されている通り高いです。私は文系大学生で高校数学も「数Ⅱ・数B」までしか勉強していなかったですし、Pythonも初心者でしたので応募するのに躊躇しました。そんな私が受講した結果一つ言えるのは、半分も分からなくていいからとりあえず応募して受けてみたほうがいいということです。講義資料は貰えますし、課題自体は講義の難易度に比べるとそこまで高くありません。ですので、まず最低限課題が解けるレベルまで資料を読み返し、その後落ち着いてじっくり理解を深めていけば問題ありません。分からないポイントが明確になれば後は参考書を読んでネットの記事で補完する工程を週20時間程度繰り返していたら文系でも多分大丈夫です。(保障はしません。)

〔データで見るE資格〕

JDLAの発表データから一部引用
開催概要(2022#1)4 image.png
開催概要(2022#1)より作成4 image.png
各科目の平均得点率 2021#25 image.png 2022#14 image.png 各世代の合格者数 2021#25 image.png 2022#14 image.png
Study-AIのE資格難易度調査(2021 #1)よりグラフを作成
※有効回答者数:68名(合格者58名/不合格者10名) アンケート対象のE資格認定プログラム 法人向け(少人数マンツーマン制)/ 個人限定(ラビット・チャレンジ)
image.png
image.png
image.png
image.png
image.png
Study-AI 公式ホームページ E資格難易度調査(2021#1)6

◆合格率◆

・ 開催概要よりこれまでの受験者の合格率は 平均72.48% です。
・2021#1に関して、コロナウイルスの影響で2020#2が開催されなかったことのしわ寄せで受験者数と合格者数が過去最高になりました。
▽考察▽
合格率を見て高いな~と思いませんでしたか?
これは、試験以前にJDLA認定プログラムと受験費用33,000円が高いハードルとしてあり、これを超えてきた猛者たちの試験に対するモチベーションが高いことに起因していると考えられます。 時間もお金も掛けてしまった以上サンクコスト効果が働いているんでしょうね。本当のことはJDLAのみぞ知るところですが。
後に▽応用技術者検定との比較▽で合格率についても比較しているので要チェックです。

◆得点率◆

科目別の平均得点率 は、2021#2では機械学習が一番高く73.49%、深層学習が一番低く63.84%、平均は67.76%です。2022#1では機械学習が一番高く67.59%、応用数学が一番低く63.41%、平均は65.41%です。応用数学に並ぶ得点率で深層学習が63.97%です。
▽考察▽
直近2回の得点率を見ると、平均得点率は6割代に収まるよう問題が設計されていることが分かります。 ここで、得点率と合格率を使って、合格不合格の境目となる得点率が何%であったか推測してみましょう。 推測するための仮説は以下の通りです。
・E資格の合格者は、出題範囲割合で重み付けした平均得点率が高い順に決定される。 重み付き平均得点率は、以下の図にあるシラバスの中で各科目がどれぐらいの割合で占めているかという指標と各科目の平均得点率を掛けたものです。
〈シラバス2020大項目の範囲割合〉
科目範囲割合
応用数学5.4%
機械学習18.9%
深層学習69.4%
開発・運用環境6.3%
・全受験者の各科目の平均得点率の平均の分布は、μ\mu=重み付き平均得点率、σ\sigma=不明の正規分布に従う。
この仮説はとてつもなく単純化したものであり、途方もなく間違っている可能性もあります。
また、分布の標準偏差が不明なので、あくまで可能性としてこうかもしれないな~ぐらいで見てください。
実際に使用する値は以下の通りです。
・2022#1の各科目の平均得点率の平均:65.4125%
image.png ・合格者の割合:74.00%
では、いくつかの標準偏差の場合の合格最低ラインの重み付き平均得点率を見てみましょう。 pass_point_rate_sd1.png pass_point_rate_sd5.png pass_point_rate_sd10.png pass_point_rate_sd15.png pass_point_rate_sd20.png pass_point_rate_sd40.png pass_point_rate_sd50.png
どうでしょう。分布の形的に標準偏差5~15辺りが現実的にあり得そうな気がします。
だとすると、重み付き平均得点率が62.2%~55.8%ぐらい取れていれば合格するかもしれませんね。
持っている情報が少ないので弱い分析になりますがご容赦ください。

◆受験者属性◆

・各世代の合格者数から合格者の平均年齢を計算すると2021#2は30.6歳、2022#1は29.8歳です。
・数学の経験は、理系大学の数学レベルを学んでいた人が**69.12%と非常に多く、大学教養の数学を含めると80.88%**まで増えます。
・勉強時間は100~300時間で**88.24%**を占めています。
・プログラミングの経験は、実務経験者が**58.82%**を占めています。
▽考察▽
まず、合格者の年齢ですが、平均はほぼ30歳ということなので、10代や20代前半でE資格を取っておくと就活や転職を進めたい場合に、合格者平均年齢よりも早く合格しているというアピールになります。使う場合は是非このデータを提示してみてください。
次に、数学の経験は、理系大学の数学レベルを学んでいた人が69.12%と非常に多く、大学教養の数学を含めると80.88%まで増えます。Study-AIの考察によると、理系大学の数学知識であった回答者の合格率は96%、高校三年生の数学知識であった回答者の合格率は73%だそうです。20%も開きがあるということですので、もし受験をする文系出身の方がいましたら、応用数学、微積分、最適化手法、正則化手法などを数式だけで覚えるのではなく本質を理解する努力をした方が良いです。
次に、勉強時間ですが、100~300時間で88.24%を占めています。この結果から、試験までのスケジュールは300時間達成を目標に立て適宜調整していく形を取ることをおすすめします。
ただし、これは大学教養の数学まで学んでいる人が80.88%もいる集団に対するアンケートであることを忘れないでください。高校二年生以下の数学しか学んでいない人はこのアンケートの中ではたったの2.94%です。
文系出身で高校3年に入って数学とおさらばしてしまっていた私の経験上300時間では足りないと考えます。具体的に必要な時間は人それぞれですが、深層学習の土台となる機械学習の土台となる応用数学の土台となる高校数学がしっかり理解できていないと非常に脆い知識体系になってしまいますので、自分に足りていない数学的な知識は何か調べて200時間分ぐらいは数学の勉強用に別に作っておくと安心だと思います。
具体的に数学の何を勉強しなければならないか、例として以下の様に考えてください。
線形代数(70時間)←ベクトル(20時間)←幾何学の復習(10時間):100時間
確率、情報理論(80時間)←場合の数、組み合わせやlog(20時間):100時間
誤差逆伝播←微分:20時間
活性化関数←ネイピア数:5時間
数学力は深層学習よりは機械学習の方に直接関わってくることが多いので、深層学習の土台固めとして機械学習で出てくる数学は本質的に理解できるように努めると良いです。
最後に、プログラミングの経験は、実務経験者が58.82%を占めています。
Study-AIの考察によると、実務経験者であった回答者の合格率は95%、実務未経験者であった回答者の合格率は79%だそうです。15パーセントも開きがあるということですので、未経験の方は一度GoogleColabなどでJDLA認定プログラムで取り組んだ課題やシラバスの内容に沿って自分でプログラムを書いてみる練習をした方が良いです。実際テストでは、その場でコード全体の意味を理解した上で穴埋めの選択肢を考える必要がありますので、未経験だとまず全体を把握できるプログラミング力が無いので正解は難しいです。
私は、独学でPythonを学んでオリジナルのプログラムを書いたことが有ったので、実際の試験ではコード全体の意味を把握するのは問題はありませんでしたが、厳密な理解が問われるため、選択肢の細かい差異に悩まされることが結構ありました。ですので、基礎を学んだ上で自分で0からプログラムを書いてみる経験はほぼ必須だと考えます。

◆難易度◆

主観的な難易度は「やや難しかった」~「予想通りだった」までで 72.6% を占めています。
難易度が近しいと思った試験は「応用情報技術者試験」と「この一覧より難しい」で 66.18% を占めています。
▽考察▽
「応用情報技術者試験」と言う回答が多かったのは、E資格を受験する平均年齢と「応用情報技術者試験」を受験する合格者平均年齢が見事にかぶっていて身近に比較しやすかったからだと下記記載の「応用情報技術者試験」の合格者平均データから推測できます。
そうであったにせよ、E資格の難易度は「応用情報技術者試験」と同難易度かそれ以上であることには変わりわないので、E資格をあまりよく知らない人へのアピールとして有効に使えると考えて良いです。
▽応用技術者検定との比較▽
同難易度の試験の比較対象としてIPA 独立行政法人 情報処理推進機構 統計資料(令和3年度(PDF形式))の主なデータのエクセルファイルより一部引用
image.png
image.png
image.png
IPA 独立行政法人 情報処理推進機構 統計資料(令和3年度(PDF形式))の主なデータのエクセルファイル7
「応用情報技術者試験」の平均合格率は21.69%です。E資格と比較すると48.57%も開きがあることが分かります。これは、◆合格率◆で述べた通りです。
「応用情報技術者試験」の合格者平均年齢28.92歳です。E資格の合格者平均年齢は30.6歳です。ほとんど同じです。応用情報技術者試験の下位互換である基本技術者検定試験でも合格者平均年齢は26歳前後なので、E資格を学生時代や新卒時代に取るということは信頼の大きなアドバンテージになるのではないかと考えられます。

【終わりに】

初回となる本記事では、「まずはE資格を知ろう」というテーマで書いてきましたがいかがだったでしょうか。
「JDLA認定プログラムを受けて、かつ300時間近く独学で勉強して33000円も払って受験する資格なんてハードル高すぎないか?しかも2年以内だし……でも、AI人材不足のこの社会で若いうちからAIエンジニアとして信頼できる証が欲しいから受けようかな。」などなど思うことは多いかと存じます。
次回からいよいよ本題であるシラバスの内容に入っていきます!テーマは「固有値分解」です!
線形代数は機械学習で配列を扱う際に非常にお世話になりますし、他にも恩恵がありますので真正面から取り組んで参りましょう。
それでは、今回の記事が良いなと思った方はコメント及びスーパーコメントを宜しくお願い致します!それではまた次回お会いしましょう

【コンテンツツリー】◀E資格の関連記事はここから!!

【ハックしないE資格対策記】の各記事をシラバス(2020版)と同じ形式でコンテンツツリーにしています。 気になる記事に一瞬でたどり着けますのでどうぞご活用ください!
〔E資格とは〕
〔応用数学〕
  • 線形代数
  • 確率・統計
    • 一般的な確率分布
      • ベルヌーイ分布
      • マルチヌーイ分布
      • ガウス分布
    • ベイズ則
  • 情報理論
〔機械学習〕
  • 機械学習の基礎
    • 学習アルゴリズム
      • タスクT
      • 性能指標P
      • 経験E
    • 能力・過剰適合・過少適合
    • ハイパーパラメータ
    • 検証集合
      • 学習データ、検証データ、テストデータ
      • ホールドアウト法
      • k-分割交差検証法
    • 最尤推定
      • 条件付き対数尤度と平均二乗誤差
    • 教師あり学習アルゴリズム
      • ロジスティック回帰
      • サポートベクトルマシン
      • 最近傍法、k近傍法
    • 教師無し学習アルゴリズム
      • 主成分分析
      • k平均クラスタリング
    • 確率的勾配降下法
    • 深層学習の発展を促す課題
      • 次元の呪い
  • 実用的な方法論
    • 性能指標
    • ハイパーパラメータの選択
      • 手動でのハイパーパラメータ調整
      • グリッドリサーチ
      • ランダムリサーチ
      • モデルに基づくハイパーパラメータの最適化
〔深層学習〕
  • 順伝播型ネットワーク
    • 線形問題と非線形問題
    • コスト関数
      • 最尤推定による条件付き分布の学習
    • 出力ユニット
      • ガウス出力分布のための線形ユニット
      • ベルヌーイ出力分布のためのシグモイドユニット
      • マルチヌーイ分布のためのソフトマックスユニット
    • 隠れユニット
      • ReRuとその一般化
      • ロジスティックシグモイドとハイパボリックタンジェント
    • アーキテクチャの設計
      • 万能近似定理と深さ
    • 誤差逆伝播およびその他の微分アルゴリズム
      • 計算グラフ
      • 微積分の連鎖率
      • 誤差逆伝播のための連鎖率の再帰的な適応
      • 全結合MLPでの誤差逆伝播法
      • シンボル間の微分
      • 一般的な誤差逆伝播法
  • 深層モデルのための正則化
    • パラメータノルムペナルティー
      • L2パラメータ正則化
      • L1正則化
    • データ集合の拡張
    • ノイズに対する頑健性
      • 出力目標へのノイズ注入
    • 半教師あり学習
    • マルチタスク学習
    • 早期終了
    • スパ――ス表現
    • バギングやその他のアンサンブル手法
    • ドロップアウト
  • 深層モデルのための最適化
    • 学習と純粋な最適化の差異
      • バッチアルゴリズムとミニバッチアルゴリズム
    • 基本的なアルゴリズム
      • 確率的勾配降下法
      • モメンタム
      • ネステロフのモメンタム
    • パラメータの初期化戦略
    • 適応的な学習率を持つアルゴリズム
      • AdaGrad
      • RMSProp
      • Adam
    • 最適化戦略とメタアルゴリズム
      • バッチ正規化
      • Layer正規化
      • Instance正規化
      • 教師あり事前学習
  • 畳み込みネットワーク
    • 畳み込み処理
    • プーリング
    • 構造出力
    • データの種類
    • 効率的な畳み込みアルゴリズム
    • 特徴量の転移
  • 回帰結合型ニューラルネットワークと再帰的ネットワーク
    • 回帰結合型のニューラルネットワーク
      • 教師強制と出力回帰のあるネットワーク
        ‐ 回帰結合型ネットワークにおける勾配計算(BPTT)
        ‐ 有効グラフィカルモデルとしての回帰結合型のネットワーク
        ‐ RNNを使った文脈で条件付けされた系列モデリング
    • 双方向RNN
    • Encoder-Decoder と Sequence-to-Sequence
    • 深層回帰結合型のネットワーク
    • 再帰型ニューラルネットワーク
    • 長期依存性の課題
    • 複数時間スケールのためのLeakyユニットとその他の手法
      • 時間方向にスキップ接続を追加
      • Leakyユニットと異なる時間のスケールのベクトル
      • 接続の削除
    • ゲート付きRNN
      • LSTM
      • GRU
    • 長期依存性の最適化
      • 勾配のクリッピング
    • メモリネットワーク
      • Attention
  • 生成モデル
    • 識別モデルと生成モデル
    • オートエンコーダー
      • VAE
    • GAN
      • DCGAN
      • Conditional GAN
  • 強化モデル
    • 方策勾配法
    • 価値反復法
      • DQN
  • 深層学習の適応方法
    • 画像認識
      • VGG
      • GoogLeNet
      • ResNet
      • MobileNet
      • DenseNet
    • 画像の局在化・検知・セグメンテーション
      • FasterR-CNN
      • YOLO
      • SSD
    • 自然言語処理
      • WordEmbedding
      • Transformer
    • Text to Speech
      • WaveNet
    • スタイル変換
      • pix2pix
    • その他
      • AlphaGo
〔開発・運用環境〕
  • ミドルウェア
    • 深層学習ライブラリ
  • 軽量化・高速化技術
    • 軽量化技術
      • 量子化
      • 蒸留
      • プルーニング
    • 分散処理
      • モデル並列
      • データ並列
    • アクセラレータ
      • GPU

【参考シラバス】

E資格の試験出題範囲(シラバス)2020 ダウンロードはこちらから
E2022#2(2022年8月26日・27日)の試験からシラバスの出題範囲が変わります。 本シリーズは2020のシラバスを参考に記事を作成しますが、出題範囲の変更分も後々追加で書いていきたいとは考えています。 (もしかしたら別シリーズとして新たにスタートするかもしれません。) 新シラバスのダウンロードはこちらから

【参考文献】

Footnotes

  1. 英辞郎 on the WEB『hackの意味・使い方・読み方』 / https://eow.alc.co.jp/search?q=hack / 閲覧2021.12.02
  2. 一般社団法人 日本ディープラーニング協会 公式ホームページ ご挨拶 / https://www.jdla.org/about / 閲覧2021.12.02
  3. 一般社団法人 日本ディープラーニング協会 公式ホームページ E資格概要 / https://www.jdla.org/certificate/engineer / 閲覧2021.12.02 2
  4. 一般社団法人 日本ディープラーニング協会 公式ホームページ 「E資格(エンジニア資格)2022#1」結果発表。(1,327名が受験し、982名が合格)/ https://www.jdla.org/news/20220310001/ / 閲覧2022.03.21 2 3 4
  5. 一般社団法人 日本ディープラーニング協会 公式ホームページ 「E資格(エンジニア資格)2021#2」結果発表とシラバス改訂のお知らせ / https://www.jdla.org/news/20210917001/ / 閲覧2021.12.06 2
  6. Study-AI 公式ホームページ E資格難易度調査(2021#1) / https://study-ai.com/difficulty2021/ / 閲覧2021.12.07
  7. IPA 独立行政法人 情報処理推進機構 統計資料(令和3年度(PDF形式))の主なデータのエクセルファイル / https://www.jitec.ipa.go.jp/1_07toukei/_index_toukei.html / 閲覧2021.12.07

Discussion

コメントにはログインが必要です。