北斗パチンコ

LAC WATCH

セキュリティとITの最新情報

RSS

株式会社ラック
ラックピープル | 

社内向けAI開発の新人研修で工夫したポイント

シェアボタンを表示

イノベーション推進部AIプロダクト開発グループの南です。

AI人材の発掘や育成は、どの企業においても大きな課題になっているのではないでしょうか。AIに対する適応力を高めるためには、全社員がAIの基礎知識を持っている必要があります。そこで、昨年度ラックは全社員を対象に、ディープラーニングの基礎知識や事業に活用する知識を得られるG検定の合格者を200人以上に増やす、「G200」キャンペーンを実施しました。

さらに、AI開発技術者の養成を目的として、基礎知識があることを前提としたAI開発研修を昨年度より実施しています。金融犯罪に対する不正検知モデルの実証実験をはじめとしたAI関連の案件が増え、AIの技術を理解して開発できるような体制を全社的に構築するために設計した研修です。

そして、今年度も社内の新人研修の一コマとして、計3回・のべ57人にAI開発研修を実施しました。

対象 人数 期間
A部門 28人 9月4日~6日
B部門 16人 9月13日~15日
C部門 13人 9月20日~22日

この記事では今年度の研修の様子とともに、昨年度からの改善点や実施して学んだことをご紹介します。

JupyterHubを用いた環境構築

研修の運営という観点で最も大きく変わったことは、JupyterHubの導入です。

JupyterHubとは

Jupyter NotebookおよびJupyterLabとは、Webブラウザで動作するプログラムの対話的な実行環境です。Pythonなどのプログラムを入力すると、実行した結果を確認しながらデータ分析を進められます。

Webブラウザで利用できる点が、初心者でも使いやすいと言われています。そして、特に機械学習に関するライブラリの実行環境として、デファクトスタンダードになっています。

JupyterHubのログイン画面
JupyterHubのログイン画面
JupyterHubの管理者用画面
JupyterHubの管理者用画面
JupyterHubのユーザ画面
JupyterHubのユーザ画面:ユーザからの見た目はJupyterLabと相違がなく扱うことができる。

Jupyter NotebookおよびJupyterLabは、個人で使うにはよいのですが、複数の受講者が同時に利用することを考えた場合、何らかの方法で環境の分離を行う必要があります。この環境の分離をフロントサイドで行ってくれるのがJupyterHubです。このJupyterHubを、社内のみからアクセスできるマシン(Ubuntu Server 22.04.3 LTS)に導入しました。

JupyterHubの主要な機能は、「ユーザ単位のJupyter環境構築」と「ユーザ認証」です。

ユーザ単位のJupyter環境構築機能

ユーザ単位のJupyter環境を構築してくれます。今回のユースケースでは、Linuxのユーザログインのhomeディレクトリを1区画とした、最もシンプルな方法で実装しました。

なお、より分離を意識したいケースにおいても、DockerのコンテナやKubernetesのポッドなどの1区画を1ユーザに対して割り当てることで、その要件に耐えられるようになっています。

ユーザ認証機能

PAMAuthenticatorという、一般的なLinuxに実装されている共通認証機構を使ったログインをそのまま利用しました。こちらも、LDAPやOAuth(GoogleやGitHubなど)に対応するなど、さまざまな認証機構を用いることができるようになっています。

JupyterHubの導入効果

昨年度はJupyterLabの環境を、社内で貸与しているWindows端末に対して、ハンズオンの一部の時間を用いて構築してもらいました。それにより、研修の実施に影響する以下の課題がありました。

  • ラックでは、受講者によっては導入可能なアプリケーション等の制約があるケースもあり、その対応に手間がかかる。
  • 導入時において、パッケージマネージャによるインストールがスムーズにいかないことがたびたびあり、発生すると大きく時間が取られる。

しかし、JupyterHubを導入することで、初期導入とユーザ登録を研修開始日までに行えばよい状況となったため、研修の実施に大きな影響を及ぼさなくなったのは非常に大きなメリットでした。

JupyterHubを導入するときの注意点

メリットは確かにありますが、当然ながら注意する点もあります。今回の研修で特に強く実感したところは、人数分のCPUをしっかり確保する必要があるという点です。

ログインが集中したり、少し長めの計算を同時に複数の人間が行ったりしただけでCPUの待ちが生じてしまい、場合によってはサービスごと落ちてしまいます。そのため、仮想マシンであればCPU数、物理マシンであればコア数の割り当てを適切な量だけ確保する必要が生じます。

来年度もJupyterHubによる研修環境を提供する場合は、そのあたりも含めたプランニングを適切に行いたいと思っています。

環境面の変化

世間のとりまく環境についても、昨年度と大きく変化し、それが研修に対する変化ももたらしました。

具体的には以下の2点になります。

  • 対面とリモートによるハイブリッド開催へと移行
  • ChatGPTをはじめとした生成AIが非常に一般層にも受け入れられている

対面とリモートによるハイブリッド開催へと移行

昨年度はまだコロナ禍の影響が残る状況下だったので、完全リモートによる開催でしたが、今年度は対面で開催しました。

ChatGPTをはじめとした生成AIが非常に一般層にも受け入れられている

学校のカリキュラムにAI関連の科目が組み込まれていたり、研究の手法として定着していたりする側面は、今年度も非常に強く感じました。

ラックには「LACGAI」という、ChatGPTのようなAzure OpenAI Service上に構築した対話型AIアシスタントを使える環境があります。今回の受講生は、ChatGPTを含めたこのような環境にある程度触れており、どのような挙動をするかを、おおまかではあるものの理解していました。

質問内容 2022年度 2023年度
AIに関する基礎研究をしていた 3人 2人
AIに関する基礎理論は知っている 8人 11人
AI開発で用いるアルゴリズムを使って分析したことはある 23人 25人
AIそのものをまったく知らない 23人 20人
入社時のAIに対する既習度合いについてのアンケート結果

また、ChatGPTに関連するアンケートをとったので、結果を以下にまとめました。AIは一部の学生のみが触れるものではなく、一般層の学生も利活用者として使い始めていると見て取ることができ、昨年度とは状況が大きく異なっていると強く感じます。

質問内容 人数
ChatGPTをこれから活用してみたい。 29人
ChatGPTには興味があるものの、活用方法が今ひとつ見えないので、なんらかの情報が得られる機会が欲しい。 21人
LACGAIへのコントリビュートを含めた社内活動に興味がある/参加してみたいと思っている。 11人
ChatGPTを活用したプロジェクトに興味があるので、機会があれば関わってみたい/関われるかの相談を上長にしたい。 5人
ChatGPT(LACGAI含む)に関するアンケート結果
LACGAIの画面イメージ
LACGAIの画面イメージ:ChatGPTに類似したインターフェースを備える。

変化がもたらしたもの

私の感覚ではありますが、上記の環境の変化は大きなプラスの変化をもたらしたと思います。昨年までは抽象的な説明になりがちであった講義内容においても、生成AIを交えた例を用いることで、理解が早まるような感覚が得られました。

また、リモートではその反応も感じることができなかったのですが、対面だとダイレクトに反応を感じられたのは非常に大きなメリットでした。そして対面だと、講師には質問しにくいけれど、近くにいる同期には質問しやすい点を知れたのは、講師として非常に得るものがありました。

さいごに

今回の研修から得られた知見を確実に次の研修に盛り込むために、さっそくコンテンツの追加・変更を行いました。さらに、世間的にはpandas 2系やLightGBM 4系が取り扱われるようになってきているのでその対応も行い、最新の状況への追随も併せて進めていきたいと思います。

ラックでは今後も、AI人材の発掘や育成をふまえた研修を継続していきます。その一環として、従来の研修に改良を加えて、ラックの強みである異常検知に関連するコンテンツの提供も併せて取り組むことで、さらなる効率的な育成プランの構築に取り組んでまいります。

この記事は役に立ちましたか?

はい いいえ

関連記事

LAC WATCH

関連記事をご紹介します

  • AI開発が新たなコミュニケーションの種となる~社内向けAI開発研修を開催しました

  • 生成AIはプログラミングやシステム開発をどう変えていくのか?ラックの社内イベントをレポート

  • ラックでの生成AI活用の最前線~組織横断の推進チームが目指す企業での活用とは