高等教育における機械学習
高学歴が多い現在、各機関はプロセスの不可欠な部分としてデータと分析を使用しています。 目標が、学生生活における問題点を特定してより適切にサポートすること、より効率的にリソースを割り当てること、または学生と教員のエクスペリエンスを向上させることであるかどうかにかかわらず、教育機関はデータに裏付けされたソリューションの利点を認識しています。
この記事は、Claudio Brasca、Nikhil Kaithwal、Charug Krishnan、Monatrice Lam、Jonathan Law、Varun Marya による共同作業であり、マッキンゼーの公共および社会部門の実務からの見解を表しています。
この傾向の最前線に立つ人々は、分析を利用してプログラムのパーソナライズと柔軟性を高めるだけでなく、中退の危険がある学生を特定し、カスタマイズされた介入で積極的に手を差し伸べることによって定着率を向上させることに重点を置いています。 実際、データ サイエンスと機械学習は、より多くの学生のアクセス、学生の関与と満足度を向上させるための最も効果の高い機会にリソースを確実に集中させることで、大学にとって大きな価値を生み出す可能性があります。
たとえば、ユタ州のウェスタン ガバナーズ大学は予測モデリングを使用して、リスクにさらされている学生を特定し、早期介入プログラムを開発することで定着率を向上させています。 初期の取り組みにより、同大学の 4 年間の学部プログラムの卒業率は 2018 年から 2020 年の間に 5 パーセント上昇しました。1「オンデマンドで利用可能: データ分析と AI への統一されたアプローチで学生の成功を向上」、Databricks、2021 年 12 月にアクセス。 「卒業率について」ウェスタンガバナーズ大学、2021年12月2日。
しかし、高等教育はまだデータ機能構築の初期段階にあります。 大学は多くの課題(財政的圧力、人口動態の崖、学生のメンタルヘルス問題の増加など)とさまざまな機会(成人学習者へのリーチやオンライン学習の拡大など)に直面しているため、高度な分析と機械学習の利用が拡大する可能性があります。有益であることが証明されます。
以下では、高等教育における高度な分析の最も有望なユースケースのいくつかを紹介し、大学がこれらの機会をどのように活用して現在の課題を克服し、より多くの学生のアクセスを可能にし、学生エクスペリエンスを向上させているかを示します。
データ サイエンスと機械学習は、より多くの学生のアクセスと学生の関与と満足度を向上させるための最も効果の高い機会にリソースを確実に集中させることで、大学にとって大きな価値を引き出す可能性があります。
高度な分析技術は、教育機関が学生集団に関する非常に深い洞察を解き放ち、線形でルールベースのアプローチに依存する記述的分析や診断分析では達成できないより微妙なリスクを特定するのに役立つ可能性があります (図 1)。
勾配ブースティングやランダム フォレストなどのアルゴリズムの力を利用した高度な分析は、教育機関がリスクのある学生を特定する既存の方法における不注意なバイアスに対処し、特定されたリスクの大部分を軽減するための個別の介入を積極的に設計するのにも役立ちます。
たとえば、線形のルールベースのアプローチを使用している教育機関は、成績の低下や出席状況の悪さなどの指標を調べて、中退の危険がある学生を特定します。 その後、教育機関はこれらの学生に連絡を取り、彼らをより良くサポートするための取り組みを開始します。 このような取り組みは役立つかもしれませんが、多くの場合、実施が遅すぎ、リスクのある人口の一部のみを対象としています。 このアプローチは、大学の学生成功リーダーが直面している 2 つの問題に対する、その場しのぎの優れた解決策となる可能性があります。 まず、離職のリスクを示すために分析できる変数が多すぎます (学業、経済、メンタルヘルスの要因、キャンパスへの帰属意識など)。 第 2 に、1 つまたは 2 つの変数の顕著な分散を特定するのは簡単ですが、複数の変数の名目上の分散を特定するのは困難です。 したがって、直線的でルールに基づいたアプローチでは、たとえば、そこそこの成績と平均以上の出席率を持っているにもかかわらず、期限までに課題を提出するのに苦労している生徒や、請求書の支払いが一貫して困難になっている生徒を特定できない可能性があります(図表 2)。
機械学習モデルは、上記の両方の課題に対処できる可能性があります。 このようなモデルは、10 年間のデータを調べて、大学が学生の減少リスクを早期に判断するのに役立つ可能性のある要因を特定します。 たとえば、学生は大学ポータルで支払い方法を変更しましたか? 学生は締切日のどれくらい近くに課題を提出しますか? 教育機関は、危険にさらされている学生を特定すると、彼らを引き留めるための介入を積極的に展開できます。
多くの教育機関は、学生とのコミュニケーションをパーソナライズし、定着率を高め、学生体験とエンゲージメントを向上させるための分析の可能性を認識していますが、これらのアプローチを、将来の学生、現在、そして元の学生の進路全体にわたるあらゆるユースケースに使用できる可能性があります。学生も同様です。
たとえば、高度な分析により、教育機関は、その教育機関に最適である可能性が最も高い入学希望者にアプローチするために、どの高校、郵便番号、郡に焦点を当てるべきかを特定することができます。 機械学習は、学生の満足度を測定して向上させるために、登録された学生のさまざまな原型に提供すべき介入やサポートを特定するのにも役立ちます。 これらのユースケースは、卒業後のスキル開発を学生にサポートすることにも拡張でき、教育機関が継続的な学習の機会を提供し、卒業生との関わりを強化できるようになります。 教育機関が学生のライフサイクル全体にわたって高度な分析ツールの適用範囲と適用範囲を拡大するにつれて、モデルのパターン識別が向上し、教育機関はより詳細な介入とアクションを実行できるようになります。
教育機関は、学生により良いサービスを提供するために、機械学習を活用するためにマルチステップ モデルを採用したいと考えるでしょう。 たとえば、学生の修了率と卒業率の向上を目的とした取り組みの場合、次の 5 段階のテクニックが計り知れない価値を生み出す可能性があります。
教育機関はこのモデルを定期的に導入して、追加のサポートから最も恩恵を受ける学生を特定できます。
教育機関は、リードの発掘や登録など、他の戦略的目標や課題に対処するために同様のモデルを作成することもできます。 たとえば、教育機関は最初のステップとして、長年にわたる履歴データから 100 以上の属性を分析して、登録する可能性が最も高い申請者の特徴を理解することができます。
教育機関は、学生により良いサービスを提供するために、機械学習を活用するためにマルチステップ モデルを採用したいと考えるでしょう。
入学者数と定着率を向上させるために高度な分析に頼った 2 つの高等教育機関の経験から、そのような取り組みが与える影響が明らかになりました。
ある私立非営利大学は最近、史上最大の新入生クラスを入学させ、再び入学者数を増やそうとしていました。 この教育機関は、投資とリソースを大幅に増やすことなく、入学チームが管理可能な方法で、教育機関に最適な、より多くの入学予定の学部 1 年生学生にリーチすることと、入学までの過程でのコンバージョンを向上させることの両方を望んでいました。 大学は次の 3 つの重要な措置を講じました。
この機関にとって、高度な分析モデリングは即時に意味と影響を及ぼしました。 この取り組みは、大学がマーケティング効率を高めてより多くの新入生にサービスを提供できる将来の機会も示唆しました。 最初に次の秋 (申請締め切り前) のリードに対してテストしたところ、このモデルは申請を提出した受験者の 85% を正確に予測し、サイクルのその時点で登録する可能性が最も高い申請者の 35% を予測しました。 、入学基準に変更がないことを前提としています(図表3)。 登録管理チームは、潜在的な見込み客や応募者にリソースと時間をより適切に優先順位付けして、大規模なクラスを獲得できるようになりました。 これらの新しい機能により、教育機関は戦略的な選択を行う柔軟性が得られます。 入学するクラスの規模に主に焦点を当てるのではなく、クラスの組み合わせ、財政援助の配分、または予算の節約などの他の目標を優先しながら、望ましいクラスの規模を確保する可能性があります。
パンデミック中の多くの高等教育機関と同様に、2「持続性と定着率」、National Student Clearinghouse Research Center、2021 年 7 月 8 日。あるオンライン大学は学生定着率の大幅な低下傾向に直面していました。 大学は複数の選択肢を検討し、フォーカス グループやナッジ キャンペーンなど、学務部門と管理部門の両方が主導する取り組みを展開しましたが、結果は期待を下回りました。
この教育機関は、学生の成功に高いハードルを設定し、定着率の顕著かつ持続的な改善を達成したいと考えていました。 同社は、その大胆な目標を追求するために、高度な分析アプローチに目を向けました。
大学が減少のリスクにさらされている学生を早期に特定できる機械学習モデルを構築するために、大学はまず 10 年間の履歴データを分析し、継続する可能性が最も高く、したがって卒業する可能性が最も高い学生を他の学生と比較して区別する主要な特徴を理解しました。登録を解除した人。 初期モデルがベースラインよりも定着率の予測において数倍効果的であることを検証した後、教育機関はモデルを改良し、現在の学生集団に適用しました。 この減少モデルにより、5 つの危険にさらされている学生の原型が得られ、そのうちの 3 つは、典型的な危険にさらされている学生のプロファイルがどのようなものであるかについての従来の通念に反していました (図表 4)。
これら 3 つの直観に反する危険な学生の原型(線形分析アプローチを使用すれば除外されるはず)を合わせると、入学を中止する可能性が最も高い学生の約 70 パーセントを占めます。 リスクにさらされている人の最大のグループ(特定されたリスクにさらされている学生の約 40 パーセントを占める)は、総合的に優れた成績を収めた、際立った学業成績の持ち主でした。 これは、線形ルールに基づいたモデルに比べて、このモデルでは、減少のリスクにさらされている学生の数が少なくとも 2 倍特定されたことを意味します。 モデルの成果により、大学は減少のリスクにさらされている学生をより効果的に特定し、定着率の向上を促進する可能性が最も高い短期および中期の取り組みに戦略的に投資できるようになりました。
リスクにさらされている学生のプロフィールに関するモデルとデータを入手したこのオンライン大学は、定着率を高めるために各原型の学生に合わせたサポートを提供することに重点を置いた一連の対象を絞った介入を開始しました。 対策には、学業アドバイザーやキャリアアドバイザーとのより多くのタッチポイントをスケジュールすること、教員による指導を拡大すること、学生が知識のギャップを埋めるための代替経路を作成することが含まれます。
高度な分析は、高等教育機関が今日直面している課題を克服し、成長を促進し、学生をより適切にサポートできる強力なツールです。 ただし、機械学習は複雑であり、それに伴うかなりのリスクが伴います。 リスクは機関やモデルに含まれるデータによって異なりますが、高等教育機関はこれらのツールを使用する際に次の手順を実行することをお勧めします。
多くの高等教育機関がデータと分析の活用に向けた取り組みを始めていますが、学生体験の観点からこれらの機能の可能性を最大限に発揮するにはまだ長い道のりがあります。 過去 2 年間にオンライン学習やテクノロジー ツールの使用に取り組んできた学生や教育機関が流入したことは、これまでよりもはるかに多くのデータを扱う必要があることを意味します。 高等教育機関は、今後数年間で学生により良いサービスを提供するためにこれを使い始めたいと考えるかもしれません。
クラウディオ・ブラスカマッキンゼーのサンフランシスコオフィスのパートナーです。ヴァルン・マリアシニアパートナーです。ニキル・カイスワルロンドンオフィスのアソシエイトパートナーです。チャラグ・クリシュナンニュージャージー・サミット事務局のパートナーです。モナトリス・ラムベイエリアとシリコンバレーのオフィスのコンサルタントであり、ジョナサン・ローは南カリフォルニアオフィスのシニアパートナーです。
著者らは、この記事への貢献について、Inès Garceau-Aranda、Emily Cohen、Katie Owen、Xiaowo Sun、Xuecong Sun、および Shyla Ziade に感謝の意を表します。
多くの高等教育を受けたクラウディオ・ブラスカ・ヴァルン・マリア・ニキル・カイスワル・チャラグ・クリシュナン・モナトリス・ラム・ジョナサン・ロー