ジョブメドレーアカデミーにおけるLLM活用事例 — Dify導入・解説自動生成・動画翻訳の実装

こんにちは。ジョブメドレーアカデミーの開発を担当している牧野です。

今回は、私が担当しているプロダクト「ジョブメドレーアカデミー」において、直近取り組んだLLM(大規模言語モデル)の活用事例について紹介します。

開発プロセスの効率化だけでなく、プロダクトの「機能」としてどのようにAIを組み込み、実際のビジネス課題(コスト削減や多言語対応)を解決しているかという点にフォーカスしてお話しできればと思います。

ジョブメドレーアカデミーとAI活用の背景

「ジョブメドレーアカデミー」は、介護や障がい福祉、在宅医療などの各業種に特化したオンライン動画研修サービスです。

実は、アカデミーにおけるAI活用は今回が初めてではありません。2023年には「研修作成アシスタント」という機能をリリースしており、Azure OpenAIを活用して研修作成業務の作業時間を約75%削減するという成果を上げていました。

今回はそこからさらに領域を広げ、直近で取り組んだ3つの具体的なAI活用事例をご紹介します。

  1. Difyを用いたAIチャットボットの設置
  2. 講義動画のリアルタイム多言語字幕
  3. 国家試験過去問解説のAI生成と多言語化

1. Difyを用いたAIチャットボットの設置

まずは、プロダクト内へのAIチャットボット設置の事例です。

背景:カスタマーサポートコストの増大

ユーザー数の増加に伴い、カスタマーサポートへの問い合わせも増え続けており、サポートコストの増大が課題となっていました。よくある質問に自動で回答できるチャットボットを導入することで、この課題を解決することを目指しました。

実装:社内テンプレート活用とプロダクト固有の調整

今回のチャットボット導入にあたっては、ゼロベースでの技術選定というよりも、社内の技術資産を有効活用するアプローチを取りました。

当時、別部署であるCTO室が「様々なプロダクトで汎用的に活用できるチャットボットのテンプレート」をDifyを用いて開発しており、我々アカデミーチームもちょうどチャットボット機能の導入を検討していたタイミングだったため、このテンプレートを活用させてもらう形で進めることにしました。

Difyのテンプレート自体は用意されていましたが、実際にプロダクト(本番環境)に組み込んで提供するのはジョブメドレーアカデミーが初の事例でした。そのため、単にテンプレートを適用するだけでなく、プロダクト固有の課題に対して試行錯誤しながら実装を進めました。

特に注力したのは以下の点です。

  • Difyのフロー・プロンプト調整: AIが一般的なSaaSの情報を回答してしまう傾向があったため、アカデミー固有の情報を正しく返すようにDifyのフローとプロンプトを調整しました。
  • 回答精度の定量評価: AIの回答精度を定量的に評価する仕組みを構築しました。別のLLMを評価者として活用する「LLM-as-a-judge」の手法を用いることで、継続的な品質モニタリングが可能になっています。これにより、今後ナレッジを追加した際やAIモデルを変更した際にも、スムーズに精度の検証が行えるようになりました。

成果

結果として、フルスクラッチでRAG基盤を構築する工数を大幅に削減しつつ、スピーディーに機能をユーザーへ届けることができました。現在は月間で300件以上の質問に回答しており、ユーザーサポートの一助となっています。

また、実装してみての大きな収穫として、「お客様がアカデミー上のどこで困っているかが、ログを通じて明確になった」 という副次的な効果がありました。

これまではお問い合わせとして上がってこなければ気づけなかった些細なつまずきも、チャットボットの対話ログを見ることで把握できるようになりました。このログは、今後のUI改善や機能開発における貴重なインサイトとして活用できると考えています。

DifyベースのAIチャットボット UIイメージ

DifyベースのAIチャットボット UIイメージ

2. 講義動画のリアルタイム多言語字幕

2つ目の事例は、動画学習サービスならではの取り組みである「講義動画の多言語字幕化」です。

背景:多言語対応の課題

メドレーは 「医療ヘルスケアの未来をつくる」 をミッションに掲げていますが、その実現には、現場で働く人々が最大限に力を発揮できる環境が不可欠です。

現在、介護現場では外国人材が急増しており、現場の戦力として定着していただくためにも、多言語での研修ニーズは非常に高まっています。

アカデミーには以前から多言語オプション自体は存在していたのですが、従来は 「多言語用に個別に動画を作成・編集する」 という手法をとっていました。そのため制作コストが非常に高く、結果として多言語対応できる動画の本数が限られてしまうという課題がありました。

このボトルネックを解消し、既存の日本語動画資産を活かしたまま、低コストで大量の動画を多言語化するために、今回新たな仕組みを構築しました。

実装:AIと人によるハイブリッド処理

具体的には、以下の3ステップで処理を行う内製システムを開発しました。

  • Step1: AIによる文字起こしと修正提案の生成
  • Step2: 人によるレビュー・修正
  • Step3: 多言語への展開

Step 1: AIによる文字起こしと修正提案の生成

まず、動画から音声を抽出し、テキスト化する工程です。ここでは精度とコストのバランスを最適化するため、役割の異なる2つのGeminiモデルを組み合わせてバッチ処理しています。

  1. 文字起こし・タイムコードの作成 (Gemini Pro) : 医療・介護用語を含む音声を高精度にテキスト化し、タイムコードを作成する。
  2. 修正提案の生成 (Gemini Flash) : 生成されたテキストやタイムコードに対し、文脈に基づく修正提案のデータを生成する。

Step 2: 人によるレビュー・修正

AIの出力精度は向上していますが、学習教材としての品質を保証するためには人の目が不可欠です。

そこで、動画と字幕を同期再生しながら効率的に編集できるWebアプリケーションを開発しました。 社内運用ツールであるため、とにかく「早く」「簡単に」作れることを最優先しました。セットアップが高速で手軽な BunReact を使ってサクッと実装し、AWS Amplify でデプロイすることで、すぐにレビュアーが触れる環境を用意しました。

AIの出力を人が最終確認・修正するこの手法は 「Human-in-the-loop(人が介入するループ)」 と呼ばれ、AI活用において品質を担保する重要なパターンです。

画面上には、Step 1でAIが提案した「修正提案」が表示され、レビュアーはそれを参考にしながら効率的に全体を確認できるようになっています。

字幕編集Webアプリのスクリーンショット 字幕編集Webアプリ

Step 3: 多言語への展開

修正が完了した日本語字幕を、ベトナム語、インドネシア語、ミャンマー語、タガログ語、ヒンディー語、タイ語、英語、ネパール語、中国語の9言語へ一括変換します。

ここでも単に翻訳APIに投げるのではなく、「翻訳用日本語への整形(フィラー除去や主語の補完)」 という前処理を挟むことで、翻訳エンジンの精度を最大限に引き出す工夫を取り入れています。

成果

従来のやり方では、1動画1言語あたり合計45分〜1時間半程度かかっていました。しかし、このシステムにより、1動画あたり10分程度で、一度に全ての言語(9言語)への翻訳が完了するようになりました。

これにより、動画1本あたりの多言語化コストを劇的に圧縮しつつ、質の高い多言語研修コンテンツをスピーディーに提供する基盤が整いました。

字幕表示のスクリーンショット 字幕表示

3. 国家試験過去問解説のAI生成と多言語化

3つ目は、介護福祉士国家試験の過去問解説における活用です。

背景:さらなるAI活用領域の探索

アカデミーではAIの活用を積極的に推進しており、過去問解説の作成も「AIを活用できる領域」として注目しました。従来は講師の方がゼロから執筆していましたが、AIをうまく活用することでさらなる効率化を図れる可能性があると考えました。

実装:AI生成+講師監修によるフロー

AIが解説のたたき台を作成し、講師がそれを監修するというフローへ変更しました。解説生成にあたっては、より高い専門性を担保するためGemini Deep Researchを活用しました。

その結果、当初の想定よりも生成精度が高くなり、監修プロセスを経ても大幅な修正は必要なく補足情報を加える程度で済みました。

ただし、AI特有の弱みも見えてきました。解説の内容自体は正しくても、法律や制度の正式名称ではなく「俗称」を使ってしまうことがありました。国家試験の解説では用語の厳密さが求められるため、最後に必ず専門家(講師)がチェックを行う Human-in-the-loop の体制が重要です。

今後は、こうした用語の厳密性についてもプロンプトに明示的に含めることで、さらなる精度向上を目指します。

成果

この「AI+監修」フローへの移行により、講師の作業時間を大幅に削減しつつ品質を維持できるようになり、解説制作の生産性向上とコスト削減を実現しました。

AIが生成した国家試験解説の多言語化画面 AIが生成した国家試験解説の多言語化画面

おわりに

今回の取り組みを通じて、プロダクトに「機能」としてAIを組み込む際の勘所が見えてきました。

Difyのようなノーコード/ローコードツールを柔軟に取り入れたり、AIの特性(弱み)を理解した上で「AI+監修」という現実的なオペレーションを設計したりすることで、「形だけのAI導入」ではなく、具体的なビジネスインパクト(コスト削減や多言語対応)を生む開発ができたと感じています。

医療ヘルスケア領域には、まだテクノロジーで解決できる課題が山積しています。 今後も新しい技術を適切に取り入れながら、ユーザーにとって価値のあるプロダクト開発を続けていきたいと思います。

We’re hiring!

メドレーではエンジニアを積極採用中です! メドレーでは、プロダクトエンジニアをはじめ「医療ヘルスケアの未来」を共に創っていくエンジニアを大募集中です!少しでもご興味をお持ちいただけましたらぜひ、ご応募お待ちしております!

※カジュアル面談も大歓迎です!ご希望の際は、「その他の項目(希望記入欄)」にてその旨をご記載ください。