オープンソースツール・データセット

実装に手を動かしながら学びたい読者のために、入手しやすいオープンソースツールと公開データセットを集めました。プロトタイピングや授業での演習、卒研テーマの足場づくりに役立ててください。

知的学習支援システム開発フレームワーク

CTAT (Cognitive Tutor Authoring Tools)

  • 開発:Carnegie Mellon University
  • URLhttps://ctat.pact.cs.cmu.edu/
  • 特徴:モデルトレーシング型 ITS および Example-Tracing Tutor を構築するためのツールセットです。GUI 上でプロダクションルールや例示トレースを定義できます。
  • ライセンス:教育・研究目的では無料で利用できます。

AutoTutor

  • 開発:University of Memphis
  • URLhttp://www.autotutor.org/
  • 特徴:対話的 ITS のプラットフォームで、自然言語対話による学習支援を行います。
  • 応用例:物理、コンピュータリテラシー、批判的思考などで利用されてきました。

Open edX

  • URLhttps://open.edx.org/
  • 特徴:MOOC プラットフォームです。Open Analytics Insights など Learning Analytics 関連機能を備えています。
  • ライセンス:AGPLv3(オープンソース)です。

学習分析ツール

PSLC DataShop

  • URLhttps://pslcdatashop.web.cmu.edu/
  • 特徴:学習曲線分析や知識トレーシングなどの分析ツールが揃っており、大規模データセットも公開されています。

pyBKT / pyAFM

  • URLhttps://github.com/CAHLR/pyBKT
  • 特徴:Bayesian Knowledge Tracing の Python 実装(pyBKT)と、Additive Factor Model の Python 実装(pyAFM)です。学習者モデル研究で広く使われています。

EduMiningPy(汎用 EDM ツールキット)

  • 特徴:EDM 分野では scikit-learn や PyTorch を組み合わせたワークフローが標準化しつつあります。専用パッケージとしては上記 pyBKT のほか、edm2 系コミュニティリポジトリも参考になります。

オントロジー開発ツール

Protégé

  • 開発:Stanford University
  • URLhttps://protege.stanford.edu/
  • 特徴:OWL オントロジーを視覚的に構築・編集できるツールです。HermiT などの推論エンジンと連携できます。
  • ライセンス:オープンソース(BSD ライセンス)です。

主要なデータセット

EdNet

  • URLhttps://github.com/riiid/ednet
  • 特徴:韓国の英語学習プラットフォーム Santa TOEIC のデータです。1.3 億件以上の学習記録が収録されています。
  • 応用:知識トレーシングや推薦システム研究で広く使われています。

ASSISTments Dataset

  • URLhttps://sites.google.com/site/assistmentsdata/
  • 特徴:数学学習のデータセットで、学習者の応答、ヒント使用、所要時間などが含まれます。
  • 応用:学習者モデリングや適応的支援の研究に向いています。

Cognitive Atlas

これらのツール・データセットを活用すると、研究や開発の立ち上がりがぐっと速くなります。まずは小さなプロトタイプを動かしてみるところから始めてみてください。