CrabNet

CrabNet(Compositionally-Restricted Attention-Based Network)は、組成式に基づく材料物性予測に特化したオープンソースのTransformerモデルである。自然言語処理で使われる注意機構を材料組成に適用し、化学式を元素分布行列として表現して学習することで、特徴量設計を最小限にして回帰モデルを構築できる。

基本情報

公式サイト https://crabnet.readthedocs.io
公開度 ★★★
ライセンス

MIT License

開発者

開発者: 初期の著者はAnthony Wang、Steven K. Kauwe、Ryan J. Murdock、Taylor D. Sparksである。現在のリファクタ版は、University of UtahのMaterials Data & Informaticsグループ(Sterling Bairdら)により維持されている。

関連論文
  1. Anthony Yu-Tung Wang, Steven K. Kauwe, Ryan J. Murdock, Taylor D. Sparks, “Compositionally restricted attention-based network for materials property predictions,” npj Computational Materials 7, 77 (2021). doi:10.1038/s41524-021-00545-1
  2. Sterling G. Baird et al., “Extendable composition-driven materials modeling with CrabNet,” MRS Communications 12, 1081–1089 (2022). doi:10.1557/s43579-022-00211-6
その他

説明: CrabNetはPyTorch実装を基盤とし、scikit-learnに近いfit/predict形式のAPIを提供する。入力はformulatarget列を含むpandas DataFrameであり、必要に応じてextendfeaturesでプロセス変数などの追加特徴量を扱える。ドキュメントにはデータ読み込み、学習、推論、不確かさ推定、可視化などの例が含まれ、MatDaCsの記事において注意モデルと記述子ベース手法(Matminer/DScribe)を比較するための参照実装となる。