SMILES-X

SMILES-Xは、分子のSMILESのみを入力として物理化学的性質、例えば溶解度や水和自由エネルギー、リポフィリシティなどの特性を予測するための自動パイプラインである。このツールは、人間が設計した記述子を必要とせず、特に小さなデータセット(<< 1000 サンプル)に特化して設計されている。ユーザーは、ベイズ最適化を通じて特定のニューラルアーキテクチャを設計したり、設計されたモデルのアンサンブルに基づいてSMILESのリストの分子特性を予測したり、特性に関連する顕著な要素やサブストラクチャを視覚化することで予測を解釈することが可能である。

事例一覧

SMILES-X: 小規模データセットに対する分子化合物特性評価手法

図1: 自然言語処理とSMILES-X 研究のポイント(着眼点) 文字列を計算機で扱う事は自然言語処理という分野で盛んに実施されている。一方、有機化合物を文字列で表すSMILES記法と呼ばれる方法がある。 本事例では、S続きを読む