図1: 自然言語処理とSMILES-X 研究のポイント(着眼点) 文字列を計算機で扱う事は自然言語処理という分野で盛んに実施されている。一方、有機化合物を文字列で表すSMILES記法と呼ばれる方法がある。 本事例では、S…続きを読む
SMILES-X
SMILES-Xは、分子のSMILESのみを入力として物理化学的性質、例えば溶解度や水和自由エネルギー、リポフィリシティなどの特性を予測するための自動パイプラインである。このツールは、人間が設計した記述子を必要とせず、特に小さなデータセット(<< 1000 サンプル)に特化して設計されている。ユーザーは、ベイズ最適化を通じて特定のニューラルアーキテクチャを設計したり、設計されたモデルのアンサンブルに基づいてSMILESのリストの分子特性を予測したり、特性に関連する顕著な要素やサブストラクチャを視覚化することで予測を解釈することが可能である。