創薬の成功率は数万分の1と言われるほど低く、生産性の向上が求められている。関西医科大学などの研究グループは、人工知能(AI)の活用により、新規の活性化合物を効率的に見つける方法を見出した。AIに学習させるデータとして、生物活性を示さない負例の割合を1000倍増やすと、誤分類が100分の1にまで低下。従来法との比較により、新しい化合物が抽出できることも同時に明らかにした。AIの精度向上でAIを活用した創薬への幅広い応用が期待できる。
この研究成果を発表したのは、関西医科大附属生命医学研究所分子遺伝学部門の木梨達雄助教、摂南大薬学部化学系薬学部門の表 雅章教授、河合健太郎准教授ら研究チーム。創薬研究でのAI活用について検討し、活性化合物を効率的に見つけるためには、生物活性を示す化合物だけでなく、生物活性を示さない化合物もAIの学習に重要であることを明らかにした。
ただ捨てられていた「失敗データ」
創薬の成功確率は低く、生産性の向上が求められている。ここ数年では、AIの活用による化合物探索の効率化が試みられており、ディープラーニング(深層学習)をはじめとした多くの方法論が提案されているが、AIの学習データに着目した研究は、ほとんど行われてなかった。
また、一般の創薬手法で用いられる「High Throughput Screening (HTS)」ではヒット率が0.1%以下にとどまると言われている。これまでの創薬では数少ないHit化合物のみに着目し、数多く得られる〝失敗したデータ〟群については十分に活用されておらず、ただ捨てられるだけとなっているのが現状。
関西医科大と摂南大の研究チームは、この創薬分野におけるデータの特徴、すなわち化合物の大部分が活性を示さないという特徴に着目。AIの学習で、活性を示す化合物(正例)に対して、活性を示さない化合物データ(負例)の割合を1000倍増やすと、AIの誤分類が100分の1以下になり、識別能力が格段に向上した。
この知見を利用することで、より少ない検証回数や薬剤リソースでスクリーニングを行うことが可能となり、創薬研究における大幅なコストダウンに繋がる幅広い応用が期待できる。