挑战题 #1

收集并标准化化学反应数据,包括反应物、生成物、试剂以及其他条件数据。
- 化学反应数据标准化一直是一个挑战,因为有机化学反应类型多、大家记录方式也不尽相同。比如说催化剂钯碳就有不同的规格,有干有湿,又比如有些试剂、溶剂本身参与反应提供原子,有些则不参与。
- 同时推荐使用自然语言处理技术对反应步骤信息数据挖掘。


挑战题 #2

使用AI技术结合图谱数据预测反应副产物。
- 算法能够根据反应信息(即反应物、生成物、条件等数据)预测可能的副产物。
- 算法能够解析图谱数据,比如 LCMS、氢谱等。(可使用一些公开数据集,如 https://gnps.ucsd.edu/ProteoSAFe/static/gnps-splash.jsp


挑战题 #3

使用AI 技术预测反应可行性。
- 可以使用些公开的反应数据作为训练集,如美国专利数据。Chemical reactions from US patents (1976-Sep2016)
- 算法能够生成一些负例用于模型的训练或者验证。
- 可以融合量子化学的手段,比如在AI模型中结合量化描述符(如静电势、福井函数等)来辅助预测等多类形式。