歐億代理:_浙大侯廷軍課題組在Journal of Medicinal Chemistry報道針對機器學習打分函數開發的無偏數據集構建方法

作者比較了TocoDecoy、傳統數據集DUD-E以及適用於機器學習打分函數評價的無隱藏偏差數據集LIT-PCBA。和另外兩個數據集相比,TocoDecoy表現相當或更少的隱藏偏差。在模擬虛擬篩選實驗中,在不同數據集上訓練的模型的預測精度排名為:LIT-PCBA≈TocoDecoy>DUD-E。儘管基於TocoDecoy訓練的模型與基於LIT-PCBA訓練的模型性能相當,但TocoDecoy數據集具有更好的可擴展性。結果表明,TocoDecoy是一種更為合理的數據集構建方法,有望幫助相關領域的研究人員更好地對機器學習打分函數進行測評和訓練。,

共有 0 条评论

Top