Репозиторий к докладу "Физическое информирование фундаментальных языковых моделей в химии через многозадачную регрессию"
Содержимое репозитория
train_model.py: скрипт обучения модели, гиперпараметры обучения задаются в параметрах скриптаtest_model.py: скрипт валидации модели, тестирующий модель на заданных бенчмаркахmodels/:models/model_mtr_{x}_mlm_{y}.pth: чекпоинт с весами одной из 15 моделей где числаxиyсоотносятся весам MTR и MLM функций потерь соответственно
support/:support/*.csv: файлы с датасетами для тестирования моделейsupport/normalization_params.pth: нормализационные параметры для rdkit дескрипторовsupport/smiles_10k.txt: пример датасета (первые 640k молекул из ZINC20)
Model tree for timcryt/chemberta-3-phinformed
Base model
DeepChem/ChemBERTa-10M-MLM