InnopolisUni
diff --git a/‎config/callbacks/classification.yaml
+15-7 b/‎config/callbacks/classification.yaml
+15-7
diff --git a/‎config/callbacks/regression.yaml
+2 b/‎config/callbacks/regression.yaml
+2
diff --git a/‎config/clear_ml/disabled.yaml
+1 b/‎config/clear_ml/disabled.yaml
+1
diff --git a/‎config/clear_ml/enabled.yaml
+1 b/‎config/clear_ml/enabled.yaml
+1
diff --git a/‎config/clear_ml/test_queue.yaml
+1 b/‎config/clear_ml/test_queue.yaml
+1
diff --git a/‎config/datasets/bitumen.yaml
+25 b/‎config/datasets/bitumen.yaml
+25
diff --git a/‎config/datasets/bopp.yaml
+19 b/‎config/datasets/bopp.yaml
+19
diff --git a/‎config/datasets/chembl_33_smiles.yaml
+20 b/‎config/datasets/chembl_33_smiles.yaml
+20
diff --git a/‎config/datasets/classification/tox21.yaml
+35 b/‎config/datasets/classification/tox21.yaml
+35
diff --git a/‎config/datasets/mcl1_pic50.yaml
+19 b/‎config/datasets/mcl1_pic50.yaml
+19
diff --git a/‎config/datasets/pipes.yaml
+18 b/‎config/datasets/pipes.yaml
+18
diff --git a/‎config/datasets/polymers.yaml
+33 b/‎config/datasets/polymers.yaml
+33
diff --git a/‎config/datasets/qm7.yaml
+19 b/‎config/datasets/qm7.yaml
+19
diff --git a/‎config/experiments/classification/GR_140823_qweqweqw_tox21.yaml
+15 b/‎config/experiments/classification/GR_140823_qweqweqw_tox21.yaml
+15
diff --git a/‎config/experiments/regression/GR_150823_awdaawaw_catboost_regressor_pipes.yaml
+10 b/‎config/experiments/regression/GR_150823_awdaawaw_catboost_regressor_pipes.yaml
+10
diff --git a/‎config/experiments/regression/GR_150823_qwe123qw_catboost_regressor_bopp.yaml
+10 b/‎config/experiments/regression/GR_150823_qwe123qw_catboost_regressor_bopp.yaml
+10
diff --git a/‎config/experiments/regression/GR_150823_wqeqweqw_catboost_regressor_pic50.yaml
+10 b/‎config/experiments/regression/GR_150823_wqeqweqw_catboost_regressor_pic50.yaml
+10
diff --git a/‎config/experiments/regression/GR_150823_zxczxcas_catboost_regressor_bitumen.yaml
+14 b/‎config/experiments/regression/GR_150823_zxczxcas_catboost_regressor_bitumen.yaml
+14
diff --git a/‎config/experiments/regression/GR_170823_ADADasds_catboost_regressor_qm7.yaml
+10 b/‎config/experiments/regression/GR_170823_ADADasds_catboost_regressor_qm7.yaml
+10
diff --git a/‎config/experiments/regression/GR_210823_ASDZXCQW_catboost_regressor_polymers.yaml
+13 b/‎config/experiments/regression/GR_210823_ASDZXCQW_catboost_regressor_polymers.yaml
+13
diff --git a/‎config/experiments/text-vae/GR_300822_skOLIn2s_vae_chembl.yaml
+27 b/‎config/experiments/text-vae/GR_300822_skOLIn2s_vae_chembl.yaml
+27
diff --git a/‎config/losses/simple_vae.yaml
+16 b/‎config/losses/simple_vae.yaml
+16
diff --git a/‎config/models/classification/catboost_classification.yaml
+4 b/‎config/models/classification/catboost_classification.yaml
+4
@@ -1,11 +1,12 @@
-requirements:
-  task:
-    - table-classification
-  framework:
-    - xgboost
-    - sklearn
+task:
+  - table-classification
+  - qsar-classification
+framework:
+  - xgboost
+  - sklearn
+  - catboost
 
-objects:
+implementations:
   xgboost:
     accuracy:
       _target_: innofw.core.metrics.custom_metrics.metrics.Accuracy
@@ -14,6 +15,13 @@ objects:
       average: macro
 
   sklearn:
+    accuracy:
+      _target_: sklearn.metrics.accuracy_score
+    f_one:
+      _target_: sklearn.metrics.f1_score
+      average: macro
+  
+  catboost:
     accuracy:
       _target_: sklearn.metrics.accuracy_score
     f_one:
 
@@ -24,3 +24,5 @@ implementations:
       _target_: sklearn.metrics.mean_squared_error
     mae:
       _target_: sklearn.metrics.mean_absolute_error
+    r2:
+      _target_: innofw.core.metrics.custom_metrics.metrics.R2
@@ -1,2 +1,3 @@
 enable: False
 queue:
+output_uri:
@@ -1,2 +1,3 @@
 enable: True
 queue:
+output_uri:
@@ -1,2 +1,3 @@
 enable: True
 queue: test
+output_uri:
@@ -0,0 +1,25 @@
+task:
+  - table-regression
+
+name: bitumen
+description: bitumen properties
+
+markup_info: Информация о разметке
+date_time: 21.07.2022
+
+_target_: innofw.core.datamodules.pandas_datamodules.PandasDataModule
+
+
+train:
+ source: ./data/bitumen/train/train.csv
+test:
+ source: ./data/bitumen/test/test.csv
+
+val_size: 0.2
+target_col: 
+  - "Время окисления, ч"
+  - "Расход воздуха, мл/сек"
+  - "Минимальная температура окисления, °С"
+  - "Максимальная температура окисления, °С"
+  - "Количество гудрона, л"
+  - "Температура воздуха, °С"
@@ -0,0 +1,19 @@
+task:
+  - table-regression
+
+name: bopp
+description: Bopp films
+
+markup_info: Информация о разметке
+date_time: 21.07.2022
+
+_target_: innofw.core.datamodules.pandas_datamodules.PandasDataModule
+
+
+train:
+ source: ./data/bopp/train/train.csv
+test:
+ source: ./data/bopp/test/test.csv
+
+val_size: 0.2
+target_col: turbidity
@@ -0,0 +1,20 @@
+task:
+  - qsar-regression
+  - text-vae-forward
+  - text-vae
+
+name: chembl_33_smiles
+description: "Link: https://ftp.ebi.ac.uk/pub/databases/chembl/ChEMBLdb/releases/chembl_33/"
+
+markup_info: Информация о разметке
+date_time: 09.06.2023
+
+_target_: innofw.core.datamodules.lightning_datamodules.QsarSelfiesDataModule
+train:
+  source: https://api.blackhole.ai.innopolis.university/public-datasets/chembl_33_smiles/train.zip
+  target: ./data/chembl_33/train/
+test:
+  source: https://api.blackhole.ai.innopolis.university/public-datasets/chembl_33_smiles/test.zip
+  target: ./data/chembl_33/test/
+smiles_col: SMILES
+target_col: 
@@ -0,0 +1,35 @@
+task:
+  - qsar-classification
+
+name: tox21
+description: "Link: https://www.kaggle.com/competitions/house-prices-advanced-regression-techniques/data"
+
+markup_info: Информация о разметке
+date_time: 18.08.2014
+
+_target_: innofw.core.datamodules.pandas_datamodules.QsarDataModule
+###### Case: remote data #####
+train:
+  source: https://api.blackhole.ai.innopolis.university/public-datasets/tox21/train.zip
+  target: ./data/tox21/train
+test:
+  source: https://api.blackhole.ai.innopolis.university/public-datasets/tox21/test.zip
+  target: ./data/tox21/test
+
+infer:
+  source: https://api.blackhole.ai.innopolis.university/public-datasets/tox21/test.zip
+  target: ./data/tox21/test
+
+##############################
+###### Case: local data ######
+#train:
+#  source: /local/path/train.csv
+#test:
+#  source: /local/path/test.csv
+##############################
+
+
+# Available targets
+#target_col: [NR-AR,	NR-AR-LBD,	NR-AhR,	NR-Aromatase,	NR-ER,	NR-ER-LBD,	NR-PPAR-gamma,	SR-ARE,	SR-ATAD5,	SR-HSE,	SR-MMP,	SR-p53]
+smiles_col: smiles
+val_size: 0.2
@@ -0,0 +1,19 @@
+task:
+  - qsar-regression
+
+name: mcl1_pic50
+description: Preprocessed MCL1 dataset
+
+markup_info: Markap info
+date_time: 15.08.23
+
+_target_: innofw.core.datamodules.pandas_datamodules.QsarDataModule
+
+train:
+  source: ./data/mcl1_pic50/train
+test:
+  source: ./data/mcl1_pic50/test
+
+smiles_col: Clean Smiles
+target_col: pIC50
+val_size: 0.2
@@ -0,0 +1,18 @@
+task:
+  - table-regression
+
+name: pipes
+description: Sibur pipes 
+
+markup_info: Информация о разметке
+date_time: 31.08.2020
+
+_target_: innofw.core.datamodules.pandas_datamodules.PandasDataModule
+
+train:
+ source: ./data/pipes/train/train.csv
+test:
+ source: ./data/pipes/test/test.csv
+
+
+target_col: result
@@ -0,0 +1,33 @@
+task:
+  - table-regression
+
+name: polymers
+description: polymers properties
+
+markup_info: Информация о разметке
+date_time: 21.07.2022
+
+_target_: innofw.core.datamodules.pandas_datamodules.PandasDataModule
+
+
+train:
+ source: ./data/polymers/train/train.csv
+test:
+ source: ./data/polymers/test/test.csv
+
+val_size: 0.2
+target_col: 
+  - "Модуль упругости при изгибе_МПа"
+  - "Xs_ISO 16152_%"
+  - "Модуль упругости при растяжении_МПа"
+  - "Относительное удлинение при пределе текучести_%"
+  - "Относительное удлинение при разрыве_%"
+  - "Предел текучести при растяжении_МПа"
+  - "Прочность при разрыве_МПа"
+  - "Твердость по Шору_D/1"
+  - "Твердость по Шору_D/15"
+  - "Температура изгиба под нагрузкой 0,45МПа_C"
+  - "Температура размягчения по Вика, С_10Н"
+  - "Температура размягчения по Вика, С_50Н"
+  - "Ударная вязкость по Изоду с/н, 23 C_ISO 180_кДж/м2"
+  - "Ударная вязкость по Изоду с/н, 23 C_Дж/м"
@@ -0,0 +1,19 @@
+task:
+  - qsar-regression
+
+name: qm7
+description: "Link: http://quantum-machine.org/datasets/"
+
+markup_info: Информация о разметке
+date_time: 01.01.2012
+
+_target_: innofw.core.datamodules.pandas_datamodules.PandasDataModule
+
+train:
+  source: https://api.blackhole.ai.innopolis.university/public-datasets/qm7/train.zip
+  target: ./data/qm7/train
+test:
+  source: https://api.blackhole.ai.innopolis.university/public-datasets/qm7/test.zip
+  target: ./data/qm7/test
+
+target_col: target
@@ -0,0 +1,15 @@
+# @package _global_
+defaults:
+  - override /models: classification/catboost_classification
+  - override /datasets: classification/tox21
+  - override /callbacks: classification
+
+
+project: "tox21"
+task: "qsar-classification"
+random_seed: 42
+
+datasets:
+  # Available targets
+  #[NR-AR,	NR-AR-LBD,	NR-AhR,	NR-Aromatase,	NR-ER,	NR-ER-LBD,	NR-PPAR-gamma,	SR-ARE,	SR-ATAD5,	SR-HSE,	SR-MMP,	SR-p53]
+  target_col: NR-AR
@@ -0,0 +1,10 @@
+# @package _global_
+defaults:
+  - override /models: regression/catboost_regression
+  - override /datasets: pipes
+  - override /callbacks: regression
+
+
+project: "pipes"
+task: "table-regression"
+random_seed: 42
@@ -0,0 +1,10 @@
+# @package _global_
+defaults:
+  - override /models: regression/catboost_regression
+  - override /datasets: bopp
+  - override /callbacks: regression
+
+
+project: "bopp"
+task: "table-regression"
+random_seed: 42
@@ -0,0 +1,10 @@
+# @package _global_
+defaults:
+  - override /models: regression/catboost_regression
+  - override /datasets: mcl1_pic50
+  - override /callbacks: regression
+
+
+project: "mcl1_pic50"
+task: "qsar-regression"
+random_seed: 42
@@ -0,0 +1,14 @@
+# @package _global_
+defaults:
+  - override /models: regression/catboost_regression
+  - override /datasets: bitumen
+  - override /callbacks: regression
+
+
+project: "bitumen"
+task: "table-regression"
+random_seed: 42
+
+models:
+  loss_function: MultiRMSE
+  allow_const_label: true
@@ -0,0 +1,10 @@
+# @package _global_
+defaults:
+  - override /models: regression/catboost_regression
+  - override /datasets: qm7
+  - override /callbacks: regression
+
+
+project: "qm7"
+task: "table-regression"
+random_seed: 42
@@ -0,0 +1,13 @@
+# @package _global_
+defaults:
+  - override /models: regression/catboost_regression
+  - override /datasets: polymers
+  - override /callbacks: regression
+
+
+project: "polymers"
+task: "table-regression"
+random_seed: 42
+
+models:
+  loss_function: MultiRMSEWithMissingValues
@@ -0,0 +1,27 @@
+# @package _global_
+defaults:
+  - override /models: text-vae/hier_vae.py
+  - override /datasets: chembl_33_smiles
+  - override /losses: simple_vae
+
+
+project: chem-vae
+task: text-vae
+random_seed: 42
+accelerator: gpu
+devices: 1
+batch_size: 128
+epochs: 1
+num_workers: 0
+
+trainer:
+  limit_train_batches: 10
+
+datasets:
+  work_mode: vae
+
+models:
+  encoder:
+    in_dim: 439383  # len(alphabet) * max(len_mols)
+  decoder:
+    out_dimension: 343  # len(alphabet)
@@ -0,0 +1,16 @@
+name: ELBO
+description: Evidence lower bound
+task:
+  - text-vae
+  - text-vae-forward
+
+implementations:
+  torch:
+    mse:
+      weight: 1.0
+      object:
+        _target_: torch.nn.MSELoss
+    kld:
+      weight: 0.1
+      object:
+        _target_: innofw.core.losses.kld.KLD
@@ -0,0 +1,4 @@
+name: catboost classifier
+description: CatBoost classification model
+_target_: catboost.CatBoostClassifier
+verbose: 100
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,3 @@`
`1`	`1`	`enable: False`
`2`	`2`	`queue:`
	`3`	`+output_uri:`
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,3 @@`
`1`	`1`	`enable: True`
`2`	`2`	`queue:`
	`3`	`+output_uri:`
Original file line number	Diff line number	Diff line change
`@@ -1,2 +1,3 @@`
`1`	`1`	`enable: True`
`2`	`2`	`queue: test`
	`3`	`+output_uri:`