avuhong commited on Apr 26, 2023

Commit

817fe09

•

1 Parent(s): 905008d

Upload with huggingface_hub

Browse files

Files changed (38) hide show

README.md +100 -0
all_results.json +15 -0
checkpoint-13650/config.json +30 -0
checkpoint-13650/optimizer.pt +3 -0
checkpoint-13650/pytorch_model.bin +3 -0
checkpoint-13650/rng_state_0.pth +3 -0
checkpoint-13650/rng_state_1.pth +3 -0
checkpoint-13650/scaler.pt +3 -0
checkpoint-13650/scheduler.pt +3 -0
checkpoint-13650/special_tokens_map.json +7 -0
checkpoint-13650/tokenizer_config.json +6 -0
checkpoint-13650/trainer_state.json +493 -0
checkpoint-13650/training_args.bin +3 -0
checkpoint-13650/vocab.txt +33 -0
checkpoint-14040/config.json +30 -0
checkpoint-14040/optimizer.pt +3 -0
checkpoint-14040/pytorch_model.bin +3 -0
checkpoint-14040/rng_state_0.pth +3 -0
checkpoint-14040/rng_state_1.pth +3 -0
checkpoint-14040/scaler.pt +3 -0
checkpoint-14040/scheduler.pt +3 -0
checkpoint-14040/special_tokens_map.json +7 -0
checkpoint-14040/tokenizer_config.json +6 -0
checkpoint-14040/trainer_state.json +508 -0
checkpoint-14040/training_args.bin +3 -0
checkpoint-14040/vocab.txt +33 -0
config.json +30 -0
eval_results.json +10 -0
pytorch_model.bin +3 -0
runs/Apr26_12-00-12_srvgpu/1682510421.8712294/events.out.tfevents.1682510421.srvgpu.3077809.1 +3 -0
runs/Apr26_12-00-12_srvgpu/events.out.tfevents.1682510421.srvgpu.3077809.0 +3 -0
runs/Apr26_12-00-12_srvgpu/events.out.tfevents.1682524144.srvgpu.3077809.2 +3 -0
special_tokens_map.json +7 -0
tokenizer_config.json +6 -0
train_results.json +8 -0
trainer_state.json +517 -0
training_args.bin +3 -0
vocab.txt +33 -0

README.md ADDED Viewed

	@@ -0,0 +1,100 @@

+---
+license: mit
+tags:
+- generated_from_trainer
+metrics:
+- accuracy
+model-index:
+- name: output_AAVESM2_650M_v1
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# output_AAVESM2_650M_v1
+This model is a fine-tuned version of [facebook/esm2_t33_650M_UR50D](https://huggingface.co/facebook/esm2_t33_650M_UR50D) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.3707
+- Accuracy: 0.8905
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 1e-05
+- train_batch_size: 1
+- eval_batch_size: 1
+- seed: 42
+- distributed_type: multi-GPU
+- num_devices: 2
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 8
+- total_eval_batch_size: 2
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 36.0
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Accuracy |
+|:-------------:|:-----:|:-----:|:---------------:|:--------:|
+| No log        | 1.0   | 390   | 1.3347          | 0.5993   |
+| 1.5408        | 2.0   | 780   | 1.0699          | 0.6796   |
+| 1.1283        | 3.0   | 1170  | 0.8751          | 0.7373   |
+| 0.9078        | 4.0   | 1560  | 0.7534          | 0.7711   |
+| 0.9078        | 5.0   | 1950  | 0.6711          | 0.8022   |
+| 0.7705        | 6.0   | 2340  | 0.6078          | 0.8169   |
+| 0.6863        | 7.0   | 2730  | 0.5668          | 0.8318   |
+| 0.6277        | 8.0   | 3120  | 0.5461          | 0.8386   |
+| 0.5863        | 9.0   | 3510  | 0.5143          | 0.8514   |
+| 0.5863        | 10.0  | 3900  | 0.4992          | 0.8522   |
+| 0.5564        | 11.0  | 4290  | 0.4940          | 0.8533   |
+| 0.5199        | 12.0  | 4680  | 0.4727          | 0.8633   |
+| 0.5025        | 13.0  | 5070  | 0.4586          | 0.8638   |
+| 0.5025        | 14.0  | 5460  | 0.4549          | 0.8673   |
+| 0.4814        | 15.0  | 5850  | 0.4442          | 0.8698   |
+| 0.4746        | 16.0  | 6240  | 0.4306          | 0.8750   |
+| 0.4527        | 17.0  | 6630  | 0.4291          | 0.8742   |
+| 0.4382        | 18.0  | 7020  | 0.4213          | 0.8751   |
+| 0.4382        | 19.0  | 7410  | 0.4193          | 0.8751   |
+| 0.4328        | 20.0  | 7800  | 0.4143          | 0.8760   |
+| 0.4191        | 21.0  | 8190  | 0.4071          | 0.8836   |
+| 0.4106        | 22.0  | 8580  | 0.3980          | 0.8819   |
+| 0.4106        | 23.0  | 8970  | 0.3987          | 0.8822   |
+| 0.4037        | 24.0  | 9360  | 0.4027          | 0.8819   |
+| 0.3893        | 25.0  | 9750  | 0.3868          | 0.8893   |
+| 0.3991        | 26.0  | 10140 | 0.3882          | 0.8846   |
+| 0.3786        | 27.0  | 10530 | 0.3939          | 0.8859   |
+| 0.3786        | 28.0  | 10920 | 0.3959          | 0.8848   |
+| 0.38          | 29.0  | 11310 | 0.3950          | 0.8850   |
+| 0.3764        | 30.0  | 11700 | 0.3783          | 0.8893   |
+| 0.3708        | 31.0  | 12090 | 0.3799          | 0.8891   |
+| 0.3708        | 32.0  | 12480 | 0.3915          | 0.8867   |
+| 0.3656        | 33.0  | 12870 | 0.3780          | 0.8903   |
+| 0.3617        | 34.0  | 13260 | 0.3805          | 0.8874   |
+| 0.361         | 35.0  | 13650 | 0.3776          | 0.8920   |
+| 0.3595        | 36.0  | 14040 | 0.3712          | 0.8888   |
+### Framework versions
+- Transformers 4.26.1
+- Pytorch 1.13.1+cu117
+- Datasets 2.9.0
+- Tokenizers 0.13.2

all_results.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+    "epoch": 36.0,
+    "eval_accuracy": 0.8905318152693578,
+    "eval_loss": 0.3707260489463806,
+    "eval_runtime": 5.8253,
+    "eval_samples": 171,
+    "eval_samples_per_second": 29.355,
+    "eval_steps_per_second": 14.763,
+    "perplexity": 1.448786122531838,
+    "train_loss": 0.5379996796958467,
+    "train_runtime": 13714.1823,
+    "train_samples": 3120,
+    "train_samples_per_second": 8.19,
+    "train_steps_per_second": 1.024
+}

checkpoint-13650/config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_name_or_path": "facebook/esm2_t33_650M_UR50D",
+  "architectures": [
+    "EsmForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "classifier_dropout": null,
+  "emb_layer_norm_before": false,
+  "esmfold_config": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1280,
+  "initializer_range": 0.02,
+  "intermediate_size": 5120,
+  "is_folding_model": false,
+  "layer_norm_eps": 1e-05,
+  "mask_token_id": 32,
+  "max_position_embeddings": 1026,
+  "model_type": "esm",
+  "num_attention_heads": 20,
+  "num_hidden_layers": 33,
+  "pad_token_id": 1,
+  "position_embedding_type": "rotary",
+  "token_dropout": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
+  "use_cache": true,
+  "vocab_list": null,
+  "vocab_size": 33
+}

checkpoint-13650/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:47906c5bdfd21f3c1def1fff088870f34a611e9072ba44f92f8945901a5ed84b
+size 5219162243

checkpoint-13650/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:72ea0df553d4c0d01a0dcb8c038c6a302c744033b0b2326f16875b92199db24f
+size 2609524829

checkpoint-13650/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6a90d7656620c27b5f0a3cc9bf82045add3872287b52b0e4d7a821d9cbc93563
+size 14583

checkpoint-13650/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc77f294d04ff7f88102ed8463d22301bd8233d77afd2d90cad8d2babaf94fb6
+size 14583

checkpoint-13650/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ea5476f54bdb6a23fa5620ad0532c467c086b58ae9fe7eafc8ff2d62a37b1b89
+size 557

checkpoint-13650/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55022d9dcbbef78486034062d55f0f0896988b0f3ec0147598f1ed7a8e3734d6
+size 627

checkpoint-13650/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

checkpoint-13650/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "model_max_length": 1000000000000000019884624838656,
+  "name_or_path": "facebook/esm2_t33_650M_UR50D",
+  "special_tokens_map_file": "/home/avuhong/.cache/huggingface/hub/models--facebook--esm2_t33_650M_UR50D/snapshots/08e4846e537177426273712802403f7ba8261b6c/special_tokens_map.json",
+  "tokenizer_class": "EsmTokenizer"
+}

checkpoint-13650/trainer_state.json ADDED Viewed

	@@ -0,0 +1,493 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 35.0,
+  "global_step": 13650,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5992906078421846,
+      "eval_loss": 1.33469557762146,
+      "eval_runtime": 5.8169,
+      "eval_samples_per_second": 29.397,
+      "eval_steps_per_second": 14.785,
+      "step": 390
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 9.644586894586896e-06,
+      "loss": 1.5408,
+      "step": 500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6796235478653008,
+      "eval_loss": 1.0698518753051758,
+      "eval_runtime": 5.8146,
+      "eval_samples_per_second": 29.409,
+      "eval_steps_per_second": 14.79,
+      "step": 780
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 9.28917378917379e-06,
+      "loss": 1.1283,
+      "step": 1000
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7372856151482106,
+      "eval_loss": 0.8751375675201416,
+      "eval_runtime": 5.8077,
+      "eval_samples_per_second": 29.444,
+      "eval_steps_per_second": 14.808,
+      "step": 1170
+    },
+    {
+      "epoch": 3.85,
+      "learning_rate": 8.933048433048434e-06,
+      "loss": 0.9078,
+      "step": 1500
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.7711176956331666,
+      "eval_loss": 0.7534294128417969,
+      "eval_runtime": 5.8229,
+      "eval_samples_per_second": 29.367,
+      "eval_steps_per_second": 14.769,
+      "step": 1560
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.802166420482521,
+      "eval_loss": 0.6710610389709473,
+      "eval_runtime": 5.6976,
+      "eval_samples_per_second": 30.013,
+      "eval_steps_per_second": 15.094,
+      "step": 1950
+    },
+    {
+      "epoch": 5.13,
+      "learning_rate": 8.576923076923077e-06,
+      "loss": 0.7705,
+      "step": 2000
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8168786692759296,
+      "eval_loss": 0.6077755689620972,
+      "eval_runtime": 5.8114,
+      "eval_samples_per_second": 29.425,
+      "eval_steps_per_second": 14.798,
+      "step": 2340
+    },
+    {
+      "epoch": 6.41,
+      "learning_rate": 8.220797720797722e-06,
+      "loss": 0.6863,
+      "step": 2500
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.831802051431627,
+      "eval_loss": 0.5667673945426941,
+      "eval_runtime": 5.8128,
+      "eval_samples_per_second": 29.418,
+      "eval_steps_per_second": 14.795,
+      "step": 2730
+    },
+    {
+      "epoch": 7.69,
+      "learning_rate": 7.864672364672366e-06,
+      "loss": 0.6277,
+      "step": 3000
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8386034912718204,
+      "eval_loss": 0.546131432056427,
+      "eval_runtime": 5.8073,
+      "eval_samples_per_second": 29.446,
+      "eval_steps_per_second": 14.809,
+      "step": 3120
+    },
+    {
+      "epoch": 8.97,
+      "learning_rate": 7.508547008547009e-06,
+      "loss": 0.5863,
+      "step": 3500
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.8513571943310113,
+      "eval_loss": 0.5142761468887329,
+      "eval_runtime": 5.8058,
+      "eval_samples_per_second": 29.453,
+      "eval_steps_per_second": 14.813,
+      "step": 3510
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.8522174818930449,
+      "eval_loss": 0.49920225143432617,
+      "eval_runtime": 5.8205,
+      "eval_samples_per_second": 29.379,
+      "eval_steps_per_second": 14.775,
+      "step": 3900
+    },
+    {
+      "epoch": 10.26,
+      "learning_rate": 7.152421652421653e-06,
+      "loss": 0.5564,
+      "step": 4000
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.8533209429717304,
+      "eval_loss": 0.49400192499160767,
+      "eval_runtime": 5.8142,
+      "eval_samples_per_second": 29.411,
+      "eval_steps_per_second": 14.791,
+      "step": 4290
+    },
+    {
+      "epoch": 11.54,
+      "learning_rate": 6.796296296296296e-06,
+      "loss": 0.5199,
+      "step": 4500
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.8632922665875019,
+      "eval_loss": 0.4726846218109131,
+      "eval_runtime": 5.8155,
+      "eval_samples_per_second": 29.404,
+      "eval_steps_per_second": 14.788,
+      "step": 4680
+    },
+    {
+      "epoch": 12.82,
+      "learning_rate": 6.440170940170941e-06,
+      "loss": 0.5025,
+      "step": 5000
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.8637540927527733,
+      "eval_loss": 0.4585917592048645,
+      "eval_runtime": 5.8153,
+      "eval_samples_per_second": 29.405,
+      "eval_steps_per_second": 14.789,
+      "step": 5070
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.8673048600883653,
+      "eval_loss": 0.45485442876815796,
+      "eval_runtime": 5.8178,
+      "eval_samples_per_second": 29.393,
+      "eval_steps_per_second": 14.782,
+      "step": 5460
+    },
+    {
+      "epoch": 14.1,
+      "learning_rate": 6.084045584045585e-06,
+      "loss": 0.4814,
+      "step": 5500
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.8698035411108416,
+      "eval_loss": 0.44424179196357727,
+      "eval_runtime": 5.7973,
+      "eval_samples_per_second": 29.496,
+      "eval_steps_per_second": 14.834,
+      "step": 5850
+    },
+    {
+      "epoch": 15.38,
+      "learning_rate": 5.727920227920228e-06,
+      "loss": 0.4746,
+      "step": 6000
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.8749573607523999,
+      "eval_loss": 0.43056586384773254,
+      "eval_runtime": 5.6925,
+      "eval_samples_per_second": 30.04,
+      "eval_steps_per_second": 15.108,
+      "step": 6240
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 5.371794871794872e-06,
+      "loss": 0.4527,
+      "step": 6500
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.874227107665129,
+      "eval_loss": 0.42905324697494507,
+      "eval_runtime": 5.8566,
+      "eval_samples_per_second": 29.198,
+      "eval_steps_per_second": 14.684,
+      "step": 6630
+    },
+    {
+      "epoch": 17.95,
+      "learning_rate": 5.016381766381767e-06,
+      "loss": 0.4382,
+      "step": 7000
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.8751032706419789,
+      "eval_loss": 0.4213222861289978,
+      "eval_runtime": 5.8093,
+      "eval_samples_per_second": 29.435,
+      "eval_steps_per_second": 14.804,
+      "step": 7020
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.8751214299591995,
+      "eval_loss": 0.41926833987236023,
+      "eval_runtime": 5.8022,
+      "eval_samples_per_second": 29.472,
+      "eval_steps_per_second": 14.822,
+      "step": 7410
+    },
+    {
+      "epoch": 19.23,
+      "learning_rate": 4.6602564102564106e-06,
+      "loss": 0.4328,
+      "step": 7500
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.8759944995580002,
+      "eval_loss": 0.41431769728660583,
+      "eval_runtime": 5.8137,
+      "eval_samples_per_second": 29.413,
+      "eval_steps_per_second": 14.793,
+      "step": 7800
+    },
+    {
+      "epoch": 20.51,
+      "learning_rate": 4.304131054131054e-06,
+      "loss": 0.4191,
+      "step": 8000
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 0.8835775987576434,
+      "eval_loss": 0.4071265459060669,
+      "eval_runtime": 5.8164,
+      "eval_samples_per_second": 29.4,
+      "eval_steps_per_second": 14.786,
+      "step": 8190
+    },
+    {
+      "epoch": 21.79,
+      "learning_rate": 3.948717948717949e-06,
+      "loss": 0.4106,
+      "step": 8500
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.881939052795031,
+      "eval_loss": 0.3980366587638855,
+      "eval_runtime": 5.875,
+      "eval_samples_per_second": 29.106,
+      "eval_steps_per_second": 14.638,
+      "step": 8580
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.8821786026625207,
+      "eval_loss": 0.39872363209724426,
+      "eval_runtime": 5.8105,
+      "eval_samples_per_second": 29.43,
+      "eval_steps_per_second": 14.801,
+      "step": 8970
+    },
+    {
+      "epoch": 23.08,
+      "learning_rate": 3.592592592592593e-06,
+      "loss": 0.4037,
+      "step": 9000
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.8819395993222366,
+      "eval_loss": 0.40265128016471863,
+      "eval_runtime": 5.8012,
+      "eval_samples_per_second": 29.477,
+      "eval_steps_per_second": 14.824,
+      "step": 9360
+    },
+    {
+      "epoch": 24.36,
+      "learning_rate": 3.2364672364672365e-06,
+      "loss": 0.3893,
+      "step": 9500
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 0.8892501819946614,
+      "eval_loss": 0.3867790400981903,
+      "eval_runtime": 5.8209,
+      "eval_samples_per_second": 29.377,
+      "eval_steps_per_second": 14.774,
+      "step": 9750
+    },
+    {
+      "epoch": 25.64,
+      "learning_rate": 2.8803418803418804e-06,
+      "loss": 0.3991,
+      "step": 10000
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.8846003326484688,
+      "eval_loss": 0.3882477581501007,
+      "eval_runtime": 5.8184,
+      "eval_samples_per_second": 29.389,
+      "eval_steps_per_second": 14.781,
+      "step": 10140
+    },
+    {
+      "epoch": 26.92,
+      "learning_rate": 2.5242165242165246e-06,
+      "loss": 0.3786,
+      "step": 10500
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.8858714334822964,
+      "eval_loss": 0.3939129710197449,
+      "eval_runtime": 5.8222,
+      "eval_samples_per_second": 29.37,
+      "eval_steps_per_second": 14.771,
+      "step": 10530
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.8847989764283254,
+      "eval_loss": 0.39587706327438354,
+      "eval_runtime": 5.8063,
+      "eval_samples_per_second": 29.451,
+      "eval_steps_per_second": 14.812,
+      "step": 10920
+    },
+    {
+      "epoch": 28.21,
+      "learning_rate": 2.168803418803419e-06,
+      "loss": 0.38,
+      "step": 11000
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 0.8849687976020835,
+      "eval_loss": 0.3949810862541199,
+      "eval_runtime": 5.8138,
+      "eval_samples_per_second": 29.413,
+      "eval_steps_per_second": 14.792,
+      "step": 11310
+    },
+    {
+      "epoch": 29.49,
+      "learning_rate": 1.8126780626780629e-06,
+      "loss": 0.3764,
+      "step": 11500
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.8893153879792042,
+      "eval_loss": 0.3783101439476013,
+      "eval_runtime": 5.8039,
+      "eval_samples_per_second": 29.463,
+      "eval_steps_per_second": 14.818,
+      "step": 11700
+    },
+    {
+      "epoch": 30.77,
+      "learning_rate": 1.4565527065527065e-06,
+      "loss": 0.3708,
+      "step": 12000
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy": 0.8890792500856626,
+      "eval_loss": 0.3798995912075043,
+      "eval_runtime": 5.7021,
+      "eval_samples_per_second": 29.989,
+      "eval_steps_per_second": 15.082,
+      "step": 12090
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.8867172306495527,
+      "eval_loss": 0.39150363206863403,
+      "eval_runtime": 5.8791,
+      "eval_samples_per_second": 29.086,
+      "eval_steps_per_second": 14.628,
+      "step": 12480
+    },
+    {
+      "epoch": 32.05,
+      "learning_rate": 1.1004273504273506e-06,
+      "loss": 0.3656,
+      "step": 12500
+    },
+    {
+      "epoch": 33.0,
+      "eval_accuracy": 0.8902530694061639,
+      "eval_loss": 0.3780055344104767,
+      "eval_runtime": 5.8784,
+      "eval_samples_per_second": 29.09,
+      "eval_steps_per_second": 14.63,
+      "step": 12870
+    },
+    {
+      "epoch": 33.33,
+      "learning_rate": 7.443019943019944e-07,
+      "loss": 0.3617,
+      "step": 13000
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.8873723487824038,
+      "eval_loss": 0.38049712777137756,
+      "eval_runtime": 5.8779,
+      "eval_samples_per_second": 29.092,
+      "eval_steps_per_second": 14.631,
+      "step": 13260
+    },
+    {
+      "epoch": 34.62,
+      "learning_rate": 3.8817663817663825e-07,
+      "loss": 0.361,
+      "step": 13500
+    },
+    {
+      "epoch": 35.0,
+      "eval_accuracy": 0.8919778767559101,
+      "eval_loss": 0.3775971233844757,
+      "eval_runtime": 5.8063,
+      "eval_samples_per_second": 29.451,
+      "eval_steps_per_second": 14.812,
+      "step": 13650
+    }
+  ],
+  "max_steps": 14040,
+  "num_train_epochs": 36,
+  "total_flos": 3.412286906774323e+17,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-13650/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e62f0cca5fa131673e262469dc4be8f9f3fb2048d33c3baf0cda18865991b15f
+size 3579

checkpoint-13650/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>

checkpoint-14040/config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_name_or_path": "facebook/esm2_t33_650M_UR50D",
+  "architectures": [
+    "EsmForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "classifier_dropout": null,
+  "emb_layer_norm_before": false,
+  "esmfold_config": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1280,
+  "initializer_range": 0.02,
+  "intermediate_size": 5120,
+  "is_folding_model": false,
+  "layer_norm_eps": 1e-05,
+  "mask_token_id": 32,
+  "max_position_embeddings": 1026,
+  "model_type": "esm",
+  "num_attention_heads": 20,
+  "num_hidden_layers": 33,
+  "pad_token_id": 1,
+  "position_embedding_type": "rotary",
+  "token_dropout": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
+  "use_cache": true,
+  "vocab_list": null,
+  "vocab_size": 33
+}

checkpoint-14040/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:74539603eff61ec2403f3fa04875cce68c8f7c190776b90de13c53f01dff31e2
+size 5219162243

checkpoint-14040/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a1f288729c792c2f6a5e683c9206c7652333c3fbc7bdae07606ec895c87b5a03
+size 2609524829

checkpoint-14040/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:537ade68a6593552161018bf2051b9024127d35978be29ce8334872cdba5fa4a
+size 14583

checkpoint-14040/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:15dbfdcf2c44f910e294ab5ba8b338eddffa03ec039d7237837bd239d5a739c1
+size 14583

checkpoint-14040/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d74e9e7f7e2d62262547d85c561b50718c1cb2c1ab608d095515ea413ac7b069
+size 557

checkpoint-14040/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:275a4bdd257f5c2b2e9c249486eb13b8c14a0a886a1a497af5c19b0dfe32cfd8
+size 627

checkpoint-14040/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

checkpoint-14040/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "model_max_length": 1000000000000000019884624838656,
+  "name_or_path": "facebook/esm2_t33_650M_UR50D",
+  "special_tokens_map_file": "/home/avuhong/.cache/huggingface/hub/models--facebook--esm2_t33_650M_UR50D/snapshots/08e4846e537177426273712802403f7ba8261b6c/special_tokens_map.json",
+  "tokenizer_class": "EsmTokenizer"
+}

checkpoint-14040/trainer_state.json ADDED Viewed

	@@ -0,0 +1,508 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 36.0,
+  "global_step": 14040,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5992906078421846,
+      "eval_loss": 1.33469557762146,
+      "eval_runtime": 5.8169,
+      "eval_samples_per_second": 29.397,
+      "eval_steps_per_second": 14.785,
+      "step": 390
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 9.644586894586896e-06,
+      "loss": 1.5408,
+      "step": 500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6796235478653008,
+      "eval_loss": 1.0698518753051758,
+      "eval_runtime": 5.8146,
+      "eval_samples_per_second": 29.409,
+      "eval_steps_per_second": 14.79,
+      "step": 780
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 9.28917378917379e-06,
+      "loss": 1.1283,
+      "step": 1000
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7372856151482106,
+      "eval_loss": 0.8751375675201416,
+      "eval_runtime": 5.8077,
+      "eval_samples_per_second": 29.444,
+      "eval_steps_per_second": 14.808,
+      "step": 1170
+    },
+    {
+      "epoch": 3.85,
+      "learning_rate": 8.933048433048434e-06,
+      "loss": 0.9078,
+      "step": 1500
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.7711176956331666,
+      "eval_loss": 0.7534294128417969,
+      "eval_runtime": 5.8229,
+      "eval_samples_per_second": 29.367,
+      "eval_steps_per_second": 14.769,
+      "step": 1560
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.802166420482521,
+      "eval_loss": 0.6710610389709473,
+      "eval_runtime": 5.6976,
+      "eval_samples_per_second": 30.013,
+      "eval_steps_per_second": 15.094,
+      "step": 1950
+    },
+    {
+      "epoch": 5.13,
+      "learning_rate": 8.576923076923077e-06,
+      "loss": 0.7705,
+      "step": 2000
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8168786692759296,
+      "eval_loss": 0.6077755689620972,
+      "eval_runtime": 5.8114,
+      "eval_samples_per_second": 29.425,
+      "eval_steps_per_second": 14.798,
+      "step": 2340
+    },
+    {
+      "epoch": 6.41,
+      "learning_rate": 8.220797720797722e-06,
+      "loss": 0.6863,
+      "step": 2500
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.831802051431627,
+      "eval_loss": 0.5667673945426941,
+      "eval_runtime": 5.8128,
+      "eval_samples_per_second": 29.418,
+      "eval_steps_per_second": 14.795,
+      "step": 2730
+    },
+    {
+      "epoch": 7.69,
+      "learning_rate": 7.864672364672366e-06,
+      "loss": 0.6277,
+      "step": 3000
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8386034912718204,
+      "eval_loss": 0.546131432056427,
+      "eval_runtime": 5.8073,
+      "eval_samples_per_second": 29.446,
+      "eval_steps_per_second": 14.809,
+      "step": 3120
+    },
+    {
+      "epoch": 8.97,
+      "learning_rate": 7.508547008547009e-06,
+      "loss": 0.5863,
+      "step": 3500
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.8513571943310113,
+      "eval_loss": 0.5142761468887329,
+      "eval_runtime": 5.8058,
+      "eval_samples_per_second": 29.453,
+      "eval_steps_per_second": 14.813,
+      "step": 3510
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.8522174818930449,
+      "eval_loss": 0.49920225143432617,
+      "eval_runtime": 5.8205,
+      "eval_samples_per_second": 29.379,
+      "eval_steps_per_second": 14.775,
+      "step": 3900
+    },
+    {
+      "epoch": 10.26,
+      "learning_rate": 7.152421652421653e-06,
+      "loss": 0.5564,
+      "step": 4000
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.8533209429717304,
+      "eval_loss": 0.49400192499160767,
+      "eval_runtime": 5.8142,
+      "eval_samples_per_second": 29.411,
+      "eval_steps_per_second": 14.791,
+      "step": 4290
+    },
+    {
+      "epoch": 11.54,
+      "learning_rate": 6.796296296296296e-06,
+      "loss": 0.5199,
+      "step": 4500
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.8632922665875019,
+      "eval_loss": 0.4726846218109131,
+      "eval_runtime": 5.8155,
+      "eval_samples_per_second": 29.404,
+      "eval_steps_per_second": 14.788,
+      "step": 4680
+    },
+    {
+      "epoch": 12.82,
+      "learning_rate": 6.440170940170941e-06,
+      "loss": 0.5025,
+      "step": 5000
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.8637540927527733,
+      "eval_loss": 0.4585917592048645,
+      "eval_runtime": 5.8153,
+      "eval_samples_per_second": 29.405,
+      "eval_steps_per_second": 14.789,
+      "step": 5070
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.8673048600883653,
+      "eval_loss": 0.45485442876815796,
+      "eval_runtime": 5.8178,
+      "eval_samples_per_second": 29.393,
+      "eval_steps_per_second": 14.782,
+      "step": 5460
+    },
+    {
+      "epoch": 14.1,
+      "learning_rate": 6.084045584045585e-06,
+      "loss": 0.4814,
+      "step": 5500
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.8698035411108416,
+      "eval_loss": 0.44424179196357727,
+      "eval_runtime": 5.7973,
+      "eval_samples_per_second": 29.496,
+      "eval_steps_per_second": 14.834,
+      "step": 5850
+    },
+    {
+      "epoch": 15.38,
+      "learning_rate": 5.727920227920228e-06,
+      "loss": 0.4746,
+      "step": 6000
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.8749573607523999,
+      "eval_loss": 0.43056586384773254,
+      "eval_runtime": 5.6925,
+      "eval_samples_per_second": 30.04,
+      "eval_steps_per_second": 15.108,
+      "step": 6240
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 5.371794871794872e-06,
+      "loss": 0.4527,
+      "step": 6500
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.874227107665129,
+      "eval_loss": 0.42905324697494507,
+      "eval_runtime": 5.8566,
+      "eval_samples_per_second": 29.198,
+      "eval_steps_per_second": 14.684,
+      "step": 6630
+    },
+    {
+      "epoch": 17.95,
+      "learning_rate": 5.016381766381767e-06,
+      "loss": 0.4382,
+      "step": 7000
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.8751032706419789,
+      "eval_loss": 0.4213222861289978,
+      "eval_runtime": 5.8093,
+      "eval_samples_per_second": 29.435,
+      "eval_steps_per_second": 14.804,
+      "step": 7020
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.8751214299591995,
+      "eval_loss": 0.41926833987236023,
+      "eval_runtime": 5.8022,
+      "eval_samples_per_second": 29.472,
+      "eval_steps_per_second": 14.822,
+      "step": 7410
+    },
+    {
+      "epoch": 19.23,
+      "learning_rate": 4.6602564102564106e-06,
+      "loss": 0.4328,
+      "step": 7500
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.8759944995580002,
+      "eval_loss": 0.41431769728660583,
+      "eval_runtime": 5.8137,
+      "eval_samples_per_second": 29.413,
+      "eval_steps_per_second": 14.793,
+      "step": 7800
+    },
+    {
+      "epoch": 20.51,
+      "learning_rate": 4.304131054131054e-06,
+      "loss": 0.4191,
+      "step": 8000
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 0.8835775987576434,
+      "eval_loss": 0.4071265459060669,
+      "eval_runtime": 5.8164,
+      "eval_samples_per_second": 29.4,
+      "eval_steps_per_second": 14.786,
+      "step": 8190
+    },
+    {
+      "epoch": 21.79,
+      "learning_rate": 3.948717948717949e-06,
+      "loss": 0.4106,
+      "step": 8500
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.881939052795031,
+      "eval_loss": 0.3980366587638855,
+      "eval_runtime": 5.875,
+      "eval_samples_per_second": 29.106,
+      "eval_steps_per_second": 14.638,
+      "step": 8580
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.8821786026625207,
+      "eval_loss": 0.39872363209724426,
+      "eval_runtime": 5.8105,
+      "eval_samples_per_second": 29.43,
+      "eval_steps_per_second": 14.801,
+      "step": 8970
+    },
+    {
+      "epoch": 23.08,
+      "learning_rate": 3.592592592592593e-06,
+      "loss": 0.4037,
+      "step": 9000
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.8819395993222366,
+      "eval_loss": 0.40265128016471863,
+      "eval_runtime": 5.8012,
+      "eval_samples_per_second": 29.477,
+      "eval_steps_per_second": 14.824,
+      "step": 9360
+    },
+    {
+      "epoch": 24.36,
+      "learning_rate": 3.2364672364672365e-06,
+      "loss": 0.3893,
+      "step": 9500
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 0.8892501819946614,
+      "eval_loss": 0.3867790400981903,
+      "eval_runtime": 5.8209,
+      "eval_samples_per_second": 29.377,
+      "eval_steps_per_second": 14.774,
+      "step": 9750
+    },
+    {
+      "epoch": 25.64,
+      "learning_rate": 2.8803418803418804e-06,
+      "loss": 0.3991,
+      "step": 10000
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.8846003326484688,
+      "eval_loss": 0.3882477581501007,
+      "eval_runtime": 5.8184,
+      "eval_samples_per_second": 29.389,
+      "eval_steps_per_second": 14.781,
+      "step": 10140
+    },
+    {
+      "epoch": 26.92,
+      "learning_rate": 2.5242165242165246e-06,
+      "loss": 0.3786,
+      "step": 10500
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.8858714334822964,
+      "eval_loss": 0.3939129710197449,
+      "eval_runtime": 5.8222,
+      "eval_samples_per_second": 29.37,
+      "eval_steps_per_second": 14.771,
+      "step": 10530
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.8847989764283254,
+      "eval_loss": 0.39587706327438354,
+      "eval_runtime": 5.8063,
+      "eval_samples_per_second": 29.451,
+      "eval_steps_per_second": 14.812,
+      "step": 10920
+    },
+    {
+      "epoch": 28.21,
+      "learning_rate": 2.168803418803419e-06,
+      "loss": 0.38,
+      "step": 11000
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 0.8849687976020835,
+      "eval_loss": 0.3949810862541199,
+      "eval_runtime": 5.8138,
+      "eval_samples_per_second": 29.413,
+      "eval_steps_per_second": 14.792,
+      "step": 11310
+    },
+    {
+      "epoch": 29.49,
+      "learning_rate": 1.8126780626780629e-06,
+      "loss": 0.3764,
+      "step": 11500
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.8893153879792042,
+      "eval_loss": 0.3783101439476013,
+      "eval_runtime": 5.8039,
+      "eval_samples_per_second": 29.463,
+      "eval_steps_per_second": 14.818,
+      "step": 11700
+    },
+    {
+      "epoch": 30.77,
+      "learning_rate": 1.4565527065527065e-06,
+      "loss": 0.3708,
+      "step": 12000
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy": 0.8890792500856626,
+      "eval_loss": 0.3798995912075043,
+      "eval_runtime": 5.7021,
+      "eval_samples_per_second": 29.989,
+      "eval_steps_per_second": 15.082,
+      "step": 12090
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.8867172306495527,
+      "eval_loss": 0.39150363206863403,
+      "eval_runtime": 5.8791,
+      "eval_samples_per_second": 29.086,
+      "eval_steps_per_second": 14.628,
+      "step": 12480
+    },
+    {
+      "epoch": 32.05,
+      "learning_rate": 1.1004273504273506e-06,
+      "loss": 0.3656,
+      "step": 12500
+    },
+    {
+      "epoch": 33.0,
+      "eval_accuracy": 0.8902530694061639,
+      "eval_loss": 0.3780055344104767,
+      "eval_runtime": 5.8784,
+      "eval_samples_per_second": 29.09,
+      "eval_steps_per_second": 14.63,
+      "step": 12870
+    },
+    {
+      "epoch": 33.33,
+      "learning_rate": 7.443019943019944e-07,
+      "loss": 0.3617,
+      "step": 13000
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.8873723487824038,
+      "eval_loss": 0.38049712777137756,
+      "eval_runtime": 5.8779,
+      "eval_samples_per_second": 29.092,
+      "eval_steps_per_second": 14.631,
+      "step": 13260
+    },
+    {
+      "epoch": 34.62,
+      "learning_rate": 3.8817663817663825e-07,
+      "loss": 0.361,
+      "step": 13500
+    },
+    {
+      "epoch": 35.0,
+      "eval_accuracy": 0.8919778767559101,
+      "eval_loss": 0.3775971233844757,
+      "eval_runtime": 5.8063,
+      "eval_samples_per_second": 29.451,
+      "eval_steps_per_second": 14.812,
+      "step": 13650
+    },
+    {
+      "epoch": 35.9,
+      "learning_rate": 3.205128205128205e-08,
+      "loss": 0.3595,
+      "step": 14000
+    },
+    {
+      "epoch": 36.0,
+      "eval_accuracy": 0.8888084202394747,
+      "eval_loss": 0.3711872100830078,
+      "eval_runtime": 5.8621,
+      "eval_samples_per_second": 29.171,
+      "eval_steps_per_second": 14.671,
+      "step": 14040
+    }
+  ],
+  "max_steps": 14040,
+  "num_train_epochs": 36,
+  "total_flos": 3.509780816886497e+17,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-14040/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e62f0cca5fa131673e262469dc4be8f9f3fb2048d33c3baf0cda18865991b15f
+size 3579

checkpoint-14040/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>

config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_name_or_path": "facebook/esm2_t33_650M_UR50D",
+  "architectures": [
+    "EsmForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "classifier_dropout": null,
+  "emb_layer_norm_before": false,
+  "esmfold_config": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1280,
+  "initializer_range": 0.02,
+  "intermediate_size": 5120,
+  "is_folding_model": false,
+  "layer_norm_eps": 1e-05,
+  "mask_token_id": 32,
+  "max_position_embeddings": 1026,
+  "model_type": "esm",
+  "num_attention_heads": 20,
+  "num_hidden_layers": 33,
+  "pad_token_id": 1,
+  "position_embedding_type": "rotary",
+  "token_dropout": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
+  "use_cache": true,
+  "vocab_list": null,
+  "vocab_size": 33
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "epoch": 36.0,
+    "eval_accuracy": 0.8905318152693578,
+    "eval_loss": 0.3707260489463806,
+    "eval_runtime": 5.8253,
+    "eval_samples": 171,
+    "eval_samples_per_second": 29.355,
+    "eval_steps_per_second": 14.763,
+    "perplexity": 1.448786122531838
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a1f288729c792c2f6a5e683c9206c7652333c3fbc7bdae07606ec895c87b5a03
+size 2609524829

runs/Apr26_12-00-12_srvgpu/1682510421.8712294/events.out.tfevents.1682510421.srvgpu.3077809.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:91cf0149c9cdf0c5878eea2813b3bc0b71f0577fc423468e593e5588cee6aff3
+size 5688

runs/Apr26_12-00-12_srvgpu/events.out.tfevents.1682510421.srvgpu.3077809.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a4765859d81060ca2c805656dcd79226754725821890cc8b27f964a16487e0b6
+size 20340

runs/Apr26_12-00-12_srvgpu/events.out.tfevents.1682524144.srvgpu.3077809.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5dbeb63262a0cd34567d2e14c7ab41e7712ba596938b712994795fae04637926
+size 363

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "model_max_length": 1000000000000000019884624838656,
+  "name_or_path": "facebook/esm2_t33_650M_UR50D",
+  "special_tokens_map_file": "/home/avuhong/.cache/huggingface/hub/models--facebook--esm2_t33_650M_UR50D/snapshots/08e4846e537177426273712802403f7ba8261b6c/special_tokens_map.json",
+  "tokenizer_class": "EsmTokenizer"
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 36.0,
+    "train_loss": 0.5379996796958467,
+    "train_runtime": 13714.1823,
+    "train_samples": 3120,
+    "train_samples_per_second": 8.19,
+    "train_steps_per_second": 1.024
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,517 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 36.0,
+  "global_step": 14040,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5992906078421846,
+      "eval_loss": 1.33469557762146,
+      "eval_runtime": 5.8169,
+      "eval_samples_per_second": 29.397,
+      "eval_steps_per_second": 14.785,
+      "step": 390
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 9.644586894586896e-06,
+      "loss": 1.5408,
+      "step": 500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6796235478653008,
+      "eval_loss": 1.0698518753051758,
+      "eval_runtime": 5.8146,
+      "eval_samples_per_second": 29.409,
+      "eval_steps_per_second": 14.79,
+      "step": 780
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 9.28917378917379e-06,
+      "loss": 1.1283,
+      "step": 1000
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.7372856151482106,
+      "eval_loss": 0.8751375675201416,
+      "eval_runtime": 5.8077,
+      "eval_samples_per_second": 29.444,
+      "eval_steps_per_second": 14.808,
+      "step": 1170
+    },
+    {
+      "epoch": 3.85,
+      "learning_rate": 8.933048433048434e-06,
+      "loss": 0.9078,
+      "step": 1500
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.7711176956331666,
+      "eval_loss": 0.7534294128417969,
+      "eval_runtime": 5.8229,
+      "eval_samples_per_second": 29.367,
+      "eval_steps_per_second": 14.769,
+      "step": 1560
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.802166420482521,
+      "eval_loss": 0.6710610389709473,
+      "eval_runtime": 5.6976,
+      "eval_samples_per_second": 30.013,
+      "eval_steps_per_second": 15.094,
+      "step": 1950
+    },
+    {
+      "epoch": 5.13,
+      "learning_rate": 8.576923076923077e-06,
+      "loss": 0.7705,
+      "step": 2000
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.8168786692759296,
+      "eval_loss": 0.6077755689620972,
+      "eval_runtime": 5.8114,
+      "eval_samples_per_second": 29.425,
+      "eval_steps_per_second": 14.798,
+      "step": 2340
+    },
+    {
+      "epoch": 6.41,
+      "learning_rate": 8.220797720797722e-06,
+      "loss": 0.6863,
+      "step": 2500
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.831802051431627,
+      "eval_loss": 0.5667673945426941,
+      "eval_runtime": 5.8128,
+      "eval_samples_per_second": 29.418,
+      "eval_steps_per_second": 14.795,
+      "step": 2730
+    },
+    {
+      "epoch": 7.69,
+      "learning_rate": 7.864672364672366e-06,
+      "loss": 0.6277,
+      "step": 3000
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8386034912718204,
+      "eval_loss": 0.546131432056427,
+      "eval_runtime": 5.8073,
+      "eval_samples_per_second": 29.446,
+      "eval_steps_per_second": 14.809,
+      "step": 3120
+    },
+    {
+      "epoch": 8.97,
+      "learning_rate": 7.508547008547009e-06,
+      "loss": 0.5863,
+      "step": 3500
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.8513571943310113,
+      "eval_loss": 0.5142761468887329,
+      "eval_runtime": 5.8058,
+      "eval_samples_per_second": 29.453,
+      "eval_steps_per_second": 14.813,
+      "step": 3510
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.8522174818930449,
+      "eval_loss": 0.49920225143432617,
+      "eval_runtime": 5.8205,
+      "eval_samples_per_second": 29.379,
+      "eval_steps_per_second": 14.775,
+      "step": 3900
+    },
+    {
+      "epoch": 10.26,
+      "learning_rate": 7.152421652421653e-06,
+      "loss": 0.5564,
+      "step": 4000
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.8533209429717304,
+      "eval_loss": 0.49400192499160767,
+      "eval_runtime": 5.8142,
+      "eval_samples_per_second": 29.411,
+      "eval_steps_per_second": 14.791,
+      "step": 4290
+    },
+    {
+      "epoch": 11.54,
+      "learning_rate": 6.796296296296296e-06,
+      "loss": 0.5199,
+      "step": 4500
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.8632922665875019,
+      "eval_loss": 0.4726846218109131,
+      "eval_runtime": 5.8155,
+      "eval_samples_per_second": 29.404,
+      "eval_steps_per_second": 14.788,
+      "step": 4680
+    },
+    {
+      "epoch": 12.82,
+      "learning_rate": 6.440170940170941e-06,
+      "loss": 0.5025,
+      "step": 5000
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.8637540927527733,
+      "eval_loss": 0.4585917592048645,
+      "eval_runtime": 5.8153,
+      "eval_samples_per_second": 29.405,
+      "eval_steps_per_second": 14.789,
+      "step": 5070
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.8673048600883653,
+      "eval_loss": 0.45485442876815796,
+      "eval_runtime": 5.8178,
+      "eval_samples_per_second": 29.393,
+      "eval_steps_per_second": 14.782,
+      "step": 5460
+    },
+    {
+      "epoch": 14.1,
+      "learning_rate": 6.084045584045585e-06,
+      "loss": 0.4814,
+      "step": 5500
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.8698035411108416,
+      "eval_loss": 0.44424179196357727,
+      "eval_runtime": 5.7973,
+      "eval_samples_per_second": 29.496,
+      "eval_steps_per_second": 14.834,
+      "step": 5850
+    },
+    {
+      "epoch": 15.38,
+      "learning_rate": 5.727920227920228e-06,
+      "loss": 0.4746,
+      "step": 6000
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.8749573607523999,
+      "eval_loss": 0.43056586384773254,
+      "eval_runtime": 5.6925,
+      "eval_samples_per_second": 30.04,
+      "eval_steps_per_second": 15.108,
+      "step": 6240
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 5.371794871794872e-06,
+      "loss": 0.4527,
+      "step": 6500
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.874227107665129,
+      "eval_loss": 0.42905324697494507,
+      "eval_runtime": 5.8566,
+      "eval_samples_per_second": 29.198,
+      "eval_steps_per_second": 14.684,
+      "step": 6630
+    },
+    {
+      "epoch": 17.95,
+      "learning_rate": 5.016381766381767e-06,
+      "loss": 0.4382,
+      "step": 7000
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.8751032706419789,
+      "eval_loss": 0.4213222861289978,
+      "eval_runtime": 5.8093,
+      "eval_samples_per_second": 29.435,
+      "eval_steps_per_second": 14.804,
+      "step": 7020
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.8751214299591995,
+      "eval_loss": 0.41926833987236023,
+      "eval_runtime": 5.8022,
+      "eval_samples_per_second": 29.472,
+      "eval_steps_per_second": 14.822,
+      "step": 7410
+    },
+    {
+      "epoch": 19.23,
+      "learning_rate": 4.6602564102564106e-06,
+      "loss": 0.4328,
+      "step": 7500
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.8759944995580002,
+      "eval_loss": 0.41431769728660583,
+      "eval_runtime": 5.8137,
+      "eval_samples_per_second": 29.413,
+      "eval_steps_per_second": 14.793,
+      "step": 7800
+    },
+    {
+      "epoch": 20.51,
+      "learning_rate": 4.304131054131054e-06,
+      "loss": 0.4191,
+      "step": 8000
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 0.8835775987576434,
+      "eval_loss": 0.4071265459060669,
+      "eval_runtime": 5.8164,
+      "eval_samples_per_second": 29.4,
+      "eval_steps_per_second": 14.786,
+      "step": 8190
+    },
+    {
+      "epoch": 21.79,
+      "learning_rate": 3.948717948717949e-06,
+      "loss": 0.4106,
+      "step": 8500
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.881939052795031,
+      "eval_loss": 0.3980366587638855,
+      "eval_runtime": 5.875,
+      "eval_samples_per_second": 29.106,
+      "eval_steps_per_second": 14.638,
+      "step": 8580
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.8821786026625207,
+      "eval_loss": 0.39872363209724426,
+      "eval_runtime": 5.8105,
+      "eval_samples_per_second": 29.43,
+      "eval_steps_per_second": 14.801,
+      "step": 8970
+    },
+    {
+      "epoch": 23.08,
+      "learning_rate": 3.592592592592593e-06,
+      "loss": 0.4037,
+      "step": 9000
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.8819395993222366,
+      "eval_loss": 0.40265128016471863,
+      "eval_runtime": 5.8012,
+      "eval_samples_per_second": 29.477,
+      "eval_steps_per_second": 14.824,
+      "step": 9360
+    },
+    {
+      "epoch": 24.36,
+      "learning_rate": 3.2364672364672365e-06,
+      "loss": 0.3893,
+      "step": 9500
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 0.8892501819946614,
+      "eval_loss": 0.3867790400981903,
+      "eval_runtime": 5.8209,
+      "eval_samples_per_second": 29.377,
+      "eval_steps_per_second": 14.774,
+      "step": 9750
+    },
+    {
+      "epoch": 25.64,
+      "learning_rate": 2.8803418803418804e-06,
+      "loss": 0.3991,
+      "step": 10000
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.8846003326484688,
+      "eval_loss": 0.3882477581501007,
+      "eval_runtime": 5.8184,
+      "eval_samples_per_second": 29.389,
+      "eval_steps_per_second": 14.781,
+      "step": 10140
+    },
+    {
+      "epoch": 26.92,
+      "learning_rate": 2.5242165242165246e-06,
+      "loss": 0.3786,
+      "step": 10500
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.8858714334822964,
+      "eval_loss": 0.3939129710197449,
+      "eval_runtime": 5.8222,
+      "eval_samples_per_second": 29.37,
+      "eval_steps_per_second": 14.771,
+      "step": 10530
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.8847989764283254,
+      "eval_loss": 0.39587706327438354,
+      "eval_runtime": 5.8063,
+      "eval_samples_per_second": 29.451,
+      "eval_steps_per_second": 14.812,
+      "step": 10920
+    },
+    {
+      "epoch": 28.21,
+      "learning_rate": 2.168803418803419e-06,
+      "loss": 0.38,
+      "step": 11000
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 0.8849687976020835,
+      "eval_loss": 0.3949810862541199,
+      "eval_runtime": 5.8138,
+      "eval_samples_per_second": 29.413,
+      "eval_steps_per_second": 14.792,
+      "step": 11310
+    },
+    {
+      "epoch": 29.49,
+      "learning_rate": 1.8126780626780629e-06,
+      "loss": 0.3764,
+      "step": 11500
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.8893153879792042,
+      "eval_loss": 0.3783101439476013,
+      "eval_runtime": 5.8039,
+      "eval_samples_per_second": 29.463,
+      "eval_steps_per_second": 14.818,
+      "step": 11700
+    },
+    {
+      "epoch": 30.77,
+      "learning_rate": 1.4565527065527065e-06,
+      "loss": 0.3708,
+      "step": 12000
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy": 0.8890792500856626,
+      "eval_loss": 0.3798995912075043,
+      "eval_runtime": 5.7021,
+      "eval_samples_per_second": 29.989,
+      "eval_steps_per_second": 15.082,
+      "step": 12090
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.8867172306495527,
+      "eval_loss": 0.39150363206863403,
+      "eval_runtime": 5.8791,
+      "eval_samples_per_second": 29.086,
+      "eval_steps_per_second": 14.628,
+      "step": 12480
+    },
+    {
+      "epoch": 32.05,
+      "learning_rate": 1.1004273504273506e-06,
+      "loss": 0.3656,
+      "step": 12500
+    },
+    {
+      "epoch": 33.0,
+      "eval_accuracy": 0.8902530694061639,
+      "eval_loss": 0.3780055344104767,
+      "eval_runtime": 5.8784,
+      "eval_samples_per_second": 29.09,
+      "eval_steps_per_second": 14.63,
+      "step": 12870
+    },
+    {
+      "epoch": 33.33,
+      "learning_rate": 7.443019943019944e-07,
+      "loss": 0.3617,
+      "step": 13000
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.8873723487824038,
+      "eval_loss": 0.38049712777137756,
+      "eval_runtime": 5.8779,
+      "eval_samples_per_second": 29.092,
+      "eval_steps_per_second": 14.631,
+      "step": 13260
+    },
+    {
+      "epoch": 34.62,
+      "learning_rate": 3.8817663817663825e-07,
+      "loss": 0.361,
+      "step": 13500
+    },
+    {
+      "epoch": 35.0,
+      "eval_accuracy": 0.8919778767559101,
+      "eval_loss": 0.3775971233844757,
+      "eval_runtime": 5.8063,
+      "eval_samples_per_second": 29.451,
+      "eval_steps_per_second": 14.812,
+      "step": 13650
+    },
+    {
+      "epoch": 35.9,
+      "learning_rate": 3.205128205128205e-08,
+      "loss": 0.3595,
+      "step": 14000
+    },
+    {
+      "epoch": 36.0,
+      "eval_accuracy": 0.8888084202394747,
+      "eval_loss": 0.3711872100830078,
+      "eval_runtime": 5.8621,
+      "eval_samples_per_second": 29.171,
+      "eval_steps_per_second": 14.671,
+      "step": 14040
+    },
+    {
+      "epoch": 36.0,
+      "step": 14040,
+      "total_flos": 3.509780816886497e+17,
+      "train_loss": 0.5379996796958467,
+      "train_runtime": 13714.1823,
+      "train_samples_per_second": 8.19,
+      "train_steps_per_second": 1.024
+    }
+  ],
+  "max_steps": 14040,
+  "num_train_epochs": 36,
+  "total_flos": 3.509780816886497e+17,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e62f0cca5fa131673e262469dc4be8f9f3fb2048d33c3baf0cda18865991b15f
+size 3579

vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>