microsoft
/

biogpt

@@ -1,4 +1,5 @@
 {
   "architectures": [
     "BioGptLMHeadModel"
   ],
@@ -11,11 +12,13 @@
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 1024,
   "model_type": "biogpt",
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
   "pad_token_id": 1,
   "transformers_version": "4.25.0.dev0",
   "use_cache": true,
   "vocab_size": 42384

 {
+  "activation_dropout": 0.0,
   "architectures": [
     "BioGptLMHeadModel"
   ],
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-12,
+  "layerdrop": 0.0,
   "max_position_embeddings": 1024,
   "model_type": "biogpt",
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
   "pad_token_id": 1,
+  "scale_embedding": true,
   "transformers_version": "4.25.0.dev0",
   "use_cache": true,
   "vocab_size": 42384