Upload GemmaForCausalLM

Files changed (3) hide show

config.json CHANGED Viewed

@@ -5,8 +5,8 @@
   ],
   "attention_bias": false,
   "attention_dropout": 0.0,
-  "bos_token_id": 2,
-  "eos_token_id": 1,
   "head_dim": 256,
   "hidden_act": "gelu_pytorch_tanh",
   "hidden_activation": "gelu_pytorch_tanh",
@@ -16,11 +16,12 @@
   "max_position_embeddings": 1024,
   "model_type": "gemma",
   "num_attention_heads": 4,
-  "num_hidden_layers": 4,
   "num_key_value_heads": 1,
   "pad_token_id": 0,
-  "rms_norm_eps": 1e-06,
   "rope_theta": 10000.0,
   "torch_dtype": "float32",
   "transformers_version": "4.41.2",
   "use_cache": true,

   ],
   "attention_bias": false,
   "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "eos_token_id": 7,
   "head_dim": 256,
   "hidden_act": "gelu_pytorch_tanh",
   "hidden_activation": "gelu_pytorch_tanh",
   "max_position_embeddings": 1024,
   "model_type": "gemma",
   "num_attention_heads": 4,
+  "num_hidden_layers": 2,
   "num_key_value_heads": 1,
   "pad_token_id": 0,
+  "rms_norm_eps": 1e-05,
   "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
   "torch_dtype": "float32",
   "transformers_version": "4.41.2",
   "use_cache": true,

generation_config.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "_from_model_config": true,
-  "bos_token_id": 2,
-  "eos_token_id": 1,
   "pad_token_id": 0,
   "transformers_version": "4.41.2"
 }

 {
   "_from_model_config": true,
+  "bos_token_id": 1,
+  "eos_token_id": 7,
   "pad_token_id": 0,
   "transformers_version": "4.41.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68266918df5ec79daa3cfbe7a96b014b851d6f0d1ed9561eb0005002645ad8b3
-size 640196776

 version https://git-lfs.github.com/spec/v1
+oid sha256:9d079245fdfcfa7a7ea008ad1a1d2906efa67c3f4877f62dc7ca5454d8ec7b45
+size 915429664