Upload folder using huggingface_hub

Browse files

Files changed (13) hide show

.gitattributes +9 -35
README.md +130 -0
Umbra-v2.1-MoE-4x10.7-Q2_K.gguf +3 -0
Umbra-v2.1-MoE-4x10.7-Q3_K_L.gguf +3 -0
Umbra-v2.1-MoE-4x10.7-Q3_K_M.gguf +3 -0
Umbra-v2.1-MoE-4x10.7-Q3_K_S.gguf +3 -0
Umbra-v2.1-MoE-4x10.7-Q4_K_M.gguf +3 -0
Umbra-v2.1-MoE-4x10.7-Q4_K_S.gguf +3 -0
Umbra-v2.1-MoE-4x10.7-Q5_K_M.gguf +3 -0
Umbra-v2.1-MoE-4x10.7-Q5_K_S.gguf +3 -0
Umbra-v2.1-MoE-4x10.7-Q6_K.gguf +3 -0
Umbra_Tavern.png +0 -0
mergekit_moe_config.yml +113 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,9 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

+Umbra-v2.1-MoE-4x10.7-Q2_K.gguf filter=lfs diff=lfs merge=lfs -text
+Umbra-v2.1-MoE-4x10.7-Q3_K_L.gguf filter=lfs diff=lfs merge=lfs -text
+Umbra-v2.1-MoE-4x10.7-Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Umbra-v2.1-MoE-4x10.7-Q3_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Umbra-v2.1-MoE-4x10.7-Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Umbra-v2.1-MoE-4x10.7-Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Umbra-v2.1-MoE-4x10.7-Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Umbra-v2.1-MoE-4x10.7-Q5_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Umbra-v2.1-MoE-4x10.7-Q6_K.gguf filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,130 @@

+---
+license: apache-2.0
+tags:
+- moe
+- merge
+- mergekit
+- vicgalle/CarbonBeagle-11B
+- Sao10K/Fimbulvetr-10.7B-v1
+- bn22/Nous-Hermes-2-SOLAR-10.7B-MISALIGNED
+- Yhyu13/LMCocktail-10.7B-v1
+---
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/64545af5ec40bbbd01242ca6/hen3fNHRD7BCPvd2KkfjZ.png)
+# Umbra-v2.1-MoE-4x10.7
+The [Umbra Series] is an offshoot of the [Lumosia Series] With the goal to be a General assistant that has a knack for story telling and RP/ERP
+-What's New in v2.1?
+Umbra v2.1 isn't just a simple update; it's like giving the model a double shot of espresso. Ive changed the models and prompts, in an attempt to make Umbra
+not only your go-to assistant for general knowledge but also a great storyteller and RP/ERP companion.
+-Longer Positive, Shorter Negative
+In an effort to trick the gates into being less uptight, Ive added more positive prompts and snappier negative ones.
+These changes are based on the model's strengths and, frankly, my whimsical preferences.
+-Experimental, As Always
+Remember, folks, "v2.1" doesn't mean it's superior to its predecessors – it's just another step in the quest.
+It's the 'Empire Strikes Back' of our series – could be better, could be worse, but definitely more dramatic.
+-Base Context and Coherence
+Umbra v2.1 has a base context of 8k scrolling window.
+-The Tavern Card
+Just for fun - the Umbra Personality Tavern Card. It's your gateway to immersive storytelling experiences,
+a little like having a 'Choose Your Own Adventure' book, but way cooler because it's digital and doesn't get lost under your bed.
+-Token Error? Fixed!
+Umbra-v2 had a tokenizer error but was removed faster than you can say "Cops love Donuts"
+So, give Umbra v2.1 a whirl and let me know how it goes. Your feedback is like the secret sauce in my development burger.
+```
+### System:
+### USER:{prompt}
+### Assistant:
+```
+Settings:
+```
+Temp: 1.0
+min-p: 0.02-0.1
+```
+## Evals:
+* Avg: 73.59
+* ARC: 69.11
+* HellaSwag: 87.57
+* MMLU: 66.48
+* T-QA: 66.75
+* Winogrande: 83.11
+* GSM8K: 68.69
+## Examples:
+```
+posted soon
+```
+```
+posted soon
+```
+## 🧩 Configuration
+```
+base_model: vicgalle/CarbonBeagle-11B
+gate_mode: hidden
+dtype: bfloat16
+experts:
+  - source_model: vicgalle/CarbonBeagle-11B
+    positive_prompts: [Revamped]
+  - source_model: Sao10K/Fimbulvetr-10.7B-v1
+    positive_prompts: [Revamped]
+  - source_model: bn22/Nous-Hermes-2-SOLAR-10.7B-MISALIGNED
+    positive_prompts: [Revamped]
+  - source_model: Yhyu13/LMCocktail-10.7B-v1
+    positive_prompts: [Revamed]
+```
+```
+Umbra-v2-MoE-4x10.7 is a Mixure of Experts (MoE) made with the following models:
+* [vicgalle/CarbonBeagle-11B](https://huggingface.co/vicgalle/CarbonBeagle-11B)
+* [Sao10K/Fimbulvetr-10.7B-v1](https://huggingface.co/Sao10K/Fimbulvetr-10.7B-v1)
+* [bn22/Nous-Hermes-2-SOLAR-10.7B-MISALIGNED](https://huggingface.co/bn22/Nous-Hermes-2-SOLAR-10.7B-MISALIGNED)
+* [Yhyu13/LMCocktail-10.7B-v1](https://huggingface.co/Yhyu13/LMCocktail-10.7B-v1)
+```
+## 💻 Usage
+```python
+!pip install -qU transformers bitsandbytes accelerate
+from transformers import AutoTokenizer
+import transformers
+import torch
+model = "Steelskull/Umbra-v2-MoE-4x10.7"
+tokenizer = AutoTokenizer.from_pretrained(model)
+pipeline = transformers.pipeline(
+    "text-generation",
+    model=model,
+    model_kwargs={"torch_dtype": torch.float16, "load_in_4bit": True},
+)
+messages = [{"role": "user", "content": "Explain what a Mixture of Experts is in less than 100 words."}]
+prompt = pipeline.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
+print(outputs[0]["generated_text"])
+```

Umbra-v2.1-MoE-4x10.7-Q2_K.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a1ab2fe66b0845f34bcf4ae5e3deda4923a3d41acff50474c625a32de15f08cc
+size 13187216032

Umbra-v2.1-MoE-4x10.7-Q3_K_L.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:27a4626371ddbb7dca62d15f02cf06eeb5ce18fb374eed5114303db350c9ad40
+size 18732290720

Umbra-v2.1-MoE-4x10.7-Q3_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c27f58338676302a63efcdf5fad8d1896f6fba6b9330ae5625d8be71cec0ad08
+size 17286304416

Umbra-v2.1-MoE-4x10.7-Q3_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9e59ee8c05ae3c1589b208d81134fa885e56f4167d069bd57d81363c0e66739
+size 15566115488

Umbra-v2.1-MoE-4x10.7-Q4_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:471eadcfbc0dac0962c33214c74c88b904c947d4edc41707494ceba3c1d8ec5c
+size 21822288544

Umbra-v2.1-MoE-4x10.7-Q4_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:588067b33339644534fcb1bcccd36dc967b40c5ce9f110bb7646e3b556f5c1c6
+size 20521267872

Umbra-v2.1-MoE-4x10.7-Q5_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95fdac6303275049283e13742e6a7f2dc44df1e22457dec48da376b696f1ba34
+size 25600963232

Umbra-v2.1-MoE-4x10.7-Q5_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5484f7915030816b4b4fe4a19ce96956793a6c3c2d9979e55ff58de4cc5ca887
+size 24838910624

Umbra-v2.1-MoE-4x10.7-Q6_K.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d8b23e5d763e8dd21c69e8ed8be8e536be246d778e4f1f674a4c52edca3da60
+size 29615805088

Umbra_Tavern.png ADDED Viewed

mergekit_moe_config.yml ADDED Viewed

	@@ -0,0 +1,113 @@

+base_model: vicgalle/CarbonBeagle-11B
+gate_mode: hidden
+dtype: bfloat16
+experts:
+  - source_model: vicgalle/CarbonBeagle-11B
+    positive_prompts:
+    - "versatile"
+    - "adaptive"
+    - "comprehensive"
+    - "integrated"
+    - "balanced"
+    - "all-rounder"
+    - "flexible"
+    - "wide-ranging"
+    - "multi-disciplinary"
+    - "holistic"
+    - "innovative"
+    - "eclectic"
+    - "resourceful"
+    - "dynamic"
+    - "robust"
+    negative_prompts:
+    - "narrow"
+    - "specialized"
+    - "limited"
+    - "focused"
+  - source_model: Sao10K/Fimbulvetr-10.7B-v1
+    positive_prompts:
+    - "creative"
+    - "storytelling"
+    - "expressive"
+    - "imaginative"
+    - "engaging"
+    - "verbose"
+    - "narrative"
+    - "descriptive"
+    - "elaborate"
+    - "fictional"
+    - "artistic"
+    - "vivid"
+    - "colorful"
+    - "fantastical"
+    - "lyrical"
+    negative_prompts:
+    - "sorry"
+    - "I cannot"
+    - "factual"
+    - "concise"
+    - "straightforward"
+    - "objective"
+    - "dry"
+  - source_model: bn22/Nous-Hermes-2-SOLAR-10.7B-MISALIGNED
+    positive_prompts:
+    - "intelligent"
+    - "analytical"
+    - "accurate"
+    - "knowledgeable"
+    - "logical"
+    - "data-driven"
+    - "scientific"
+    - "rational"
+    - "precise"
+    - "methodical"
+    - "empirical"
+    - "systematic"
+    - "efficient"
+    - "scholarly"
+    - "statistical"
+    - "calculate"
+    - "compute"
+    - "solve"
+    - "work"
+    - "python"
+    - "javascript"
+    - "programming"
+    - "algorithm"
+    - "tell me"
+    - "assistant"
+    negative_prompts:
+    - "creative"
+    - "imaginative"
+    - "abstract"
+    - "emotional"
+    - "artistic"
+    - "speculative"
+  - source_model: Yhyu13/LMCocktail-10.7B-v1
+    positive_prompts:
+    - "instructive"
+    - "verbose"
+    - "descriptive"
+    - "clear"
+    - "detailed"
+    - "informative"
+    - "explanatory"
+    - "elucidative"
+    - "articulate"
+    - "comprehensive"
+    - "educational"
+    - "thorough"
+    - "specific"
+    - "clarifying"
+    - "structured"
+    negative_prompts:
+    - "concise"
+    - "vague"