Kendamarron
commited on
Commit
•
21f7817
1
Parent(s):
237c312
Update README.md
Browse files
README.md
CHANGED
@@ -7,7 +7,7 @@ pipeline_tag: text-classification
|
|
7 |
|
8 |
[HuggingFaceFW/fineweb-edu-classifier](https://huggingface.co/HuggingFaceFW/fineweb-edu-classifier)を再現するために、日本語データで[pkshatech/GLuCoSE-base-ja](https://huggingface.co/pkshatech/GLuCoSE-base-ja)を学習したモデルです。
|
9 |
|
10 |
-
学習データは、[oscar-corpus/OSCAR-2301](https://huggingface.co/datasets/oscar-corpus/OSCAR-2301)
|
11 |
|
12 |
詳細については[こちら](https://zenn.dev/kendama/articles/aba63f14f88e6e)をご覧ください。
|
13 |
|
|
|
7 |
|
8 |
[HuggingFaceFW/fineweb-edu-classifier](https://huggingface.co/HuggingFaceFW/fineweb-edu-classifier)を再現するために、日本語データで[pkshatech/GLuCoSE-base-ja](https://huggingface.co/pkshatech/GLuCoSE-base-ja)を学習したモデルです。
|
9 |
|
10 |
+
学習データは、[oscar-corpus/OSCAR-2301](https://huggingface.co/datasets/oscar-corpus/OSCAR-2301)の日本語サブセットから抽出した16913個の文書に対して、[TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF](https://huggingface.co/TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF)のQ3_Kを使ってスコアリングしたものを使用しています。
|
11 |
|
12 |
詳細については[こちら](https://zenn.dev/kendama/articles/aba63f14f88e6e)をご覧ください。
|
13 |
|