LM datas
updated
Updated • 2.53k
• 178
Updated • 2.04k
• 493
nampdn-ai/tiny-strange-textbooks
Viewer
• Updated • 1M • 41
• 92
Viewer
• Updated • 61.6M • 106k
• 1.19k
Viewer
• Updated • 2.94M • 22.5k
• 1.52k
Updated • 137k
• 600
Viewer
• Updated • 420k • 487
• 168
togethercomputer/RedPajama-Data-V2
Updated • 4.1k
• 401
nampdn-ai/tiny-math-textbooks
Viewer
• Updated • 635k • 46
• 25
Viewer
• Updated • 44.8k • 147
• 54
Viewer
• Updated • 10.4B • 627k
• 546
Updated • 8.17k
• 351
Updated • 14k
• 151
Viewer
• Updated • 720k • 497
• 27
Viewer
• Updated • 7.18B • 17.7k
• 610
Viewer
• Updated • 1.01M • 23.6k
• 143
Viewer
• Updated • 20k • 11
• 24
nampdn-ai/tiny-bridgedict
Viewer
• Updated • 17.6k • 9
• 18
nampdn-ai/tiny-orca-textbooks
Viewer
• Updated • 147k • 69
• 43
Preview
• Updated • 316
• 194
Viewer
• Updated • 7.89M • 8.11k
• 185
Viewer
• Updated • 1.63M • 2.26k
• 286
Updated • 8.47k
• 196
Viewer
• Updated • 1.91M • 31
• 10
Viewer
• Updated • 31.1M • 14.1k
• 683
CausalLM/Refined-Anime-Text
Viewer
• Updated • 1.02M • 31
• 267
Updated • 82.2k
• 137
Viewer
• Updated • 8.01M • 75.8k
• 502
Locutusque/UltraTextbooks-2.0
Viewer
• Updated • 3.22M • 187
• 51
Viewer
• Updated • 654k • 498
• 189
Updated • 2.92k
• 1.01k
Viewer
• Updated • 5.86M • 458
• 56
Viewer
• Updated • 221k • 2
• 7
Viewer
• Updated • 2.2M • 15
• 3
YeungNLP/firefly-pretrain-dataset
Viewer
• Updated • 2.46M • 282
• 42
Viewer
• Updated • 1.8k • 435
• 93
Viewer
• Updated • 933 • 10
• 3
Viewer
• Updated • 968M • 42k
• 904
Viewer
• Updated • 636M • 410
• 17
Viewer
• Updated • 1.77B • 2.93k
• 79
Updated • 10.1k
• 222
open-web-math/open-web-math
Viewer
• Updated • 6.32M • 18.1k
• 333
Viewer
• Updated • 291M • 101
• 25
Viewer
• Updated • 52.5B • 624k
• 2.75k
HuggingFaceTB/smollm-corpus
Viewer
• Updated • 237M • 46.2k
• 449
Viewer
• Updated • 1.06M • 155
• 38
Viewer
• Updated • 2.14M • 98.1k
• 952
Viewer
• Updated • 6.43B • 5.79k
• 174
Viewer
• Updated • 219k • 298
• 38
opencsg/chinese-cosmopedia
Preview
• Updated • 1.17k
• 77
Updated • 545
• 38
Viewer
• Updated • 54.8M • 10.7k
• 58
Viewer
• Updated • 826M • 9.99k
• 66
Hieuman/wikitext-103-filtered
Viewer
• Updated • 717k • 12
• 2
Viewer
• Updated • 3.71M • 1.16M
• 665
iohadrubin/wikitext-103-raw-v1
Viewer
• Updated • 29.7k • 395
• 8
Viewer
• Updated • 100k • 1.03k
• 8
ashaba1in/small_openwebtext
Viewer
• Updated • 1M • 13
• 1
Viewer
• Updated • 1.04M • 606
• 6
TigerResearch/pretrain_zh
Viewer
• Updated • 16.9M • 854
• 122
erhwenkuo/pretrain-chinese-zhtw
Viewer
• Updated • 11.5M • 160
• 3
karpathy/tiny_shakespeare
Updated • 4.3k
• 75
Viewer
• Updated • 69.9k • 231k
• 390
Viewer
• Updated • 621M • 13.3k
• 87
Viewer
• Updated • 170M • 14.4k
• 91
institutional/institutional-books-1.0
Viewer
• Updated • 983k • 8.64k
• 272
EssentialAI/essential-web-v1.0
Preview
• Updated • 38.6k
• 221
PrimeIntellect/SYNTHETIC-2-Base
Viewer
• Updated • 465k • 62
• 9
shajiu/TibetanGeneral_corpus
Viewer
• Updated • 259k • 8
• 5
Viewer
• Updated • 476M • 21.7k
• 840
xTimeCrystal/TinyCorpus-v2
Viewer
• Updated • 12.9M • 73
• 5
karpathy/fineweb-edu-100b-shuffle
Viewer
• Updated • 97.2M • 9.25k
• 163
Viewer
• Updated • 47.6M • 27.5k
• 299