头像

MD_星辰

帅气的我简直无法用语言描述!

3 万亿 Tokens !

最近,Hugging Face 发布了史上最大规模的开源 PDF 数据集 FinePDFs 总结下核心信息:数据规模:3 万亿 tokens,覆盖 1733 种语言的 4.75 亿份 PDF,总大小约...
头像4小时前
000