产品中心

mPLUG
mPLUG

OCR,Free多页文档了解的应战与停顿在现代消息时代,多页文档的智能了解和处置变得尤为关键,这些文档或者包括书籍、报告、学术论文等,它们理论蕴含少量的文本、图...

+查看全文

15 2024-11

清华大学揭发RAG的双面性 片面剖析提醒大模型中RAG噪声的作用
清华大学揭发RAG的双面性 片面剖析提醒大模型中RAG噪声的作用

引言,RAG技术与大型言语模型中的噪声疑问在大型言语模型,LLMs,的钻研与运行中,噪声疑问不时是一个不容漠视的应战,这些模型在处置复杂的言语了解和生成义务时,...

+查看全文

15 2024-11

上 优雅谈大模型 文言ZeRO
上 优雅谈大模型 文言ZeRO

并行战略正如和散布式一样,如何应用多设施和多配件也是很关键的一个环节,大模型训练也是如此,当初训练大模型离不开各种散布式并行战略,罕用的并行战略包含,下图为其中...

+查看全文

15 2024-11

1.5开源来袭 Jamba前生今世
1.5开源来袭 Jamba前生今世

Jamba算是环球上第一款基于Mamba的消费级别的模型,近日AI21Labs颁布Jamba1.5系列开明模型,包含Jamba1.5Mini和Jamba1.5L...

+查看全文

15 2024-11

WordLlama 瘦子 在消费级GPU上奔跑的
WordLlama 瘦子 在消费级GPU上奔跑的

DavidMiller示意该模型的指标很明白,弥合尖端AI钻研和实践运行之间的差距,他意识到,许多现有NLP模型须要少量的计算资源,并且通常局限于专有系统,从而...

+查看全文

15 2024-11