产品中心

从OmniGen的数据 模型设计与训练战略中深度了解多模态统永世成模型
从OmniGen的数据 模型设计与训练战略中深度了解多模态统永世成模型

​从OmniGen的训练数据、模型设计与训练战略中深度了解多模态统永世成模型,当天详细讲讲多模态大模型OmniGen~之前有总结过一篇多模态大模型的钻研趋向,感...

+查看全文

15 2024-11

最新RAG综述来了!北京大学颁布AIGC的检索增强技术综述
最新RAG综述来了!北京大学颁布AIGC的检索增强技术综述

近期,RAG,Retrieval,AugmentedGeneration,在AI畛域惹起了宽泛关注,成为了泛滥钻研者和开发者热议的焦点,作为一种将检索与生成相结...

+查看全文

15 2024-11

Sample 训练的 长序列 LLM Attention 疑问及优化 Packing
Sample 训练的 长序列 LLM Attention 疑问及优化 Packing

一、背景之前看过局部Megatron,LM的源码,也详细剖析过对应的>,SamplePacking中有很多可以探讨的技术点,比如Attention的成功和优...

+查看全文

15 2024-11

KimiChat 秒让 10 给你画个流程图
KimiChat 秒让 10 给你画个流程图

这两天又发现了KimiChat一个牛逼的用法,如今曾经在探求KimiChat的路线上越走越远,这次开掘到的牛逼用法就是可以让KimiChat间接生成流程图,是不...

+查看全文

15 2024-11

一文彻底搞懂论文
一文彻底搞懂论文

GPT,2是一个大规模无监视言语模型,它可以生成连接的文本段落,在许多言语建模基准上成功最先进的功能,并口头基本的阅读了解、机器翻译、问答和总结——一切这些都不...

+查看全文

15 2024-11