数据分片是关键第一步。文档切太碎,上下文割裂;切太整,检索不精准。技术手册按章节切,问答对按条目切,不同类型策略不同。分片后生成向量,存入向量数据库。...
一旦模型能读完所有内容检索增强生成(RAG)就没有存在的必要了,开发者只需要把整个代码库或者多年的聊天记录塞进 prompt,让模型自行处理,所以AI行业花了......