OpenAI联合创始人Andrej Karpathy分享其利用大语言模型构建个人知识库的核心工作流,其token消耗重点已从编写代码转向管理和操作知识。
完整五步工作流如下:
-
数据摄入
将文章、论文、代码等源文档索引,由LLM增量“编译”成Markdown维基,包含摘要、反向链接和概念分类。 -
浏览界面
使用Obsidian作为前端,查看原始数据和LLM维护的维基内容,用户几乎无需直接编辑。 -
问答查询
当维基积累到一定规模(例如一个方向达40万字),可直接向LLM提出复杂问题,LLM能自行检索维基内容作答。在此规模下,LLM自动维护的索引已能满足需求。 -
输出回流
查询结果可生成Markdown、幻灯片或图表,在Obsidian中查看后归档回维基,实现知识沉淀。 -
质量巡检
由LLM定期对维基进行“健康检查”,发现不一致、补全信息并挖掘概念关联,持续提升数据完整性。
Karpathy还开发了配套的简易维基搜索引擎。他认为此工作流虽由脚本拼凑而成,但背后蕴藏着巨大的产品潜力。未来的设想是,针对复杂问题,可派出一组LLM自动构建临时维基、进行质量巡检并迭代,最终生成远超单次回答的完整报告。