分享
langchain全景图
输入“/”快速插入内容
langchain全景图
飞书用户1255
2024年6月28日修改
LangChain是一个开源框架,专注于简化和加速在应用程序中集成及利用大型语言模型(LLMs)的过程。它为开发者提供了一套丰富的工具、组件和接口,使得与复杂语言模型的交互变得更为直接和高效。LangChain的核心特点和功能包括:
1.
通用的LLM接口:支持多种主流的大型语言模型,如GPT-3、GPT-4、LaMDA等,通过统一的接口进行访问和操作,降低了模型切换的成本。
2.
提示管理与定制:允许用户根据应用场景自定义提示模板,优化语言模型的输入,以获得更精准的输出结果。
3.
链式结构设计:通过“链”这一概念,可以将不同的处理步骤和组件串联起来,形成复杂的逻辑流程,便于构建高级应用,如多轮对话系统、复杂决策支持等。
4.
外部数据与工具集成:支持集成外部API、数据库和其他数据源,使得语言模型能够访问和利用更多上下文信息,扩展其功能和应用范围。
5.
LangChain表达语言(LCEL):这是一种声明式语言,用户可以用它来描述处理流程,从简单的模型调用到复杂的逻辑链,便于非程序员也能快速构建应用原型,且支持从原型到生产环境的平滑过渡。
6.
支持多语言:LangChain框架目前支持Python和JavaScript两种编程语言,便于不同背景的开发者使用。
7.
开源与社区驱动:LangChain遵循MIT许可,拥有活跃的开发者社区,不断更新和增加新的功能模块,保持框架的前沿性和实用性。
总之,LangChain作为一个高度模块化、灵活且强大的工具集,旨在帮助开发者快速将先进的语言模型技术融入到各类应用程序中,无论是创建聊天机器人、问答系统、内容生成还是数据分析等,都能通过LangChain实现更高效、低门槛的开发。
langchain项目目标
通过LLM的组合创建应用程序万花筒,目前
GitHub Star超过2万
,
项目架构
下图中每个部件其实都是一类集合,我们以汽车(人)来类比一个基于LangChain的Agent,核心组件包括:
•
系统发动机(心脏):开源Models以及其封装的LLMS
•
汽油(血液):Prompt
•
方向盘(大脑):Memory
•
前进(创造新应用):LLMChain
•
听流行音乐(链接千行万业):Tools
•
播放珍藏光碟(链接垂直私有领域):Index私有数据
•
开车旅行(开放生态):Agent智能
下面是一张简图:
草图
项目全景图
整体分为:基础层、能力层、应用层三部分(
如果不清晰,建议点击github浏览
)
基础层
包括:Models、LLM、Index三层:
Models层:
吐血整理最近3年左右的模型、详细文档。可以看出各家大模型的演进历史,其中Google、OpenAI、Meta、DeepMind领先优势非常大,国内大厂唯独腾讯缺席。有几个点:
•
目前最主要的几个大模型为: Google的LaMDA、Meta的LLaMa、OpenAI的GPT-4、DeepMind的:Chinchilla
•
另外目前投入应用的智能终端基本都是基于模型的Fine-Tuning或者RLHF技术,并且需要大量的相关行业训练集,典型比如code领域、
财经领域BloombergGPT
、学术论文编写等,其中在作者最关注的Code细分领域,目前的模型有:
◦
OpenAI的Codex
◦
DeepMind的AlphaCode
•
Saleforce的CodeGen