大家好,我是小寒。
今天给大家分享一个神奇的 python 库,embedchain。
https://github.com/embedchain/embedchain
Embedchain 是一个开源的 python 库,可以在任何数据集上轻松创建 LLM(大语言模型) 支持的机器人的框架。
你可以使用 .add 方法添加单个或多个数据集。然后,只需使用.query 方法从添加的数据集中查找答案即可。
Embedchain 将负责剩下的工作,为你创建一个机器人。
pip install --upgrade embedchain
创建聊天机器人只需要 3 个步骤:
使用以下代码在 python 中运行你的第一个机器人。
注意:需要首先设置正确的 OPENAI_API_KEY 。
import os
from embedchain import App
os.environ["OPENAI_API_KEY"] = "xxx"
elon_musk_bot = App()
# Embed Online Resources
elon_musk_bot.add("https://en.wikipedia.org/wiki/Elon_Musk")
elon_musk_bot.add("https://www.forbes.com/profile/elon-musk")
response = elon_musk_bot.query("How many companies does Elon Musk run and name those?")
print(response)
# Answer: 'Elon Musk currently runs several companies. As of my knowledge, he is the CEO and lead designer of SpaceX, the CEO and product architect of Tesla, Inc., the CEO and founder of Neuralink, and the CEO and founder of The Boring Company. However, please note that this information may change over time, so it's always good to verify the latest updates.'
下面让我们添加其他类型数据,例如youtube、pdf、sitemap等。
app.add( 'a_valid_youtube_url_here' , data_type= 'youtube_video' )
要添加任何 pdf 文件,请将 data_type 设置为 pdf_file。
app.add('a_valid_url_where_pdf_file_can_be_accessed', data_type='pdf_file')
注意,这里不支持受密码保护的 pdf 文件。
要添加任何 doc/docx 文件,请将 data_type 设置为 docx。
docx 允许远程 URL 和常规文件路径。
app.add('https://example.com/content/intro.docx', data_type="docx")
app.add('content/intro.docx', data_type="docx")
要添加任何网页,请将 data_type 设置为 web_page。
app.add('a_valid_web_page_url', data_type='web_page')
要添加任何 csv 文件,请将 data_type 设置为 csv。
csv 允许远程 URL 和常规文件路径。
app.add('https://example.com/content/sheet.csv', data_type="csv")
app.add('content/sheet.csv', data_type="csv")
app.add('https://example.com/sitemap.xml', data_type='sitemap')
最后
—
「进群方式:加我微信,备注 “python”」
往期回顾
如果对本文有疑问可以加作者微信直接交流。进技术交流群的可以加微信拉你进群。
微信扫一扫
关注该公众号