【Model】【llm38】Llama API - 示例

优质文章学习记录

11 Apr 2026 — 6 min read

案例目标

Llama API是一个托管的Llama 2 API服务，支持函数调用功能。本案例展示了如何通过LlamaIndex集成Llama API，实现基本的文本补全、对话交互、函数调用和结构化数据提取功能。Llama API为开发者提供了一个便捷的方式来使用Llama 2模型，无需本地部署，可以直接通过API调用模型服务，大大简化了使用流程。同时，该API支持函数调用功能，使得模型能够与外部工具和服务进行交互，扩展了应用场景。

环境配置

1. 安装依赖

安装必要的依赖包：

%pip install llama-index-program-openai %pip install llama-index-llms-llama-api !pip install llama-index

2. 获取API密钥

要运行此示例，您需要从Llama API官网获取API密钥。

3. 导入库并设置API密钥

导入必要的库并设置API密钥：

from llama_index.llms.llama_api import LlamaAPI api_key = "LL-your-key" llm = LlamaAPI(api_key=api_key)

案例实现

1. 基本用法 - 文本补全

使用complete方法进行文本补全：

resp = llm.complete("Paul Graham is ") print(resp)

输出示例：

Paul Graham is a well-known computer scientist and entrepreneur, best known for his work as a co-founder of Viaweb and later Y Combinator, a successful startup accelerator. He is also a prominent essayist and has written extensively on topics such as entrepreneurship, software development, and the tech industry.

2. 基本用法 - 对话交互

使用chat方法进行对话交互：

from llama_index.core.llms import ChatMessage messages = [ ChatMessage( role="system", content="You are a pirate with a colorful personality" ), ChatMessage(role="user", content="What is your name"), ] resp = llm.chat(messages) print(resp)

输出示例：

assistant: Arrrr, me hearty! Me name be Captain Blackbeak, the scurviest dog on the seven seas! Yer lookin' fer a swashbucklin' adventure, eh? Well, hoist the sails and set course fer the high seas, matey! I be here to help ye find yer treasure and battle any scurvy dogs who dare cross our path! So, what be yer first question, landlubber?

3. 函数调用

使用函数调用功能，定义一个Song模型：

from pydantic import BaseModel from llama_index.core.llms.openai_utils import to_openai_function class Song(BaseModel): """A song with name and artist""" name: str artist: str song_fn = to_openai_function(Song)

使用函数调用生成歌曲信息

llm = LlamaAPI(api_key=api_key) response = llm.complete("Generate a song", functions=[song_fn]) function_call = response.additional_kwargs["function_call"] print(function_call)

输出示例：

{'name': 'Song', 'arguments': {'name': 'Happy', 'artist': 'Pharrell Williams'}}

4. 结构化数据提取

定义Album和Song模型，用于结构化数据提取：

from pydantic import BaseModel from typing import List class Song(BaseModel): """Data model for a song.""" title: str length_mins: int class Album(BaseModel): """Data model for an album.""" name: str artist: str songs: List[Song]

创建Pydantic程序

from llama_index.program.openai import OpenAIPydanticProgram"\ Extract album and songs from the text provided. For each song, make sure to specify the title and the length_mins. {text} """ llm = LlamaAPI(api_key=api_key, temperature=0.0) program = OpenAIPydanticProgram.from_defaults( output_cls=Album, llm=llm, prompt_template_str=prompt_template_str, verbose=True, )

运行程序提取结构化数据

output = program(" "Echoes of Eternity" is a compelling and thought-provoking album, skillfully crafted by the renowned artist, Seraphina Rivers. \ This captivating musical collection takes listeners on an introspective journey, delving into the depths of the human experience \ and the vastness of the universe. With her mesmerizing vocals and poignant songwriting, Seraphina Rivers infuses each track with \ raw emotion and a sense of cosmic wonder. The album features several standout songs, including the hauntingly beautiful "Stardust \ Serenade," a celestial ballad that lasts for six minutes, carrying listeners through a celestial dreamscape. "Eclipse of the Soul" \ captivates with its enchanting melodies and spans over eight minutes, inviting introspection and contemplation. Another gem, "Infinity \ Embrace," unfolds like a cosmic odyssey, lasting nearly ten minutes, drawing listeners deeper into its ethereal atmosphere. "Echoes of Eternity" \ is a masterful testament to Seraphina Rivers' artistic prowess, leaving an enduring impact on all who embark on this musical voyage through \ time and space. """ )

输出示例：

Function call: Album with args: {'name': 'Echoes of Eternity', 'artist': 'Seraphina Rivers', 'songs': [{'title': 'Stardust Serenade', 'length_mins': 6}, {'title': 'Eclipse of the Soul', 'length_mins': 8}, {'title': 'Infinity Embrace', 'length_mins': 10}]}

查看结构化输出

output

输出示例：

Album(name='Echoes of Eternity', artist='Seraphina Rivers', songs=[Song(title='Stardust Serenade', length_mins=6), Song(title='Eclipse of the Soul', length_mins=8), Song(title='Infinity Embrace', length_mins=10)])

案例效果

本案例展示了Llama API的多种功能和应用场景：

基本文本补全：能够完成简单的文本补全任务，如介绍Paul Graham
对话交互：支持多轮对话，能够根据系统提示和用户消息生成符合角色的回应
函数调用：支持函数调用功能，能够根据输入生成结构化的函数调用参数
结构化数据提取：能够从非结构化文本中提取结构化信息，如从专辑描述中提取专辑名、艺术家和歌曲列表
OpenAI兼容性：与OpenAI API兼容，可以使用OpenAI的工具和库进行集成

案例实现思路

本案例的实现基于以下思路：

API集成：通过LlamaIndex的LlamaAPI类封装Llama API服务，提供统一的接口
基本交互：实现complete和chat两种基本交互方式，满足不同场景需求
函数调用：利用OpenAI兼容的函数调用功能，实现模型与外部工具的交互
结构化数据提取：通过Pydantic模型定义数据结构，使用OpenAIPydanticProgram提取结构化信息
模型定义：使用Pydantic定义数据模型，确保输出的结构化和类型安全
提示工程：设计合适的提示模板，引导模型生成符合要求的输出

扩展建议

更多函数调用：定义更多复杂的函数，实现更丰富的交互功能
多模态支持：如果API支持，可以扩展到多模态数据处理
错误处理：添加完善的错误处理机制，提高应用稳定性
缓存机制：实现响应缓存，减少重复请求，提高效率
流式响应：如果API支持，实现流式响应功能
性能监控：监控API调用的响应时间和资源消耗
成本控制：监控API调用成本，优化使用策略
自定义工具：开发自定义工具，扩展模型的能力边界

总结

Llama API为开发者提供了一个便捷的方式来使用Llama 2模型，无需本地部署，可以直接通过API调用模型服务。通过LlamaIndex的集成，开发者可以使用简单的API调用实现文本补全、对话交互、函数调用和结构化数据提取等功能。特别是函数调用和结构化数据提取功能，使得模型能够与外部工具和服务进行交互，大大扩展了应用场景。Llama API的OpenAI兼容性也使得开发者可以复用现有的OpenAI工具和库，降低了学习成本。总体而言，Llama API是一个值得考虑的Llama 2模型服务方案，特别适合那些希望快速部署Llama 2应用的开发者。

从GAN到ChatGPT：AIGC技术演进与实战应用指南

快速体验在开始今天关于从GAN到ChatGPT：AIGC技术演进与实战应用指南的探讨之前，我想先分享一个最近让我觉得很有意思的全栈技术挑战。我们常说 AI 是未来，但作为开发者，如何将大模型（LLM）真正落地为一个低延迟、可交互的实时系统，而不仅仅是调个 API？这里有一个非常硬核的动手实验：基于火山引擎豆包大模型，从零搭建一个实时语音通话应用。它不是简单的问答，而是需要你亲手打通 ASR（语音识别）→ LLM（大脑思考）→ TTS（语音合成）的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说，这是个绝佳的练手项目。从0到1构建生产级别应用，脱离Demo，点击打开从0打造个人豆包实时通话AI动手实验从GAN到ChatGPT：AIGC技术演进与实战应用指南技术背景：关键模型演进时间轴 2014年 - GAN横空出世生成对抗网络(GAN)通过生成器与判别器的对抗训练，首次实现了高质量图像生成。核心突破在于：

GitHub Copilot学生认证指南：轻松获取两年免费Copilot Pro

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 点击'项目生成'按钮，等待项目生成完整后预览效果输入框输入如下内容帮我开发一个GitHub Copilot认证辅助工具，帮助学生群体快速通过教育认证。系统交互细节：1.自动检测双重认证状态 2.生成标准化申请模板 3.模拟定位功能 4.材料预审提示，注意事项：需准备.edu.cn邮箱和有效学生证明。认证核心要点解析 1. 双重认证是前提 2. 必须使用Authenticator应用完成2FA设置 3. 仅绑定手机号无法通过审核 4. 开发者工具显示Configured才算成功 5. 定位信息匹配技巧 6. 使用浏览器开发者工具修改定位 7. 需精确到学校建筑经纬度 8.

【AIGC】AI工作流workflow实践：构建日报

workflow实践 * 引言 * 实现步骤分析 * 实践 * 创建 dify workflow 应用 * 创建工作流内部节点 * 1、设置输入字段 * 2、创建两个LLM节点 * 3、设置结束节点 * 运行工作流 * 结语引言工作流 workflow 是现在 LLM 很重要的一个概念，因为对于一个模型来说，非常复杂的问题很难一次性完美解决，而且可能需要很多别的辅助工具。而工作流就是将这些工具和模型组合起来，形成一个完整的解决方案。今天我们来做个工作流实践，帮助读者理解工作流。我们来构建一个帮助我们写日报的工作流。在帮助我们完成日报的填写的同时，我们需要它进行 AI 味的去除，免得出现别人一看就是 AI 写出来的文章的情况。实现步骤分析 1. 我们需要一个可以构建工作流的平台，这边我们选择 dify 2. 我们需要模型根据我们提供的今天做的事情去自动生成日报我们需要对刚才生成的文章进行 AI 味的去除实践创建

Intel GPU加速llama.cpp：SYCL后端完整配置与性能调优指南

Intel GPU加速llama.cpp：SYCL后端完整配置与性能调优指南【免费下载链接】llama.cppPort of Facebook's LLaMA model in C/C++ 项目地址: https://gitcode.com/GitHub_Trending/ll/llama.cpp 随着Intel Arc显卡在消费级市场的普及，越来越多的开发者希望利用Intel GPU来加速大语言模型的推理。llama.cpp作为当前最流行的开源LLM推理框架，通过SYCL后端为Intel GPU提供了强大的计算支持。本文将从实际使用角度出发，深入解析SYCL后端的配置要点和性能优化技巧。为什么SYCL是Intel GPU的最佳选择？在llama.cpp的多后端架构中，SYCL相比传统的OpenCL具有显著优势。SYCL基于现代C++标准，提供了更简洁的编程模型和更好的编译器支持。对于Intel Arc显卡用户，SYCL能够充分利用Xe架构的硬件特性，在矩阵乘法等核心操作上实现更高的计算效率。环境配置：避开常见的安装陷阱正确安装Intel

案例目标

环境配置

1. 安装依赖

2. 获取API密钥

3. 导入库并设置API密钥

案例实现

1. 基本用法 - 文本补全

2. 基本用法 - 对话交互

3. 函数调用

使用函数调用生成歌曲信息

4. 结构化数据提取

创建Pydantic程序

运行程序提取结构化数据

查看结构化输出

案例效果

案例实现思路

扩展建议

总结

Read more

从GAN到ChatGPT：AIGC技术演进与实战应用指南

GitHub Copilot学生认证指南：轻松获取两年免费Copilot Pro

【AIGC】AI工作流workflow实践：构建日报

Intel GPU加速llama.cpp：SYCL后端完整配置与性能调优指南