深入解析 LLM 函数调用能力优化：Prompt 格式与数据策略 | 极客日志

编程语言AI算法

深入解析 LLM 函数调用能力优化：Prompt 格式与数据策略

探讨了提升大语言模型函数调用能力的关键策略。研究指出，采用专门角色呈现函数描述能显著提高相关性检测准确率。引入指令跟随数据不仅不削弱功能，反而增强语义理解。决策 Token 机制通过二元决策明确化生成路径，简化非函数调用数据构建。多语言支持需采用细粒度翻译管道以保持结构完整性。工程师应优先设计区分明显的提示模板，混合训练数据，并实施严格的评估流程以优化模型表现。

Qiny01发布于 2025/2/7更新于 2026/7/2138 浏览

函数调用能力的关键地位

在当前大语言模型（LLM）的应用生态中，函数调用能力（Function Calling）已经成为一项不可或缺的核心能力。它使 LLM 能够通过调用外部 API 获取实时信息、操作第三方服务，从而将模型的语言理解能力转化为实际的行动能力。从电子设计自动化到金融报告生成，从旅行规划到智能家居控制，函数调用正在将 LLM 的应用版图快速扩展到各个领域。

然而，如何让 LLM 更准确地理解和使用函数接口，一直是困扰研究者和工程师的关键问题。传统的提示工程往往依赖简单的自然语言描述，这容易导致模型产生幻觉或错误地调用不存在的函数。MediaTek Research 的研究团队最近在这一领域取得了重要突破，他们从提示格式优化、数据集成策略到多语言支持等多个维度，系统性地提升了 LLM 的函数调用能力。本文将详细解析他们的研究发现，为从事 LLM 应用开发的工程师提供切实可行的优化方案。

提示工程最新：重新思考函数描述的呈现方式

在这项研究中，研究者首先挑战了传统的函数描述方式。他们提出了两种不同的策略来在提示中展示函数描述：

专门角色策略： 为函数描述创建一个独立的角色（如"tools"），以 JSON 格式呈现函数信息。

系统角色集成策略： 将函数描述直接嵌入到系统角色的提示中，与使用说明一起呈现。

这两种策略的实验结果令人深思。研究发现，当函数描述通过专门角色呈现时，模型在相关性检测（Relevance Detection）方面表现更好。这意味着模型能更准确地判断是否需要调用函数，从而减少不必要的函数调用。研究发现，使用专门角色策略时，相关性检测准确率达到 49.58%，而系统角色集成策略则为 39.58%。

研究者认为，这种差异源于模型能更清晰地识别出有函数可用和无函数可用的场景之间的区别。当函数描述被放在专门的角色中时，有函数和无函数的提示模板差异更明显，这帮助模型建立了更强的区分能力。这种结构化的输入方式有助于模型注意力机制聚焦于工具定义区域，而非将其淹没在通用的系统指令中。

Prompt 格式示例

毫无疑问，精确推理时，Prompt 格式显著影响推理的精准度。研究中探索了三种主要的提示格式：

无函数场景:

<|im_start|>system  
You are a helpful assistant.  
<|im_end|>  
<|im_start|>user  
Where is Boston?  
<|im_end|>  
<|im_start|>assistant

专门角色提供函数:

<|im_starttools  
[{"name": "get_current_weather",   
"description": "Get the current weather in a given location",   
"parameters": {"type": "object", "properties": {"location":   
{"type": "string", "description": "The city and state"}},   
"required": ["location"]}}]  
im_end  
im_start  
You  a helpful assistant.  
im_end  
im_start  
What  the weather   Boston?  
im_end  
im_startassistant

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

<|im_start|>system  
You are an expert in composing functions. Here is a list of functions in JSON format that you can invoke: [{"name": "get_current_weather", "description": "Get the current weather in a given location", "parameters": {"type": "object", "properties": {"location": {"type": "string", "description": "The city and state"}}, "required": ["location"]}}]  
<|im_end|>  
<|im_start|>user  
What is the weather like in Boston?  
<|im_end|>  
<|im_start|>assistant

Boston is the capital city of the state of Massachusetts, located in the northeastern United States.  
<|im_end|>

<|answer|>Boston is the capital city of the state of Massachusetts, located in the northeastern United States.  
<|im_end|>

[get_current_weather(location="Boston")]  
<|im_end|>

<|use_tool|>[get_current_weather(location="Boston")]  
<|im_end|>

<|use_tool|>The user wants to get the weather in Boston. The available tool 'get_current_weather' can be used to retrieve this information. The 'get_current_weather' tool can be used by specifying the city as 'Boston'.  
[get_current_weather(location="Boston")]  
<|im_end|>

{  
    "conversations": [  
        {"role": "user", "content": "What's the weather like in Taipei?"},  
        {"role": "assistant", "content": "Let me check the weather for you."},  
        {"tool_calls": [{"name": "get_current_weather", "arguments": {"location": "Taipei"}}]}  
    ]  
}

{  
    "conversations": [  
        {"role": "user", "content": "台北的天氣如何？"},  
        {"role": "assistant", "content": "讓我幫您查看天氣。"},  
        {"tool_calls": [{"name": "get_current_weather", "arguments": {"location": "Taipei"}}]}  
    ]  
}

语言	原始 AST Summary	翻译后 AST Summary	提升
中文	52.37%	61.56%	+9.19%
日语	51.25%	59.83%	+8.58%
韩语	50.94%	58.71%	+7.77%

深入解析 LLM 函数调用能力优化：Prompt 格式与数据策略

函数调用能力的关键地位

提示工程最新：重新思考函数描述的呈现方式

Prompt 格式示例

更多推荐文章

相关免费在线工具

数据集成：指令数据的意外收获

Decision Token：二元决策机制

多语言支持的突破：专向翻译管道

多语言翻译 Pipeline 的技术细节

实践启示：面向工程师的优化建议

总结

更多推荐文章

相关免费在线工具

深入解析 LLM 函数调用能力优化：Prompt 格式与数据策略

函数调用能力的关键地位

提示工程最新：重新思考函数描述的呈现方式

Prompt 格式示例

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

数据集成：指令数据的意外收获

Decision Token：二元决策机制

多语言支持的突破：专向翻译管道

多语言翻译 Pipeline 的技术细节

实践启示：面向工程师的优化建议

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具