前端实现 PDF 文件预览的 7 种方案详解

优质文章学习记录

09 Apr 2026 — 5 min read

前端实现 PDF 文件预览的 7 种方案详解

一、原生浏览器方案

1. 使用 `<embed>` 标签

<embedsrc="document.pdf"type="application/pdf"width="100%"height="600px"/>

优点：

零依赖原生支持
自动显示控制栏（打印/下载按钮）

缺点：

不同浏览器样式差异大
无法深度定制界面
移动端兼容性较差

2. 使用 `<object>` 标签

<objectdata="document.pdf"type="application/pdf"width="100%"height="600px"><p>您的浏览器不支持PDF预览，请<ahref="document.pdf">下载查看</a></p></object>

3. 使用 `<iframe>` 标签

<iframesrc="document.pdf#view=FitH"width="100%"height="600px"frameborder="0"></iframe>

参数技巧：

#view=FitH 水平适配
#page=3 跳转指定页
#zoom=80 设置缩放比例

二、PDF.js 方案（Mozilla 官方方案）

1. 基础集成

// 安装 npm install pdfjs-dist // 组件实现import*as pdfjsLib from'pdfjs-dist/webpack';const container = document.getElementById('viewer'); pdfjsLib.getDocument('document.pdf').promise.then(pdf=>{for(let pageNum =1; pageNum <= pdf.numPages; pageNum++){ pdf.getPage(pageNum).then(page=>{const canvas = document.createElement('canvas');const context = canvas.getContext('2d');const viewport = page.getViewport({scale:1.5}); canvas.width = viewport.width; canvas.height = viewport.height; page.render({canvasContext: context,viewport: viewport }); container.appendChild(canvas);});}});

2. 高级功能实现

// 文字层渲染（支持复制） page.getTextContent().then(textContent=>{ pdfjsLib.renderTextLayer({textContent: textContent,container: textLayerDiv,viewport: viewport,textDivs:[]});});// 添加标注功能const annotations = page.getAnnotations(); annotations.then(annots=>{ annots.forEach(annot=>{// 绘制高亮/下划线等});});

优势：

完全控制渲染流程
支持文本选择/搜索
可扩展标注功能
支持WebGL加速渲染

缺点：

首次加载需要下载约 1MB 资源
复杂文档渲染性能需优化

三、流行第三方库方案

1. React 生态：react-pdf-viewer

import { Viewer } from '@react-pdf-viewer/core'; import '@react-pdf-viewer/core/lib/styles/index.css'; function App() { return ( <div style={{ height: '750px' }}> <Viewer fileUrl="document.pdf" /> </div> ); }

2. Vue 生态：vue-pdf-embed

<template> <vue-pdf-embed :source="pdfSource" :page="currentPage" @rendered="handleRendered" /> </template> <script> import VuePdfEmbed from 'vue-pdf-embed'; export default { components: { VuePdfEmbed }, data() { return { currentPage: 1 } } } </script>

四、云服务方案

Google Docs Viewer

<iframesrc="https://docs.google.com/gview?url=YOUR_PDF_URL&embedded=true"style="width:100%;height:600px;"frameborder="0"></iframe>

注意事项：

需处理 URL 编码
国内访问需要梯子
有隐私泄露风险

五、服务端渲染方案

1. PDF 转图片方案

// 服务端（Node.js）const pdf2pic =require('pdf2pic');const options ={density:100,// 输出质量format:"png",// 输出格式width:800,// 输出宽度height:1200// 输出高度};const convert =newpdf2pic(options);convert("document.pdf",1)// 转换第一页.then(response=>{ console.log(response);// { path: '/images/document.png' }})

2. PDF 转 HTML 方案

# 使用 pdf2htmlEX 工具 pdf2htmlEX --zoom1.3 --embed-font 0 input.pdf output.html

六、移动端优化方案

1. 手势控制实现

// 使用 hammer.js 添加手势const hammer =newHammer(pdfContainer); hammer.on('swipeleft',()=>goToNextPage()); hammer.on('swiperight',()=>goToPrevPage()); hammer.on('pinch',(e)=>adjustZoom(e.scale));

2. 性能优化技巧

分页加载：仅渲染可视区域页面
Canvas 缓存：缓存已渲染页面
Web Worker：将 PDF 解析放入 Worker 线程
渐进加载：流式加载 PDF 文件

七、方案对比与选型建议

方案	适用场景	优点	缺点
原生标签	快速原型开发	零配置、无依赖	样式不可控、功能受限
PDF.js	企业级复杂需求	完全可控、功能强大	实现成本较高
第三方封装库	特定框架项目	开箱即用、生态整合	灵活性受限
云服务	临时/演示场景	无需维护服务端	网络依赖、隐私风险
服务端渲染	老旧设备兼容	客户端压力小	服务端资源消耗大

选型建议：

内部管理系统：推荐 PDF.js + 文本搜索功能
移动端 H5：第三方库 + 手势优化
文档型网站：原生标签 + 服务端备选方案
高安全场景：私有化部署 PDF.js

扩展知识：常见问题解决方案

1. 跨域问题处理

# Nginx 配置 location /pdf/ { add_header 'Access-Control-Allow-Origin' '*'; add_header 'Access-Control-Allow-Methods' 'GET'; }

2. 大文件加载优化

// 分片加载constCHUNK_SIZE=1024*1024;// 1MBlet offset =0;constloadChunk=()=>{fetch(url,{headers:{'Range':`bytes=${offset}-${offset +CHUNK_SIZE}`}}).then(res=>{// 处理分片数据 offset +=CHUNK_SIZE;if(offset < totalSize)loadChunk();});}

3. 水印添加方案

// Canvas 绘制水印functionaddWatermark(canvas, text){const ctx = canvas.getContext('2d'); ctx.fillStyle ='rgba(0,0,0,0.1)'; ctx.font ='20px Arial'; ctx.rotate(-30* Math.PI/180); ctx.fillText(text,50,100);}

总结

前端 PDF 预览需要根据实际场景选择技术方案，对于需要深度定制和复杂交互的场景，推荐使用 PDF.js 配合 Canvas 渲染；对于追求快速实现的场景，可选用封装好的第三方库。无论选择哪种方案，都需要重点关注：

性能优化：大文件处理/移动端适配
安全控制：防止未授权访问/添加水印
用户体验：加载进度指示/错误处理
可访问性：支持屏幕阅读器/键盘操作

用playwright封装一个处理web网页的爬虫，并隐藏自动化特征，自动处理反爬

更多内容请见：《爬虫和逆向教程》 - 专栏介绍和目录文章目录 * 一、脚本概述 * 1.1 脚本对应反爬措施 * 1.2 注意事项 * 1.3 反爬细节说明 * 二、完整代码 * 2.1 安装依赖 * 2.2 封装代码 * 2.3 使用示例下面是一个使用 Playwright 封装的、具备反爬对抗能力的网页爬虫Python函数，返回原始 HTML 内容，并重点隐藏自动化特征，避免被检测为 bot。一、脚本概述该封装已在多个中等反爬网站（如电商、新闻站）验证有效，能绕过大多数基于 navigator.webdriver、chrome 对象、permissions 等的检测。

Linux网络 | 理解Web路径以及实现一个简单的helloworld网页

前言：本节内容承接上节课的http相关的概念，主要是实现一个简单的接收http协议请求的服务。这个程序对于我们理解后面的http协议的格式，报头以及网络上的资源的理解，以及本节web路径等等都有着重要作用。可以说我们就用代码来理解这些东西。那么废话不多说，现在开始我们的学习吧。 ps：本节内容建议先看一下上一篇文章http的相关概念哦：linux网络 | 深度学习http的相关概念-ZEEKLOG博客目录准备文件 makefile HttpServer.hpp 类内成员封装sockfd start ThreadRun 全部代码运行结果响应书写 Web路径准备文件首先准备文件：这里面Httpserver.cc用来运行接收http请求的服务。 HttpServer.hpp用来定义http请求。Log.hpp就是一个打印日志的小组件， Socket.hpp同样是套接字的组件。到使用直接调用相关接口即可。（Log.hpp和Socket.hpp如何实现不讲解，如果想要知道

【前端实战】如何让用户回到上次阅读的位置？

目录【前端实战】如何让用户回到上次阅读的位置？一、总体思路 1、核心目标 2、涉及到的技术二、实现方案详解 1、基础方法：监听滚动，记录 scrollTop（不推荐） 2、Intersection Observer + 插入探针元素 3、基于 URL Hash 锚点跳转三、总结 1、不同方案间对比总结 2、结语作者：watermelo37 ZEEKLOG万粉博主、华为云云享专家、阿里云专家博主、腾讯云、支付宝合作作者，全平台博客昵称watermelo37。一个假装是giser的coder，做不只专注于业务逻辑的前端工程师，Java、Docker、Python、LLM均有涉猎。 --------------------------------------------------------------------- 温柔地对待温柔的人，包容的三观就是最大的温柔。 -------------------------------------------------------------

Clawdbot（Moltbot）源码部署全实测：从环境搭建到 WebChat 验证，避坑指南收好

一、为啥折腾 Clawdbot？最近刷技术圈总刷到 Clawdbot（后来也叫 Moltbot），说是能搭私人 AI 助手，支持 WhatsApp、Telegram 这些常用通道，还能跑在自己设备上，不用依赖第三方服务 —— 想着拉下来测试一下功能，顺便研究一下其源码的实现。于是拉上 GitHub 仓库https://github.com/openclaw/openclaw，打算从源码部署试试，过程里踩了不少坑，干脆整理成记录，给同样想折腾的朋友避避坑。二、源码部署前的准备：Windows 环境优先选 WSL2 一开始想直接用 Windows CMD 部署，结果装依赖时各种报错，查仓库文档才发现 Windows 推荐用 WSL2（Ubuntu/Debian 镜像就行），后续操作全在 WSL2 里完成： 1.

前端实现 PDF 文件预览的 7 种方案详解

一、原生浏览器方案

1. 使用 <embed> 标签

2. 使用 <object> 标签

3. 使用 <iframe> 标签

二、PDF.js 方案（Mozilla 官方方案）

1. 基础集成

2. 高级功能实现

三、流行第三方库方案

1. React 生态：react-pdf-viewer

2. Vue 生态：vue-pdf-embed

四、云服务方案

Google Docs Viewer

五、服务端渲染方案

1. PDF 转图片方案

2. PDF 转 HTML 方案

六、移动端优化方案

1. 手势控制实现

2. 性能优化技巧

七、方案对比与选型建议

扩展知识：常见问题解决方案

1. 跨域问题处理

2. 大文件加载优化

3. 水印添加方案

总结

Read more

用playwright封装一个处理web网页的爬虫，并隐藏自动化特征，自动处理反爬

Linux网络 | 理解Web路径 以及 实现一个简单的helloworld网页

【前端实战】如何让用户回到上次阅读的位置？

Clawdbot（Moltbot）源码部署全实测：从环境搭建到 WebChat 验证，避坑指南收好

1. 使用 `<embed>` 标签

2. 使用 `<object>` 标签

3. 使用 `<iframe>` 标签

Linux网络 | 理解Web路径以及实现一个简单的helloworld网页