前端实现 PDF 文件预览的 7 种方案详解

前端实现 PDF 文件预览的 7 种方案详解

前端实现 PDF 文件预览的 7 种方案详解


一、原生浏览器方案

1. 使用 <embed> 标签

<embedsrc="document.pdf"type="application/pdf"width="100%"height="600px"/>

优点

  • 零依赖原生支持
  • 自动显示控制栏(打印/下载按钮)

缺点

  • 不同浏览器样式差异大
  • 无法深度定制界面
  • 移动端兼容性较差

2. 使用 <object> 标签

<objectdata="document.pdf"type="application/pdf"width="100%"height="600px"><p>您的浏览器不支持PDF预览,请<ahref="document.pdf">下载查看</a></p></object>

3. 使用 <iframe> 标签

<iframesrc="document.pdf#view=FitH"width="100%"height="600px"frameborder="0"></iframe>

参数技巧

  • #view=FitH 水平适配
  • #page=3 跳转指定页
  • #zoom=80 设置缩放比例

二、PDF.js 方案(Mozilla 官方方案)

1. 基础集成

// 安装 npm install pdfjs-dist // 组件实现import*as pdfjsLib from'pdfjs-dist/webpack';const container = document.getElementById('viewer'); pdfjsLib.getDocument('document.pdf').promise.then(pdf=>{for(let pageNum =1; pageNum <= pdf.numPages; pageNum++){ pdf.getPage(pageNum).then(page=>{const canvas = document.createElement('canvas');const context = canvas.getContext('2d');const viewport = page.getViewport({scale:1.5}); canvas.width = viewport.width; canvas.height = viewport.height; page.render({canvasContext: context,viewport: viewport }); container.appendChild(canvas);});}});

2. 高级功能实现

// 文字层渲染(支持复制) page.getTextContent().then(textContent=>{ pdfjsLib.renderTextLayer({textContent: textContent,container: textLayerDiv,viewport: viewport,textDivs:[]});});// 添加标注功能const annotations = page.getAnnotations(); annotations.then(annots=>{ annots.forEach(annot=>{// 绘制高亮/下划线等});});

优势

  • 完全控制渲染流程
  • 支持文本选择/搜索
  • 可扩展标注功能
  • 支持WebGL加速渲染

缺点

  • 首次加载需要下载约 1MB 资源
  • 复杂文档渲染性能需优化

三、流行第三方库方案

1. React 生态:react-pdf-viewer

import { Viewer } from '@react-pdf-viewer/core'; import '@react-pdf-viewer/core/lib/styles/index.css'; function App() { return ( <div style={{ height: '750px' }}> <Viewer fileUrl="document.pdf" /> </div> ); } 

2. Vue 生态:vue-pdf-embed

<template> <vue-pdf-embed :source="pdfSource" :page="currentPage" @rendered="handleRendered" /> </template> <script> import VuePdfEmbed from 'vue-pdf-embed'; export default { components: { VuePdfEmbed }, data() { return { currentPage: 1 } } } </script> 

四、云服务方案

Google Docs Viewer

<iframesrc="https://docs.google.com/gview?url=YOUR_PDF_URL&embedded=true"style="width:100%;height:600px;"frameborder="0"></iframe>

注意事项

  • 需处理 URL 编码
  • 国内访问需要梯子
  • 有隐私泄露风险

五、服务端渲染方案

1. PDF 转图片方案

// 服务端(Node.js)const pdf2pic =require('pdf2pic');const options ={density:100,// 输出质量format:"png",// 输出格式width:800,// 输出宽度height:1200// 输出高度};const convert =newpdf2pic(options);convert("document.pdf",1)// 转换第一页.then(response=>{ console.log(response);// { path: '/images/document.png' }})

2. PDF 转 HTML 方案

# 使用 pdf2htmlEX 工具 pdf2htmlEX --zoom1.3 --embed-font 0 input.pdf output.html 

六、移动端优化方案

1. 手势控制实现

// 使用 hammer.js 添加手势const hammer =newHammer(pdfContainer); hammer.on('swipeleft',()=>goToNextPage()); hammer.on('swiperight',()=>goToPrevPage()); hammer.on('pinch',(e)=>adjustZoom(e.scale));

2. 性能优化技巧

  • 分页加载:仅渲染可视区域页面
  • Canvas 缓存:缓存已渲染页面
  • Web Worker:将 PDF 解析放入 Worker 线程
  • 渐进加载:流式加载 PDF 文件

七、方案对比与选型建议

方案适用场景优点缺点
原生标签快速原型开发零配置、无依赖样式不可控、功能受限
PDF.js企业级复杂需求完全可控、功能强大实现成本较高
第三方封装库特定框架项目开箱即用、生态整合灵活性受限
云服务临时/演示场景无需维护服务端网络依赖、隐私风险
服务端渲染老旧设备兼容客户端压力小服务端资源消耗大

选型建议

  1. 内部管理系统:推荐 PDF.js + 文本搜索功能
  2. 移动端 H5:第三方库 + 手势优化
  3. 文档型网站:原生标签 + 服务端备选方案
  4. 高安全场景:私有化部署 PDF.js

扩展知识:常见问题解决方案

1. 跨域问题处理

# Nginx 配置 location /pdf/ { add_header 'Access-Control-Allow-Origin' '*'; add_header 'Access-Control-Allow-Methods' 'GET'; } 

2. 大文件加载优化

// 分片加载constCHUNK_SIZE=1024*1024;// 1MBlet offset =0;constloadChunk=()=>{fetch(url,{headers:{'Range':`bytes=${offset}-${offset +CHUNK_SIZE}`}}).then(res=>{// 处理分片数据 offset +=CHUNK_SIZE;if(offset < totalSize)loadChunk();});}

3. 水印添加方案

// Canvas 绘制水印functionaddWatermark(canvas, text){const ctx = canvas.getContext('2d'); ctx.fillStyle ='rgba(0,0,0,0.1)'; ctx.font ='20px Arial'; ctx.rotate(-30* Math.PI/180); ctx.fillText(text,50,100);}

总结

前端 PDF 预览需要根据实际场景选择技术方案,对于需要深度定制和复杂交互的场景,推荐使用 PDF.js 配合 Canvas 渲染;对于追求快速实现的场景,可选用封装好的第三方库。无论选择哪种方案,都需要重点关注:

  1. 性能优化:大文件处理/移动端适配
  2. 安全控制:防止未授权访问/添加水印
  3. 用户体验:加载进度指示/错误处理
  4. 可访问性:支持屏幕阅读器/键盘操作

Read more

用playwright封装一个处理web网页的爬虫,并隐藏自动化特征,自动处理反爬

更多内容请见: 《爬虫和逆向教程》 - 专栏介绍和目录 文章目录 * 一、脚本概述 * 1.1 脚本对应反爬措施 * 1.2 注意事项 * 1.3 反爬细节说明 * 二、完整代码 * 2.1 安装依赖 * 2.2 封装代码 * 2.3 使用示例 下面是一个使用 Playwright 封装的、具备反爬对抗能力的网页爬虫Python函数,返回原始 HTML 内容,并重点隐藏自动化特征,避免被检测为 bot。 一、脚本概述 该封装已在多个中等反爬网站(如电商、新闻站)验证有效,能绕过大多数基于 navigator.webdriver、chrome 对象、permissions 等的检测。

Linux网络 | 理解Web路径 以及 实现一个简单的helloworld网页

Linux网络 | 理解Web路径 以及 实现一个简单的helloworld网页

前言:本节内容承接上节课的http相关的概念, 主要是实现一个简单的接收http协议请求的服务。这个程序对于我们理解后面的http协议的格式,报头以及网络上的资源的理解, 以及本节web路径等等都有着重要作用。 可以说我们就用代码来理解这些东西。 那么废话不多说, 现在开始我们的学习吧。         ps:本节内容建议先看一下上一篇文章http的相关概念哦:linux网络 | 深度学习http的相关概念-ZEEKLOG博客 目录  准备文件  makefile HttpServer.hpp 类内成员 封装sockfd start  ThreadRun  全部代码 运行结果 响应书写 Web路径  准备文件         首先准备文件: 这里面Httpserver.cc用来运行接收http请求的服务。 HttpServer.hpp用来定义http请求。Log.hpp就是一个打印日志的小组件, Socket.hpp同样是套接字的组件。 到使用直接调用相关接口即可。(Log.hpp和Socket.hpp如何实现不讲解, 如果想要知道

【前端实战】如何让用户回到上次阅读的位置?

【前端实战】如何让用户回到上次阅读的位置?

目录 【前端实战】如何让用户回到上次阅读的位置? 一、总体思路 1、核心目标 2、涉及到的技术 二、实现方案详解 1、基础方法:监听滚动,记录 scrollTop(不推荐) 2、Intersection Observer + 插入探针元素 3、基于 URL Hash 锚点跳转 三、总结 1、不同方案间对比总结 2、结语         作者:watermelo37         ZEEKLOG万粉博主、华为云云享专家、阿里云专家博主、腾讯云、支付宝合作作者,全平台博客昵称watermelo37。         一个假装是giser的coder,做不只专注于业务逻辑的前端工程师,Java、Docker、Python、LLM均有涉猎。 --------------------------------------------------------------------- 温柔地对待温柔的人,包容的三观就是最大的温柔。 -------------------------------------------------------------

Clawdbot(Moltbot)源码部署全实测:从环境搭建到 WebChat 验证,避坑指南收好

Clawdbot(Moltbot)源码部署全实测:从环境搭建到 WebChat 验证,避坑指南收好

一、为啥折腾 Clawdbot? 最近刷技术圈总刷到 Clawdbot(后来也叫 Moltbot),说是能搭私人 AI 助手,支持 WhatsApp、Telegram 这些常用通道,还能跑在自己设备上,不用依赖第三方服务 —— 想着拉下来测试一下功能,顺便研究一下其源码的实现。 于是拉上 GitHub 仓库https://github.com/openclaw/openclaw,打算从源码部署试试,过程里踩了不少坑,干脆整理成记录,给同样想折腾的朋友避避坑。 二、源码部署前的准备:Windows 环境优先选 WSL2 一开始想直接用 Windows CMD 部署,结果装依赖时各种报错,查仓库文档才发现 Windows 推荐用 WSL2(Ubuntu/Debian 镜像就行),后续操作全在 WSL2 里完成: 1.