前端使用 pdf.js 提取 PDF 文件中的图片

一种基于前端技术从 PDF 文件中提取图片的方法。通过使用 pdf.js 库解析 PDF 文档，遍历页面对象列表识别图像资源，并将其转换为 Canvas 后导出为 PNG 格式。该方案无需后端支持，直接在浏览器中完成文件处理与图片下载，适用于轻量级文档处理场景。

月光旅人发布于 2026/4/5更新于 2026/5/2233 浏览

功能概述

本工具允许用户上传 PDF 文件，并在前端通过 pdf.js 库自动提取其中包含的所有图片。提取后的图片以网格形式展示，支持预览和下载。

核心代码

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>PDF 图片提取工具</title>
<script src="https://cdnjs.cloudflare.com/ajax/libs/pdf.js/3.11.174/pdf.min.js"></script>
<style>
* { margin: 0; padding: 0; box-sizing: border-box; }
body { font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Roboto, 'Helvetica Neue', Arial, sans-serif; background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); min-height: 100vh; padding: 20px; }
 { : ; :  auto; }
 { : center; : white; : ; }
  { : ; : ; :    (, , , ); }
  { : ; : ; }
 { : white; : ; : ; :    (, , , ); : ; }
 { :  dashed ; : ; :  ; : center; : pointer; : all  ease; : ; }
 { : ; : ; : (-); }
 { : ; : ; : (); }
 { : ; : ; }
 { : ; : ; : ; : ; }
 { : ; : ; }
 { : none; }
 { : (,  ,  ); : white; : none; :  ; : ; : ; : ; : pointer; : all  ease; :    (, , , ); }
 { : (-); :    (, , , ); }
 { : (); }
 { : ; : not-allowed; : none; }
 { : none; : ; }
 { : ; : ; : ; : ; : hidden; }
 { : ; : (,  ,  ); : ; : width  ease; : ; }
 { : center; : ; : ; : ; }
 { : none; : white; : ; : ; :    (, , , ); }
 { : flex; : space-between; : center; : ; : ; :  solid ; }
 { : ; : ; : ; }
 { : (,  ,  ); : white; :  ; : ; : ; : ; }
 { : grid; : (auto-fill, (, fr)); : ; }
 { :  solid ; : ; : hidden; : all  ease; : white; }
 { : (-); :    (, , , ); : ; }
 { : ; : ; : flex; : center; : center; : ; : hidden; }
  { : ; : ; : contain; }
 { : ; : white; }
 { : ; : ; : ; : ; : hidden; : ellipsis; : nowrap; }
 { : flex; : space-between; : center; : ; : ; : ; }
 { : flex; : ; }
 { : ; :  ; : ; : ; : none; : pointer; : all  ease; : ; }
 { : ; : white; }
 { : ; : (-); }
 { : ; : ; }
 { : ; }
 { : center; :  ; : ; }
 { : ; : ; : ; }
 { : none; : fixed; : ; : ; : ; : ; : (, , , ); : ; : center; : center; }
 { : flex; }
 { : ; : ; : relative; }
 { : ; : ; : contain; }
 { : absolute; : -; : ; : white; : ; : none; : ; : ; : ; : pointer; : ; : bold; : all  ease; }
 { : ; : (); }
 fadeIn {  { : ; : (); }  { : ; : (); } }
 { : fadeIn  ease; }





📄 PDF 图片提取工具
上传 PDF 文件，自动提取其中的所有图片



📁
点击或拖拽 PDF 文件到此处
支持单个 PDF 文件上传




处理中...




提取的图片
0 张图片






×

// 配置 PDF.js worker pdfjsLib.GlobalWorkerOptions.workerSrc = 'https://cdnjs.cloudflare.com/ajax/libs/pdf.js/3.11.174/pdf.worker.min.js'; const uploadArea = document.getElementById('uploadArea'); const fileInput = document.getElementById('fileInput'); const progressContainer = document.getElementById('progressContainer'); const progressFill = document.getElementById('progressFill'); const progressText = document.getElementById('progressText'); const imagesContainer = document.getElementById('imagesContainer'); const imagesGrid = document.getElementById('imagesGrid'); const imagesCount = document.getElementById('imagesCount'); let extractedImages = []; // 上传区域点击事件 uploadArea.addEventListener('click', () => { fileInput.click(); }); // 文件选择事件 fileInput.addEventListener('change', (e) => { const file = e.target.files[0]; if (file && file.type === 'application/pdf') { handleFile(file); } }); // 拖拽事件 uploadArea.addEventListener('dragover', (e) => { e.preventDefault(); uploadArea.classList.add('dragover'); }); uploadArea.addEventListener('dragleave', () => { uploadArea.classList.remove('dragover'); }); uploadArea.addEventListener('drop', (e) => { e.preventDefault(); uploadArea.classList.remove('dragover'); const file = e.dataTransfer.files[0]; if (file && file.type === 'application/pdf') { handleFile(file); } }); // 处理 PDF 文件 async function handleFile(file) { extractedImages = []; imagesGrid.innerHTML = ''; imagesContainer.style.display = 'none'; progressContainer.style.display = 'block'; try { const arrayBuffer = await file.arrayBuffer(); await extractImagesFromPDF(arrayBuffer, file.name); progressContainer.style.display = 'none'; displayImages(); } catch (error) { console.error('处理 PDF 失败:', error); progressText.textContent = '处理失败：' + error.message; progressText.style.color = '#e74c3c'; } } // 提取 PDF 中的图片 async function extractImagesFromPDF(arrayBuffer, fileName) { const pdfDocument = await pdfjsLib.getDocument({ data: arrayBuffer, useSystemFonts: true, disableFontFace: false, verbosity: 0, isEvalSupported: false, maxImageSize: 1024 * 1024 * 10 }).promise; const totalPages = pdfDocument.numPages; let imageIndex = 0; for (let pageNum = 1; pageNum <= totalPages; pageNum++) { updateProgress(pageNum, totalPages); const page = await pdfDocument.getPage(pageNum); const operatorList = await page.getOperatorList(); for (let i = 0; i < operatorList.fnArray.length; i++) { const fn = operatorList.fnArray[i]; if (fn === pdfjsLib.OPS.paintImageXObject || fn === pdfjsLib.OPS.paintInlineImageXObject) { const imageName = operatorList.argsArray[i][0]; await new Promise((resolve) => { page.objs.get(imageName, async (img) => { console.log('Image object:', img); if (!img) { resolve(); return; } try { if (img.bitmap && img.bitmap instanceof ImageBitmap) { const canvas = document.createElement('canvas'); canvas.width = img.width; canvas.height = img.height; const ctx = canvas.getContext('2d'); ctx.drawImage(img.bitmap, 0, 0); await finishImageProcessing(canvas, img, fileName, pageNum, imageIndex); resolve(); return; } if (window.ImageBitmap && img instanceof ImageBitmap) { const canvas = document.createElement('canvas'); canvas.width = img.width; canvas.height = img.height; const ctx = canvas.getContext('2d'); ctx.drawImage(img, 0, 0); await finishImageProcessing(canvas, img, fileName, pageNum, imageIndex); resolve(); return; } if (img.data && img.width && img.height) { const canvas = document.createElement('canvas'); canvas.width = img.width; canvas.height = img.height; const ctx = canvas.getContext('2d'); const imageData = ctx.createImageData(img.width, img.height); imageData.data.set(img.data); ctx.putImageData(imageData, 0, 0); await finishImageProcessing(canvas, img, fileName, pageNum, imageIndex); resolve(); return; } if (img instanceof HTMLImageElement || img instanceof HTMLCanvasElement) { const canvas = document.createElement('canvas'); canvas.width = img.width; canvas.height = img.height; const ctx = canvas.getContext('2d'); ctx.drawImage(img, 0, 0); await finishImageProcessing(canvas, img, fileName, pageNum, imageIndex); resolve(); return; } if (img.src) { const canvas = document.createElement('canvas'); canvas.width = img.width; canvas.height = img.height; const ctx = canvas.getContext('2d'); const image = new Image(); image.onload = async () => { ctx.drawImage(image, 0, 0); await finishImageProcessing(canvas, img, fileName, pageNum, imageIndex); resolve(); }; image.onerror = () => { console.error('加载图片失败'); resolve(); }; image.src = img.src; return; } console.warn('无法处理的图片对象:', { hasData: !!img.data, hasBitmap: !!img.bitmap, width: img.width, height: img.height, keys: Object.keys(img) }); resolve(); } catch (error) { console.error('处理图片失败:', error, img); resolve(); } }); }); imageIndex++; } } } } // 完成图片处理 function finishImageProcessing(canvas, img, fileName, pageNum, imageIndex) { return new Promise((resolve) => { canvas.toBlob((blob) => { if (blob) { const url = URL.createObjectURL(blob); const name = `${fileName.replace('.pdf', '')}_page${pageNum}_img${imageIndex}.png`; extractedImages.push({ url: url, name: name, size: blob.size, width: canvas.width, height: canvas.height, blob: blob }); } resolve(); }, 'image/png'); }); } // 更新进度 function updateProgress(current, total) { const percent = (current / total) * 100; progressFill.style.width = percent + '%'; progressText.textContent = `正在处理第 ${current}/${total} 页...`; } // 显示图片 function displayImages() { if (extractedImages.length === 0) { imagesContainer.style.display = 'block'; imagesGrid.innerHTML = ` <div class="empty-state"> <div class="empty-icon">🖼️</div> <div>未在 PDF 中找到图片</div> </div>`; imagesCount.textContent = '0 张图片'; return; } imagesContainer.style.display = 'block'; imagesCount.textContent = `${extractedImages.length} 张图片`; extractedImages.forEach((image, index) => { const card = document.createElement('div'); card.className = 'image-card'; card.style.animationDelay = `${index * 0.05}s`; card.innerHTML = ` <div class="image-wrapper"> <img src="${image.url}" alt="${image.name}"> </div> <div class="image-info"> <div class="image-name" title="${image.name}">${image.name}</div> <div class="image-meta"> <span>${image.width} × ${image.height}</span> <span>${formatBytes(image.size)}</span> </div> <div class="image-actions"> <button class="btn-small btn-preview" onclick="previewImage('${image.url}')">预览</button> <button class="btn-small btn-download" onclick="downloadImage(${index})">下载</button> </div> </div>`; imagesGrid.appendChild(card); }); } // 格式化文件大小 function formatBytes(bytes) { if (bytes === 0) return '0 B'; const k = 1024; const sizes = ['B', 'KB', 'MB']; const i = Math.floor(Math.log(bytes) / Math.log(k)); return Math.round(bytes / Math.pow(k, i) * 100) / 100 + ' ' + sizes[i]; } // 预览图片 function previewImage(url) { document.getElementById('modalImage').src = url; document.getElementById('modal').classList.add('active'); } // 关闭模态框 function closeModal() { document.getElementById('modal').classList.remove('active'); } // 下载图片 function downloadImage(index) { const image = extractedImages[index]; const link = document.createElement('a'); link.href = image.url; link.download = image.name; link.click(); } // 点击模态框背景关闭 document.getElementById('modal').addEventListener('click', (e) => { if (e.target.id === 'modal') { closeModal(); } });

前端使用 pdf.js 提取 PDF 文件中的图片

功能概述

核心代码

更多推荐文章

相关免费在线工具

前端使用 pdf.js 提取 PDF 文件中的图片

功能概述

核心代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具