手把手教你写需求之代码实现pdf转jpg

前言

初入公司，很多朋友如果碰到一些莫名其妙的需求，没有做过就会很慌张。不要慌张，本文通过一个小案例手把手教你写需求。

场景

一个阳光明媚的下午，需求小姐姐向你款款走来，娇滴滴的寻求你帮忙，她需要你把 PDF文件转换成jpg文件。

表面上你不动声色，心里想到：直接打开pdf文件，然后截图，直接更改图片后缀名为jpg不就搞定了？这也算一个需求？

需求小姐姐似乎看出了你的疑惑：这是我的pdf文件《Java核心技术卷Ⅰ》.pdf
一共700多页，似乎在暗示你截图大法不够合适。

看着小姐姐期许的眼神，你怎么好意思说出买个付费的格式转换软件呢？只好说：稍等，我写个代码帮你搞定！

小姐姐点点头，很满意，咱们接下来开始写代码。

代码实现：

先熟练的创建一个maven工程，好方便自己管理依赖
动手写一个main方法，理清自己的逻辑

    public static void main(String[] args) throws IOException {
        //这是jpg文件的输出路径
        String outDirPath = "C:\\Users\\w_rcss\\Desktop\\out";
        // 这是目标文件《Java核心技术卷Ⅰ》.pdf的存放路径
        String filePath = outDirPath + "\\《Java核心技术卷Ⅰ》.pdf";
        //取了个方法名，就叫setup吧，格式转换肯定要把文件作为参数传进去
        setup(filePath, outDirPath);
    }

接下来就是实现setup方法，可是setup中怎么操作pdf格式的文档呢？
直接上网调研，发现可以用apache的pdfbox来操作pdf文档

Apache PDFBox是一个开源Java库，支持PDF文档的开发和转换。使用此库，可以开发用于创建，转换和操作PDF文档的Java程序。

附:官方文档链接
pom中直接引入pdfbox依赖：

        <dependency>
           <groupId>org.apache.pdfbox</groupId>
           <artifactId>pdfbox</artifactId>
           <version>2.0.15</version>
       </dependency>

实现setup方法

   public static void setup(String filePath, String outDirPath) throws IOException {

        //通过文件拿到file对象
        File file = new File(filePath);
        // load()是PDDocument的静态方法，直接加载目标pdf文档
        PDDocument document = PDDocument.load(file);
        // PDFRenderer是一个PDF渲染器，为每个要渲染的页面打开页面，渲染并关闭页面
        PDFRenderer renderer = new PDFRenderer(document);
		// 获取目标pdf的总页数
        int pageTotal = document.getNumberOfPages();
        System.out.println("页数：" + pageTotal);


        File outDir = new File(outDirPath);
       	// 两个校验判定
        if (!outDir.exists()) {
            outDir.mkdirs();
        }
     
        if (!outDir.isDirectory()) {
            System.err.println("请填写正确的输出路径");

            System.exit(0);
        }

        int pageName = 0;
		// for循环 循环将pdf转换成jpg
        for (int pageIndex = 0; pageIndex < pageTotal; pageIndex++) {
            System.out.println("正在转换第 " + pageIndex + " 页");
			// 用RGB方式渲染700DPI
            BufferedImage image = renderer.renderImageWithDPI(pageIndex, 700, ImageType.RGB);
			// private static final boolean isCut = true; 属性isCut是静态常量true
			// private static final List excludePage = Arrays.asList(0);
            if (!isCut && pageIndex != (pageTotal - 1) && !excludePage.contains(pageIndex)) {
           		// fileName是输出名字，此处做了拼接，多张pdf，转换成jpg，pageName++
                String fileName1 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                //此处调用了cut方法，cut方法参看第7步
                cut(image, fileName1, 0, 0, image.getWidth() / 2, image.getHeight());

                String fileName2 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                cut(image, fileName2, image.getWidth() / 2, 0, image.getWidth() / 2, image.getHeight());

            } else {

                String fileName = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                ImageIO.write(image, "jpg", new File(fileName));
            }
        }
		// 关闭
        document.close();

    }

setup方法中for循环使用的cut方法

  public final static void cut(BufferedImage bufferedImage, String result,
                                 int x, int y, int width, int height) {
        try {
            // 读取源图像
            // 源图宽度
            int srcWidth = bufferedImage.getWidth();
            // 源图高度
            int srcHeight = bufferedImage.getHeight(); 
            
            if (srcWidth > 0 && srcHeight > 0) {
                Image image = bufferedImage.getScaledInstance(srcWidth, srcHeight,
                        Image.SCALE_DEFAULT);
                // 四个参数分别为图像起点坐标和宽高
                // 即: CropImageFilter(int x,int y,int width,int height)
                ImageFilter cropFilter = new CropImageFilter(x, y, width, height);
                Image img = Toolkit.getDefaultToolkit().createImage(
                        new FilteredImageSource(image.getSource(),
                                cropFilter));
                BufferedImage tag = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
                Graphics g = tag.getGraphics();
                // 绘制切割后的图
                g.drawImage(img, 0, 0, width, height, null); 
                g.dispose();
                // 输出为文件
                ImageIO.write(tag, "jpg", new File(result));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

大功告成，开始测试

测试效果： pdf文件每页都被拆成一张jpg。转换效果还是不错的。唯一的问题就是转换效率不高，平均2~3s一张。当然了，这也是没办法的事儿。

测试没有问题，重新审视一下代码

/**
* @Description
* @Author  rcss_j
* @Date   2020/12/7 16:55
* @Param  
* @Return      
* @Exception   
* 
*/
public class PDFExportImage {


    private static final List excludePage = Arrays.asList(0);
    private static final boolean isCut = true;

    // setup方法，转换的核心方法啦
    public static void setup(String filePath, String outDirPath) throws IOException {

        File file = new File(filePath);
        PDDocument document = PDDocument.load(file);
        PDFRenderer renderer = new PDFRenderer(document);

        int pageTotal = document.getNumberOfPages();
        System.out.println("页数：" + pageTotal);


        File outDir = new File(outDirPath);
        if (!outDir.exists()) {
            outDir.mkdirs();
        }

        if (!outDir.isDirectory()) {
            System.err.println("请填写正确的输出路径");

            System.exit(0);
        }

        int pageName = 0;
        for (int pageIndex = 0; pageIndex < pageTotal; pageIndex++) {
            System.out.println("正在转换第 " + pageIndex + " 页");

            BufferedImage image = renderer.renderImageWithDPI(pageIndex, 700, ImageType.RGB);

            if (!isCut && pageIndex != (pageTotal - 1) && !excludePage.contains(pageIndex)) {
                String fileName1 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                cut(image, fileName1, 0, 0, image.getWidth() / 2, image.getHeight());

                String fileName2 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                cut(image, fileName2, image.getWidth() / 2, 0, image.getWidth() / 2, image.getHeight());

            } else {

                String fileName = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                ImageIO.write(image, "jpg", new File(fileName));
            }

        }

        document.close();

    }

    // cut方法，切图片的方法啦
    public final static void cut(BufferedImage bufferedImage, String result,
                                 int x, int y, int width, int height) {
        try {
            // 读取源图像
            int srcWidth = bufferedImage.getWidth(); // 源图宽度
            int srcHeight = bufferedImage.getHeight(); // 源图高度
            if (srcWidth > 0 && srcHeight > 0) {
                Image image = bufferedImage.getScaledInstance(srcWidth, srcHeight,
                        Image.SCALE_DEFAULT);
                // 四个参数分别为图像起点坐标和宽高
                // 即: CropImageFilter(int x,int y,int width,int height)
                ImageFilter cropFilter = new CropImageFilter(x, y, width, height);
                Image img = Toolkit.getDefaultToolkit().createImage(
                        new FilteredImageSource(image.getSource(),
                                cropFilter));
                BufferedImage tag = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
                Graphics g = tag.getGraphics();
                g.drawImage(img, 0, 0, width, height, null); // 绘制切割后的图
                g.dispose();
                // 输出为文件
                ImageIO.write(tag, "jpg", new File(result));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    // 这是main方法了
    public static void main(String[] args) throws IOException {
        String outDirPath = "C:\\Users\\w_rcss\\Desktop";
        String filePath = outDirPath + "\\《Java核心技术卷Ⅰ》.pdf";
        setup(filePath, outDirPath);
    }
    
}

暗赞一声，完美。可以找需求小姐姐交差了，又是开心的一天！

后记

遇到需求不要慌，把大需求化小，小需求化了，问题自然迎难而解。

本文地址：https://blog.csdn.net/w_rcss/article/details/110818189

手把手教你写需求之代码实现pdf转jpg

前言

场景

代码实现：

后记

相关推荐

爬取某网站写的python代码

SpringBoot实现PDF添加水印的方法

Sourcetrail 代码分析工具的使用

代码随想录算法训练营day13

代码随想录算法训练营day04 | leetcode

jmeter进阶之Beanshell引用Java代码

纯javascript验证，100行超精简代码。

Idea集成Lombok代码注释来精简代码