手把手教你写需求之代码实现pdf转jpg

2022-07-26,,,,

前言

初入公司,很多朋友如果碰到一些莫名其妙的需求,没有做过就会很慌张。不要慌张,本文通过一个小案例手把手教你写需求。

场景

一个阳光明媚的下午,需求小姐姐向你款款走来,娇滴滴的寻求你帮忙,她需要你把 PDF文件转换成jpg文件。

表面上你不动声色,心里想到:直接打开pdf文件,然后截图,直接更改图片后缀名为jpg不就搞定了?这也算一个需求?

需求小姐姐似乎看出了你的疑惑:这是我的pdf文件《Java核心技术卷Ⅰ》.pdf
一共700多页,似乎在暗示你 截图大法不够合适。

看着小姐姐期许的眼神,你怎么好意思说出买个付费的格式转换软件呢?只好说:稍等,我写个代码帮你搞定!

小姐姐点点头,很满意,咱们接下来开始写代码。

代码实现:

  1. 先熟练的创建一个maven工程,好方便自己管理依赖
  2. 动手写一个main方法,理清自己的逻辑
    public static void main(String[] args) throws IOException {
        //这是jpg文件的输出路径
        String outDirPath = "C:\\Users\\w_rcss\\Desktop\\out";
        // 这是目标文件《Java核心技术卷Ⅰ》.pdf的存放路径
        String filePath = outDirPath + "\\《Java核心技术卷Ⅰ》.pdf";
        //取了个方法名,就叫setup吧,格式转换肯定要把文件作为参数传进去
        setup(filePath, outDirPath);
    }

  1. 接下来就是实现setup方法,可是setup中怎么操作pdf格式的文档呢?

  2. 直接上网调研,发现可以用apache的pdfbox来操作pdf文档

    Apache PDFBox是一个开源Java库,支持PDF文档的开发和转换。 使用此库,可以开发用于创建,转换和操作PDF文档的Java程序。

    附:官方文档链接

  3. pom中直接引入pdfbox依赖:

        <dependency>
           <groupId>org.apache.pdfbox</groupId>
           <artifactId>pdfbox</artifactId>
           <version>2.0.15</version>
       </dependency>
  1. 实现setup方法
   public static void setup(String filePath, String outDirPath) throws IOException {

        //通过文件拿到file对象
        File file = new File(filePath);
        // load()是PDDocument的静态方法,直接加载目标pdf文档
        PDDocument document = PDDocument.load(file);
        // PDFRenderer是一个PDF渲染器,为每个要渲染的页面打开页面,渲染并关闭页面
        PDFRenderer renderer = new PDFRenderer(document);
		// 获取目标pdf的总页数
        int pageTotal = document.getNumberOfPages();
        System.out.println("页数:" + pageTotal);


        File outDir = new File(outDirPath);
       	// 两个校验判定
        if (!outDir.exists()) {
            outDir.mkdirs();
        }
     
        if (!outDir.isDirectory()) {
            System.err.println("请填写正确的输出路径");

            System.exit(0);
        }

        int pageName = 0;
		// for循环 循环将pdf转换成jpg
        for (int pageIndex = 0; pageIndex < pageTotal; pageIndex++) {
            System.out.println("正在转换第 " + pageIndex + " 页");
			// 用RGB方式渲染700DPI
            BufferedImage image = renderer.renderImageWithDPI(pageIndex, 700, ImageType.RGB);
			// private static final boolean isCut = true; 属性isCut是静态常量true
			// private static final List excludePage = Arrays.asList(0);
            if (!isCut && pageIndex != (pageTotal - 1) && !excludePage.contains(pageIndex)) {
           		// fileName是输出名字,此处做了拼接,多张pdf,转换成jpg,pageName++
                String fileName1 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                //此处调用了cut方法,cut方法参看第7步
                cut(image, fileName1, 0, 0, image.getWidth() / 2, image.getHeight());

                String fileName2 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                cut(image, fileName2, image.getWidth() / 2, 0, image.getWidth() / 2, image.getHeight());

            } else {

                String fileName = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                ImageIO.write(image, "jpg", new File(fileName));
            }
        }
		// 关闭
        document.close();

    }
  1. setup方法中for循环使用的cut方法
  public final static void cut(BufferedImage bufferedImage, String result,
                                 int x, int y, int width, int height) {
        try {
            // 读取源图像
            // 源图宽度
            int srcWidth = bufferedImage.getWidth();
            // 源图高度
            int srcHeight = bufferedImage.getHeight(); 
            
            if (srcWidth > 0 && srcHeight > 0) {
                Image image = bufferedImage.getScaledInstance(srcWidth, srcHeight,
                        Image.SCALE_DEFAULT);
                // 四个参数分别为图像起点坐标和宽高
                // 即: CropImageFilter(int x,int y,int width,int height)
                ImageFilter cropFilter = new CropImageFilter(x, y, width, height);
                Image img = Toolkit.getDefaultToolkit().createImage(
                        new FilteredImageSource(image.getSource(),
                                cropFilter));
                BufferedImage tag = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
                Graphics g = tag.getGraphics();
                // 绘制切割后的图
                g.drawImage(img, 0, 0, width, height, null); 
                g.dispose();
                // 输出为文件
                ImageIO.write(tag, "jpg", new File(result));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
  1. 大功告成,开始测试

测试效果: pdf文件每页都被拆成一张jpg。转换效果还是不错的。唯一的问题就是转换效率不高,平均2~3s一张。当然了,这也是没办法的事儿。

  1. 测试没有问题,重新审视一下代码
/**
* @Description
* @Author  rcss_j
* @Date   2020/12/7 16:55
* @Param  
* @Return      
* @Exception   
* 
*/
public class PDFExportImage {


    private static final List excludePage = Arrays.asList(0);
    private static final boolean isCut = true;

    // setup方法,转换的核心方法啦
    public static void setup(String filePath, String outDirPath) throws IOException {

        File file = new File(filePath);
        PDDocument document = PDDocument.load(file);
        PDFRenderer renderer = new PDFRenderer(document);

        int pageTotal = document.getNumberOfPages();
        System.out.println("页数:" + pageTotal);


        File outDir = new File(outDirPath);
        if (!outDir.exists()) {
            outDir.mkdirs();
        }

        if (!outDir.isDirectory()) {
            System.err.println("请填写正确的输出路径");

            System.exit(0);
        }

        int pageName = 0;
        for (int pageIndex = 0; pageIndex < pageTotal; pageIndex++) {
            System.out.println("正在转换第 " + pageIndex + " 页");

            BufferedImage image = renderer.renderImageWithDPI(pageIndex, 700, ImageType.RGB);

            if (!isCut && pageIndex != (pageTotal - 1) && !excludePage.contains(pageIndex)) {
                String fileName1 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                cut(image, fileName1, 0, 0, image.getWidth() / 2, image.getHeight());

                String fileName2 = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                cut(image, fileName2, image.getWidth() / 2, 0, image.getWidth() / 2, image.getHeight());

            } else {

                String fileName = outDir + "/" + file.getName() + "-" + (pageName++) + ".jpg";
                ImageIO.write(image, "jpg", new File(fileName));
            }

        }

        document.close();

    }

    // cut方法,切图片的方法啦
    public final static void cut(BufferedImage bufferedImage, String result,
                                 int x, int y, int width, int height) {
        try {
            // 读取源图像
            int srcWidth = bufferedImage.getWidth(); // 源图宽度
            int srcHeight = bufferedImage.getHeight(); // 源图高度
            if (srcWidth > 0 && srcHeight > 0) {
                Image image = bufferedImage.getScaledInstance(srcWidth, srcHeight,
                        Image.SCALE_DEFAULT);
                // 四个参数分别为图像起点坐标和宽高
                // 即: CropImageFilter(int x,int y,int width,int height)
                ImageFilter cropFilter = new CropImageFilter(x, y, width, height);
                Image img = Toolkit.getDefaultToolkit().createImage(
                        new FilteredImageSource(image.getSource(),
                                cropFilter));
                BufferedImage tag = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);
                Graphics g = tag.getGraphics();
                g.drawImage(img, 0, 0, width, height, null); // 绘制切割后的图
                g.dispose();
                // 输出为文件
                ImageIO.write(tag, "jpg", new File(result));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    // 这是main方法了
    public static void main(String[] args) throws IOException {
        String outDirPath = "C:\\Users\\w_rcss\\Desktop";
        String filePath = outDirPath + "\\《Java核心技术卷Ⅰ》.pdf";
        setup(filePath, outDirPath);
    }
    
}
  1. 暗赞一声,完美。可以找需求小姐姐交差了,又是开心的一天!

后记

遇到需求不要慌,把大需求化小,小需求化了,问题自然迎难而解。

本文地址:https://blog.csdn.net/w_rcss/article/details/110818189

《手把手教你写需求之代码实现pdf转jpg.doc》

下载本文的Word格式文档,以方便收藏与打印。