生成PDF的新选择-Phantomjs

简介:

最近在node.js项目开发中,遇见生成PDF的需求,当然生成PDF不是一个新意的需求;我可以选择利用开源的pdfkit或者其他node pdf模块,或者通过edge.js调用.net/python下的pdf库去做生成pdf。但是在我看来对于这些东西不管如何也需要花费我们太多的时间(pdf报表的内容报表很复杂),不如把所有的画图实现逻辑推向大家所熟悉的html+css来的简洁,快速,这样对于pdf格式变化和图形计算逻辑的变化推到ejs、jade之类的模板引擎,对于以后的修改维护扩展是个很不错的选择。所以选择phantomjs加载页面生成PDF对于我来说不是个不错的选择,同时对于html+css我所需要兼容的仅有webkit一种浏览器,没有厌恶的浏览器兼容性顾虑。所以说做就做,我在项目上花了半个小时配置phantomjs的自动化脚本(在各环境能够自动勾践),以及实现了一个简单页面的PDF转化。

rasterize.js(来自官方pdf demo):

var page = require('webpage').create(),

       system = require('system'),

       address, output, size;


   if (system.args.length < 3 || system.args.length > 5) {

       console.log('Usage: rasterize.js URL filename [paperwidth*paperheight|paperformat] [zoom]');

       console.log('  paper (pdf output) examples: "5in*7.5in", "10cm*20cm", "A4", "Letter"');

       phantom.exit(1);

   } else {

       address = system.args[1];

       output = system.args[2];

       page.viewportSize = { width: 600, height: 600 };

       if (system.args.length > 3 && system.args[2].substr(-4) === ".pdf") {

           size = system.args[3].split('*');

           page.paperSize = size.length === 2 ? { width: size[0], height: size[1], margin: '0px' }

               : { format: system.args[3], orientation: 'portrait', margin: '1cm' };

       }

       if (system.args.length > 4) {

           page.zoomFactor = system.args[4];

       }

       page.open(address, function (status) {

           if (status !== 'success') {

               console.log('Unable to load the address!');

               phantom.exit();

           } else {

               window.setTimeout(function () {

                   page.render(output);

                   phantom.exit();

               });

           }

       });

   }

在node调用端,使用exec调用命令行输入得到文件并返回到node response流:

guid utils:

   'use strict';


   var guid = function () {

       var uid = 0;

       this.newId = function () {

           uid = uid % 1000;

           var now = new Date();

           var utc = new Date(now.getTime() + now.getTimezoneOffset() * 60000);

           return utc.getTime() + uid++;

       }

   }


   exports.utils = {

       guid: new guid()

   };

pdfutil:

   'use strict';


   var exec = require('child_process').exec;

   var utils = require('./utils').utils;

   var nodeUtil = require('util');


   var outPut = function (id, req, res) {

       var path = nodeUtil.format("tmp/%s.pdf", utils.guid.newId());

       var port = req.app.settings.port;

       var pdfUrl = nodeUtil.format("%s://%s%s/pdf/%s", req.protocol, req.host, ( port == 80 || port == 443 ? '' : ':' + port ), id);


       exec(nodeUtil.format("phantomjs tool/rasterize.js %s %s A4", pdfUrl, path), function (error, stdout, stderr) {

           if (error || stderr) {

               res.send(500, error || stderr);

               return;

           }

           res.set('Content-Type', 'application/pdf');

           res.download(path);

       });


   };


   exports.pdfUtils = {

       outPut: outPut

   };

响应的代码也可以很好的转换为java/c#...的命令行调用来得到pdf并推送到response流中。一切都这么简单搞定。

node也有node-phantom模块,但是用它生成的pdf样式有点怪,所以最后还是坚持采用了exec方式去做。

还有就是phantomjs生成PDF不会把css的背景色和北京图片带进去,所以对于这块专门利用了纯色图片img标签,并position:relative或者absolute去定位文字.这点还好因为这个页面上用户不会看的,

文章也到此结尾,希望多多交流,继续关注,谢谢大家。





 本文转自 破狼 51CTO博客,原文链接:http://blog.51cto.com/whitewolfblog/1339027,如需转载请自行联系原作者

相关文章
|
Java Shell Python
Smart Crop,一种切除 PDF 扫描文档白边的新选择(工程篇)
周日深夜,我把代码分享到了 Github,用的 MIT 协议,详见 JamesPan/pdf-smart-crop。原本还想着把注释文档和单元测试写了再分享代码的,后来实在是懒了。所以说啊,这些东西如果开发的时候好好写,以后就更没有动力去写了。 前作「Smart Crop,一种切除 PDF
4776 0
|
SQL 算法 Java
Smart Crop,一种切除 PDF 扫描文档白边的新选择(算法篇)
这是我元旦假期的折腾成果。这里先分享一下思路和实现过程中遇到的有意思的事情,代码稍后整理后分享到 Github。 前些日子,同事送了我一个 Kindle,于是我开心地往里面灌了好几本书,开始假装文化人。 背景 但是在尝试阅读的时候,我发现体验并不怎么好,因为我平日里看的电子书大多是扫描版的以技
6306 0
|
1月前
|
数据挖掘 数据安全/隐私保护 开发者
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
75 0
|
1月前
|
存储 缓存 Python
如何使用Python抓取PDF文件并自动下载到本地
如何使用Python抓取PDF文件并自动下载到本地
34 0
|
3月前
|
Java API Apache
使用 Apache PDFBox 操作PDF文件
Apache PDFBox库是一个开源的Java工具,专门用于处理PDF文档。它允许用户创建全新的PDF文件,编辑现有的PDF文档,以及从PDF文件中提取内容。此外,Apache PDFBox还提供了一些命令行实用工具。
103 6
|
3月前
|
存储
Vue3 实现 PDF 文件在线预览功能
Vue3 实现 PDF 文件在线预览功能
313 0
|
4月前
|
JavaScript 前端开发
nodejs实现解析chm文件列表,无需转换为PDF文件格式,在线预览chm文件以及目录,不依赖任何网页端插件
nodejs实现解析chm文件列表,无需转换为PDF文件格式,在线预览chm文件以及目录,不依赖任何网页端插件
|
2月前
|
编解码 数据可视化 数据挖掘
【办公自动化】用Python将PDF文件转存为图片
【办公自动化】用Python将PDF文件转存为图片
64 1
|
1月前
|
JSON JavaScript 前端开发
vue项目使用Print.js插件实现PDF文件打印
vue项目使用Print.js插件实现PDF文件打印
52 0
|
1月前
|
Shell Python
Python生成PDF文件
Python生成PDF文件
23 0

热门文章

最新文章