xref: /plugin/siteexport/inc/pdfgenerator.php (revision c14be697195c95a5be429a69fd37e1bee567a81b)
17d101cc1SGerry Weißbach<?php
27d101cc1SGerry Weißbach
37d101cc1SGerry Weißbachif(!defined('DOKU_PLUGIN')) die('meh');
47d101cc1SGerry Weißbach
55393176fSGerry Weißbachif ( !empty($_REQUEST['pdfExport']) && intval($_REQUEST['pdfExport']) == 1 && file_exists(DOKU_PLUGIN . 'dw2pdf/mpdf/mpdf.php') ) {
67d101cc1SGerry Weißbach
77d101cc1SGerry Weißbach    require_once(DOKU_PLUGIN . 'siteexport/inc/mpdf.php');
87d101cc1SGerry Weißbach    class siteexport_pdfgenerator
97d101cc1SGerry Weißbach    {
107d101cc1SGerry Weißbach        private $functions;
117d101cc1SGerry Weißbach
127d101cc1SGerry Weißbach        public function siteexport_pdfgenerator( $functions=null )
137d101cc1SGerry Weißbach        {
147d101cc1SGerry Weißbach            $this->functions = $functions;
157d101cc1SGerry Weißbach        }
167d101cc1SGerry Weißbach
17596fd343SGerry Weißbach        function createPDFFromFile($filename, &$NAME) {
187d101cc1SGerry Weißbach
197d101cc1SGerry Weißbach            if ( !preg_match("/" . $this->settings->fileType . "$/", $NAME) ) {
207d101cc1SGerry Weißbach                $this->functions->debug->message("Filetype {$this->settings->fileType} did not match filename '$NAME'", null, 4);
217d101cc1SGerry Weißbach                return false;
227d101cc1SGerry Weißbach            }
237d101cc1SGerry Weißbach
247f6f0f99SGerry Weißbach            $mpdf = new siteexportPDF($this->functions->debug);
257d101cc1SGerry Weißbach
267d101cc1SGerry Weißbach            if ( !$mpdf ) {
277d101cc1SGerry Weißbach                $this->functions->debug->message("Could not instantiate MPDF", null, 4);
287d101cc1SGerry Weißbach                return false;
297d101cc1SGerry Weißbach            }
307d101cc1SGerry Weißbach
317d101cc1SGerry Weißbach            $html = file_get_contents($filename);
327d101cc1SGerry Weißbach
337d101cc1SGerry Weißbach            if ( !strstr($html, "<html") ) {
347d101cc1SGerry Weißbach                $this->functions->debug->message("Filecontent had no HTML starting tag", null, 4);
357d101cc1SGerry Weißbach                return false;
367d101cc1SGerry Weißbach            }
377d101cc1SGerry Weißbach
387d101cc1SGerry Weißbach            // Save HTML too
397d101cc1SGerry Weißbach            $this->functions->debug->message("Arranging HTML", null, 2);
407d101cc1SGerry Weißbach            $this->arrangeHtml($html, 'bl,acronym');
417d101cc1SGerry Weißbach            $this->functions->debug->message("Done arranging HTML:", $html, 1);
427d101cc1SGerry Weißbach
43a4a5b91dSGerry Weißbach            $mpdf->debug = false;
447d101cc1SGerry Weißbach            $mpdf->list_indent_first_level = 1; // Indents the first level of lists.
45a4a5b91dSGerry Weißbach            //$mpdf->SetBasePath("/");
467d101cc1SGerry Weißbach            $mpdf->usepre = false;
477d101cc1SGerry Weißbach            $mpdf->margin_bottom_collapse = true;
487d101cc1SGerry Weißbach            $mpdf->SetDisplayMode('fullpage');
497d101cc1SGerry Weißbach            $mpdf->restoreBlockPageBreaks = true;
507d101cc1SGerry Weißbach            $this->img_dpi = 300;
517d101cc1SGerry Weißbach
52a4a5b91dSGerry Weißbach            $mpdf->setBasePath(empty($this->functions->settings->depth) ? './' : $this->functions->settings->depth);
537d101cc1SGerry Weißbach            $mpdf->SetAutoFont(AUTOFONT_ALL);
547d101cc1SGerry Weißbach
557d101cc1SGerry Weißbach            $mpdf->ignore_invalid_utf8 = true;
567d101cc1SGerry Weißbach            $mpdf->mirrorMargins = 0;	// don't mirror margins
578914cf7eSGerry Weißbach
587d101cc1SGerry Weißbach            $mpdf->WriteHTML($html);
597d101cc1SGerry Weißbach            $mpdf->Output($filename, "F");
607d101cc1SGerry Weißbach
613506d27dSGerry Weißbach            $this->functions->debug->message("Used images:", $mpdf->images, 1);
623506d27dSGerry Weißbach            $this->functions->debug->message("Failed images:", $mpdf->failedimages, 1);
633506d27dSGerry Weißbach
647d101cc1SGerry Weißbach            return true;
657d101cc1SGerry Weißbach        }
667d101cc1SGerry Weißbach
677d101cc1SGerry Weißbach        function arrangeHtml(&$html, $norendertags = '' )
687d101cc1SGerry Weißbach        {
697d101cc1SGerry Weißbach            global $conf;
707d101cc1SGerry Weißbach
717d101cc1SGerry Weißbach            // add bookmark links
727d101cc1SGerry Weißbach            $html = preg_replace_callback("/<h(\d)(.*?)>(.+?)<\/h\\1>/s", array($this, '__pdfHeaderCallback'), $html);
737d101cc1SGerry Weißbach            $html = preg_replace_callback("/<\/div>\s*?<h({$conf['plugin']['siteexport']['PDFHeaderPagebreak']})(.*?)>/s", array($this, '__pdfHeaderCallbackPagebreak'), $html);
747d101cc1SGerry Weißbach            $html = preg_replace("/(<img.*?mediacenter.*?\/>)/", "<table style=\"width:100%; border: 0px solid #000;\"><tr><td style=\"text-align: center\">$1</td></tr></table>", $html);
757d101cc1SGerry Weißbach            $html = preg_replace("/<p>(\s*?<table.*?<\/table>\s*?)<\/p>/s", "$1", $html);
767d101cc1SGerry Weißbach            $html = preg_replace_callback("/<pre(.*?)>(.*?)<\/pre>/s", array($this, '__pdfPreCodeCallback'), $html);
777d101cc1SGerry Weißbach            $html = preg_replace_callback("/<a href=\"mailto:(.*?)\".*?>(.*?)<\/a>/s", array($this, '__pdfMailtoCallback'), $html);
787d101cc1SGerry Weißbach            /**/
797d101cc1SGerry Weißbach
807d101cc1SGerry Weißbach            $standardReplacer = array (
817d101cc1SGerry Weißbach            // insert a pagebreak for support of WRAP and PAGEBREAK plugins
827d101cc1SGerry Weißbach        							'<br style="page-break-after:always;">' => '<pagebreak />',
837d101cc1SGerry Weißbach                                    '<div class="wrap_pagebreak"></div>' => '<pagebreak />',
847d101cc1SGerry Weißbach                                    '<sup>' => '<sup class="sup">',
857d101cc1SGerry Weißbach                                    '<sub>' => '<sub class="sub">',
866792d0cfSGerry Weißbach                                    '<code>' => '<code class="code">'
877d101cc1SGerry Weißbach            );
887d101cc1SGerry Weißbach            $html = str_replace(array_keys($standardReplacer), array_values($standardReplacer), $html);
897d101cc1SGerry Weißbach
907d101cc1SGerry Weißbach            // thanks to Jared Ong
917d101cc1SGerry Weißbach            // Customized to strip all span tags so that the wiki <code> SQL would display properly
927d101cc1SGerry Weißbach            $norender = explode(',',$norendertags);
937d101cc1SGerry Weißbach            $html = $this->strip_only($html, $norender ); //array('span','acronym'));
947d101cc1SGerry Weißbach            $html = $this->strip_htmlencodedchars($html);
957d101cc1SGerry Weißbach            // Customized to strip all span tags so that the wiki <code> SQL would display properly
967d101cc1SGerry Weißbach        }
977d101cc1SGerry Weißbach
987d101cc1SGerry Weißbach        private function __pdfMailtoCallback($DATA) {
997d101cc1SGerry Weißbach            if ( $DATA[1] == $DATA[2] ) {
1007d101cc1SGerry Weißbach                $DATA[2] = $this->deobfuscate($DATA[2]);
1017d101cc1SGerry Weißbach            }
1027d101cc1SGerry Weißbach            $DATA[1] = $this->deobfuscate($DATA[1]);
1037d101cc1SGerry Weißbach            return "<a href=\"mailto:{$DATA[1]}\">{$DATA[2]}</a>";
1047d101cc1SGerry Weißbach        }
1057d101cc1SGerry Weißbach
1067d101cc1SGerry Weißbach        private function __pdfPreCodeCallback($DATA) {
1077d101cc1SGerry Weißbach
1087d101cc1SGerry Weißbach            $code = nl2br($DATA[2]);
1097d101cc1SGerry Weißbach            $code = preg_replace_callback("/(^|<br \/>)(\s+)(\S)/s", array($this, '__pdfPreWhitespacesCallback'), $code);
1107d101cc1SGerry Weißbach
1117d101cc1SGerry Weißbach            return "\n<pre" . $DATA[1] . ">\n" . $code . "\n</pre>\n";
1127d101cc1SGerry Weißbach        }
1137d101cc1SGerry Weißbach
1147d101cc1SGerry Weißbach        private function __pdfPreWhitespacesCallback( $DATA ) {
1157d101cc1SGerry Weißbach            return $DATA[1] . "\n" . str_repeat("&nbsp;", strlen($DATA[2])-($DATA[2]{0}=="\n"?1:0) ) . $DATA[3];
1167d101cc1SGerry Weißbach        }
1177d101cc1SGerry Weißbach
1187d101cc1SGerry Weißbach        private function __pdfHeaderCallback($DATA) {
119*c14be697SGerry Weißbach            //*
120*c14be697SGerry Weißbach            $contentText = preg_replace("/<\/?.*?>/s", '', $DATA[3]); // 2014-07-23 Do not encode again.
121*c14be697SGerry Weißbach            /*/
1227d101cc1SGerry Weißbach            $contentText = $this->xmlEntities(preg_replace("/<\/?.*?>/s", '', $DATA[3])); // Double encoding - has to be decoded in mpdf once more.
123*c14be697SGerry Weißbach            //*/
1247d101cc1SGerry Weißbach            return '<tocentry content="' . $contentText . '" level="' . ($DATA[1]-1) . '" /><bookmark content="' . $contentText . '" level="' . ($DATA[1]-1) . '" /><h' . $DATA[1] . $DATA[2] . '>' . $DATA[3] . '</h' . $DATA[1] . '>';
1257d101cc1SGerry Weißbach        }
1267d101cc1SGerry Weißbach
1277d101cc1SGerry Weißbach        private function __pdfHeaderCallbackPagebreak($DATA) {
1287d101cc1SGerry Weißbach            return '</div>' . "\r\n" . '<pagebreak />' . "\r\n\r\n" . '<h' . $DATA[1] . $DATA[2] . '>';
1297d101cc1SGerry Weißbach        }
1307d101cc1SGerry Weißbach        // thanks to Jared Ong
1317d101cc1SGerry Weißbach        // Custom function for help in stripping span tags
1327d101cc1SGerry Weißbach        private function strip_only($str, $tags) {
1337d101cc1SGerry Weißbach            if(!is_array($tags)) {
1347d101cc1SGerry Weißbach                $tags = (strpos($str, '>') !== false ? explode('>', str_replace('<', '', $tags)) : array($tags));
1357d101cc1SGerry Weißbach                if(end($tags) == '') array_pop($tags);
1367d101cc1SGerry Weißbach            }
1377d101cc1SGerry Weißbach
1387d101cc1SGerry Weißbach            foreach($tags as $tag) $str = preg_replace('#</?'.$tag.'[^>]*>#is', '', $str);
1397d101cc1SGerry Weißbach            return $str;
1407d101cc1SGerry Weißbach        }
1417d101cc1SGerry Weißbach        // Custom function for help in stripping span tags
1427d101cc1SGerry Weißbach
1437d101cc1SGerry Weißbach        // Custom function for help in replacing &#039; &quot; &gt; &lt; &amp;
1447d101cc1SGerry Weißbach        private function strip_htmlencodedchars($str) {
1457d101cc1SGerry Weißbach            $str = str_replace('&#039;', '\'', $str);
1467d101cc1SGerry Weißbach            //        $str = str_replace('&quot;', '"', $str);
1477d101cc1SGerry Weißbach            //        $str = str_replace('&gt;', '>', $str);
1487d101cc1SGerry Weißbach            //        $str = str_replace('&lt;', '<', $str);
1497d101cc1SGerry Weißbach            //        $str = str_replace('&amp;', '&', $str);
1507d101cc1SGerry Weißbach            return $str;
1517d101cc1SGerry Weißbach        }
1527d101cc1SGerry Weißbach        // Custom function for help in replacing &#039; &quot; &gt; &lt; &amp;
1537d101cc1SGerry Weißbach
1547d101cc1SGerry Weißbach        /**
1557d101cc1SGerry Weißbach         * return an de-obfuscated email address in line with $conf['mailguard'] setting
1567d101cc1SGerry Weißbach         */
1577d101cc1SGerry Weißbach        private function deobfuscate($email) {
1587d101cc1SGerry Weißbach            global $conf;
1597d101cc1SGerry Weißbach
1607d101cc1SGerry Weißbach            switch ($conf['mailguard']) {
1617d101cc1SGerry Weißbach                case 'visible' :
1627d101cc1SGerry Weißbach                    $obfuscate = array(' [at] ' => '@', ' [dot] ' => '.', ' [dash] ' => '-');
1637d101cc1SGerry Weißbach                    return strtr($email, $obfuscate);
1647d101cc1SGerry Weißbach
1657d101cc1SGerry Weißbach                case 'hex' :
1667d101cc1SGerry Weißbach                    $encode = '';
1677d101cc1SGerry Weißbach                    $len = strlen($email);
1687d101cc1SGerry Weißbach                    for ($x=0; $x < $len; $x+=6){
1697d101cc1SGerry Weißbach                        $encode .= chr(hexdec($email{$x+3}.$email{($x+4)}));
1707d101cc1SGerry Weißbach                    }
1717d101cc1SGerry Weißbach                    return $encode;
1727d101cc1SGerry Weißbach
1737d101cc1SGerry Weißbach                case 'none' :
1747d101cc1SGerry Weißbach                default :
1757d101cc1SGerry Weißbach                    return $email;
1767d101cc1SGerry Weißbach            }
1777d101cc1SGerry Weißbach        }
1787d101cc1SGerry Weißbach
1797d101cc1SGerry Weißbach        /**
1807d101cc1SGerry Weißbach         * Encoding ()taken from DW - but without needing the renderer
1817d101cc1SGerry Weißbach         **/
1827d101cc1SGerry Weißbach        private function xmlEntities($string) {
1837d101cc1SGerry Weißbach            return htmlspecialchars($string,ENT_QUOTES,'UTF-8');
1847d101cc1SGerry Weißbach        }
1857d101cc1SGerry Weißbach    }
1867d101cc1SGerry Weißbach}
1877d101cc1SGerry Weißbach?>