17d101cc1SGerry Weißbach<?php 27d101cc1SGerry Weißbach 37d101cc1SGerry Weißbachif(!defined('DOKU_PLUGIN')) die('meh'); 47d101cc1SGerry Weißbach 55393176fSGerry Weißbachif ( !empty($_REQUEST['pdfExport']) && intval($_REQUEST['pdfExport']) == 1 && file_exists(DOKU_PLUGIN . 'dw2pdf/mpdf/mpdf.php') ) { 67d101cc1SGerry Weißbach 77d101cc1SGerry Weißbach require_once(DOKU_PLUGIN . 'siteexport/inc/mpdf.php'); 87d101cc1SGerry Weißbach class siteexport_pdfgenerator 97d101cc1SGerry Weißbach { 107d101cc1SGerry Weißbach private $functions; 117d101cc1SGerry Weißbach 127d101cc1SGerry Weißbach public function siteexport_pdfgenerator( $functions=null ) 137d101cc1SGerry Weißbach { 147d101cc1SGerry Weißbach $this->functions = $functions; 157d101cc1SGerry Weißbach } 167d101cc1SGerry Weißbach 17596fd343SGerry Weißbach function createPDFFromFile($filename, &$NAME) { 187d101cc1SGerry Weißbach 197d101cc1SGerry Weißbach if ( !preg_match("/" . $this->settings->fileType . "$/", $NAME) ) { 207d101cc1SGerry Weißbach $this->functions->debug->message("Filetype {$this->settings->fileType} did not match filename '$NAME'", null, 4); 217d101cc1SGerry Weißbach return false; 227d101cc1SGerry Weißbach } 237d101cc1SGerry Weißbach 247f6f0f99SGerry Weißbach $mpdf = new siteexportPDF($this->functions->debug); 257d101cc1SGerry Weißbach 267d101cc1SGerry Weißbach if ( !$mpdf ) { 277d101cc1SGerry Weißbach $this->functions->debug->message("Could not instantiate MPDF", null, 4); 287d101cc1SGerry Weißbach return false; 297d101cc1SGerry Weißbach } 307d101cc1SGerry Weißbach 317d101cc1SGerry Weißbach $html = file_get_contents($filename); 327d101cc1SGerry Weißbach 337d101cc1SGerry Weißbach if ( !strstr($html, "<html") ) { 347d101cc1SGerry Weißbach $this->functions->debug->message("Filecontent had no HTML starting tag", null, 4); 357d101cc1SGerry Weißbach return false; 367d101cc1SGerry Weißbach } 377d101cc1SGerry Weißbach 387d101cc1SGerry Weißbach // Save HTML too 397d101cc1SGerry Weißbach $this->functions->debug->message("Arranging HTML", null, 2); 407d101cc1SGerry Weißbach $this->arrangeHtml($html, 'bl,acronym'); 417d101cc1SGerry Weißbach $this->functions->debug->message("Done arranging HTML:", $html, 1); 427d101cc1SGerry Weißbach 43a4a5b91dSGerry Weißbach $mpdf->debug = false; 447d101cc1SGerry Weißbach $mpdf->list_indent_first_level = 1; // Indents the first level of lists. 45a4a5b91dSGerry Weißbach //$mpdf->SetBasePath("/"); 467d101cc1SGerry Weißbach $mpdf->usepre = false; 477d101cc1SGerry Weißbach $mpdf->margin_bottom_collapse = true; 487d101cc1SGerry Weißbach $mpdf->SetDisplayMode('fullpage'); 497d101cc1SGerry Weißbach $mpdf->restoreBlockPageBreaks = true; 507d101cc1SGerry Weißbach $this->img_dpi = 300; 517d101cc1SGerry Weißbach 52a4a5b91dSGerry Weißbach $mpdf->setBasePath(empty($this->functions->settings->depth) ? './' : $this->functions->settings->depth); 537d101cc1SGerry Weißbach $mpdf->SetAutoFont(AUTOFONT_ALL); 547d101cc1SGerry Weißbach 557d101cc1SGerry Weißbach $mpdf->ignore_invalid_utf8 = true; 567d101cc1SGerry Weißbach $mpdf->mirrorMargins = 0; // don't mirror margins 578914cf7eSGerry Weißbach 587d101cc1SGerry Weißbach $mpdf->WriteHTML($html); 597d101cc1SGerry Weißbach $mpdf->Output($filename, "F"); 607d101cc1SGerry Weißbach 613506d27dSGerry Weißbach $this->functions->debug->message("Used images:", $mpdf->images, 1); 623506d27dSGerry Weißbach $this->functions->debug->message("Failed images:", $mpdf->failedimages, 1); 633506d27dSGerry Weißbach 647d101cc1SGerry Weißbach return true; 657d101cc1SGerry Weißbach } 667d101cc1SGerry Weißbach 677d101cc1SGerry Weißbach function arrangeHtml(&$html, $norendertags = '' ) 687d101cc1SGerry Weißbach { 697d101cc1SGerry Weißbach global $conf; 707d101cc1SGerry Weißbach 717d101cc1SGerry Weißbach // add bookmark links 727d101cc1SGerry Weißbach $html = preg_replace_callback("/<h(\d)(.*?)>(.+?)<\/h\\1>/s", array($this, '__pdfHeaderCallback'), $html); 737d101cc1SGerry Weißbach $html = preg_replace_callback("/<\/div>\s*?<h({$conf['plugin']['siteexport']['PDFHeaderPagebreak']})(.*?)>/s", array($this, '__pdfHeaderCallbackPagebreak'), $html); 747d101cc1SGerry Weißbach $html = preg_replace("/(<img.*?mediacenter.*?\/>)/", "<table style=\"width:100%; border: 0px solid #000;\"><tr><td style=\"text-align: center\">$1</td></tr></table>", $html); 757d101cc1SGerry Weißbach $html = preg_replace("/<p>(\s*?<table.*?<\/table>\s*?)<\/p>/s", "$1", $html); 767d101cc1SGerry Weißbach $html = preg_replace_callback("/<pre(.*?)>(.*?)<\/pre>/s", array($this, '__pdfPreCodeCallback'), $html); 777d101cc1SGerry Weißbach $html = preg_replace_callback("/<a href=\"mailto:(.*?)\".*?>(.*?)<\/a>/s", array($this, '__pdfMailtoCallback'), $html); 787d101cc1SGerry Weißbach /**/ 797d101cc1SGerry Weißbach 807d101cc1SGerry Weißbach $standardReplacer = array ( 817d101cc1SGerry Weißbach // insert a pagebreak for support of WRAP and PAGEBREAK plugins 827d101cc1SGerry Weißbach '<br style="page-break-after:always;">' => '<pagebreak />', 837d101cc1SGerry Weißbach '<div class="wrap_pagebreak"></div>' => '<pagebreak />', 847d101cc1SGerry Weißbach '<sup>' => '<sup class="sup">', 857d101cc1SGerry Weißbach '<sub>' => '<sub class="sub">', 866792d0cfSGerry Weißbach '<code>' => '<code class="code">' 877d101cc1SGerry Weißbach ); 887d101cc1SGerry Weißbach $html = str_replace(array_keys($standardReplacer), array_values($standardReplacer), $html); 897d101cc1SGerry Weißbach 907d101cc1SGerry Weißbach // thanks to Jared Ong 917d101cc1SGerry Weißbach // Customized to strip all span tags so that the wiki <code> SQL would display properly 927d101cc1SGerry Weißbach $norender = explode(',',$norendertags); 937d101cc1SGerry Weißbach $html = $this->strip_only($html, $norender ); //array('span','acronym')); 947d101cc1SGerry Weißbach $html = $this->strip_htmlencodedchars($html); 957d101cc1SGerry Weißbach // Customized to strip all span tags so that the wiki <code> SQL would display properly 967d101cc1SGerry Weißbach } 977d101cc1SGerry Weißbach 987d101cc1SGerry Weißbach private function __pdfMailtoCallback($DATA) { 997d101cc1SGerry Weißbach if ( $DATA[1] == $DATA[2] ) { 1007d101cc1SGerry Weißbach $DATA[2] = $this->deobfuscate($DATA[2]); 1017d101cc1SGerry Weißbach } 1027d101cc1SGerry Weißbach $DATA[1] = $this->deobfuscate($DATA[1]); 1037d101cc1SGerry Weißbach return "<a href=\"mailto:{$DATA[1]}\">{$DATA[2]}</a>"; 1047d101cc1SGerry Weißbach } 1057d101cc1SGerry Weißbach 1067d101cc1SGerry Weißbach private function __pdfPreCodeCallback($DATA) { 1077d101cc1SGerry Weißbach 1087d101cc1SGerry Weißbach $code = nl2br($DATA[2]); 1097d101cc1SGerry Weißbach $code = preg_replace_callback("/(^|<br \/>)(\s+)(\S)/s", array($this, '__pdfPreWhitespacesCallback'), $code); 1107d101cc1SGerry Weißbach 1117d101cc1SGerry Weißbach return "\n<pre" . $DATA[1] . ">\n" . $code . "\n</pre>\n"; 1127d101cc1SGerry Weißbach } 1137d101cc1SGerry Weißbach 1147d101cc1SGerry Weißbach private function __pdfPreWhitespacesCallback( $DATA ) { 1157d101cc1SGerry Weißbach return $DATA[1] . "\n" . str_repeat(" ", strlen($DATA[2])-($DATA[2]{0}=="\n"?1:0) ) . $DATA[3]; 1167d101cc1SGerry Weißbach } 1177d101cc1SGerry Weißbach 1187d101cc1SGerry Weißbach private function __pdfHeaderCallback($DATA) { 119*c14be697SGerry Weißbach //* 120*c14be697SGerry Weißbach $contentText = preg_replace("/<\/?.*?>/s", '', $DATA[3]); // 2014-07-23 Do not encode again. 121*c14be697SGerry Weißbach /*/ 1227d101cc1SGerry Weißbach $contentText = $this->xmlEntities(preg_replace("/<\/?.*?>/s", '', $DATA[3])); // Double encoding - has to be decoded in mpdf once more. 123*c14be697SGerry Weißbach //*/ 1247d101cc1SGerry Weißbach return '<tocentry content="' . $contentText . '" level="' . ($DATA[1]-1) . '" /><bookmark content="' . $contentText . '" level="' . ($DATA[1]-1) . '" /><h' . $DATA[1] . $DATA[2] . '>' . $DATA[3] . '</h' . $DATA[1] . '>'; 1257d101cc1SGerry Weißbach } 1267d101cc1SGerry Weißbach 1277d101cc1SGerry Weißbach private function __pdfHeaderCallbackPagebreak($DATA) { 1287d101cc1SGerry Weißbach return '</div>' . "\r\n" . '<pagebreak />' . "\r\n\r\n" . '<h' . $DATA[1] . $DATA[2] . '>'; 1297d101cc1SGerry Weißbach } 1307d101cc1SGerry Weißbach // thanks to Jared Ong 1317d101cc1SGerry Weißbach // Custom function for help in stripping span tags 1327d101cc1SGerry Weißbach private function strip_only($str, $tags) { 1337d101cc1SGerry Weißbach if(!is_array($tags)) { 1347d101cc1SGerry Weißbach $tags = (strpos($str, '>') !== false ? explode('>', str_replace('<', '', $tags)) : array($tags)); 1357d101cc1SGerry Weißbach if(end($tags) == '') array_pop($tags); 1367d101cc1SGerry Weißbach } 1377d101cc1SGerry Weißbach 1387d101cc1SGerry Weißbach foreach($tags as $tag) $str = preg_replace('#</?'.$tag.'[^>]*>#is', '', $str); 1397d101cc1SGerry Weißbach return $str; 1407d101cc1SGerry Weißbach } 1417d101cc1SGerry Weißbach // Custom function for help in stripping span tags 1427d101cc1SGerry Weißbach 1437d101cc1SGerry Weißbach // Custom function for help in replacing ' " > < & 1447d101cc1SGerry Weißbach private function strip_htmlencodedchars($str) { 1457d101cc1SGerry Weißbach $str = str_replace(''', '\'', $str); 1467d101cc1SGerry Weißbach // $str = str_replace('"', '"', $str); 1477d101cc1SGerry Weißbach // $str = str_replace('>', '>', $str); 1487d101cc1SGerry Weißbach // $str = str_replace('<', '<', $str); 1497d101cc1SGerry Weißbach // $str = str_replace('&', '&', $str); 1507d101cc1SGerry Weißbach return $str; 1517d101cc1SGerry Weißbach } 1527d101cc1SGerry Weißbach // Custom function for help in replacing ' " > < & 1537d101cc1SGerry Weißbach 1547d101cc1SGerry Weißbach /** 1557d101cc1SGerry Weißbach * return an de-obfuscated email address in line with $conf['mailguard'] setting 1567d101cc1SGerry Weißbach */ 1577d101cc1SGerry Weißbach private function deobfuscate($email) { 1587d101cc1SGerry Weißbach global $conf; 1597d101cc1SGerry Weißbach 1607d101cc1SGerry Weißbach switch ($conf['mailguard']) { 1617d101cc1SGerry Weißbach case 'visible' : 1627d101cc1SGerry Weißbach $obfuscate = array(' [at] ' => '@', ' [dot] ' => '.', ' [dash] ' => '-'); 1637d101cc1SGerry Weißbach return strtr($email, $obfuscate); 1647d101cc1SGerry Weißbach 1657d101cc1SGerry Weißbach case 'hex' : 1667d101cc1SGerry Weißbach $encode = ''; 1677d101cc1SGerry Weißbach $len = strlen($email); 1687d101cc1SGerry Weißbach for ($x=0; $x < $len; $x+=6){ 1697d101cc1SGerry Weißbach $encode .= chr(hexdec($email{$x+3}.$email{($x+4)})); 1707d101cc1SGerry Weißbach } 1717d101cc1SGerry Weißbach return $encode; 1727d101cc1SGerry Weißbach 1737d101cc1SGerry Weißbach case 'none' : 1747d101cc1SGerry Weißbach default : 1757d101cc1SGerry Weißbach return $email; 1767d101cc1SGerry Weißbach } 1777d101cc1SGerry Weißbach } 1787d101cc1SGerry Weißbach 1797d101cc1SGerry Weißbach /** 1807d101cc1SGerry Weißbach * Encoding ()taken from DW - but without needing the renderer 1817d101cc1SGerry Weißbach **/ 1827d101cc1SGerry Weißbach private function xmlEntities($string) { 1837d101cc1SGerry Weißbach return htmlspecialchars($string,ENT_QUOTES,'UTF-8'); 1847d101cc1SGerry Weißbach } 1857d101cc1SGerry Weißbach } 1867d101cc1SGerry Weißbach} 1877d101cc1SGerry Weißbach?>