17d559c7fSBen Coburn<?php 27d559c7fSBen Coburn/** 37d559c7fSBen Coburn * Changelog handling functions 47d559c7fSBen Coburn * 57d559c7fSBen Coburn * @license GPL 2 (http://www.gnu.org/licenses/gpl.html) 67d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org> 77d559c7fSBen Coburn */ 87d559c7fSBen Coburn 9ebf1501fSBen Coburn// Constants for known core changelog line types. 10ebf1501fSBen Coburn// Use these in place of string literals for more readable code. 11ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_CREATE', 'C'); 12ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_EDIT', 'E'); 13ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_MINOR_EDIT', 'e'); 14ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_DELETE', 'D'); 15ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_REVERT', 'R'); 16ebf1501fSBen Coburn 177d559c7fSBen Coburn/** 187d559c7fSBen Coburn * parses a changelog line into it's components 197d559c7fSBen Coburn * 207d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net> 214f1e2cb3SGerrit Uitslag * 224f1e2cb3SGerrit Uitslag * @param string $line changelog line 234f1e2cb3SGerrit Uitslag * @return array|bool parsed line or false 247d559c7fSBen Coburn */ 257d559c7fSBen Coburnfunction parseChangelogLine($line) { 267d559c7fSBen Coburn $tmp = explode("\t", $line); 277d559c7fSBen Coburn if ($tmp!==false && count($tmp)>1) { 287d559c7fSBen Coburn $info = array(); 29e16d739eSBen Coburn $info['date'] = (int)$tmp[0]; // unix timestamp 307d559c7fSBen Coburn $info['ip'] = $tmp[1]; // IPv4 address (127.0.0.1) 317d559c7fSBen Coburn $info['type'] = $tmp[2]; // log line type 327d559c7fSBen Coburn $info['id'] = $tmp[3]; // page id 337d559c7fSBen Coburn $info['user'] = $tmp[4]; // user name 347d559c7fSBen Coburn $info['sum'] = $tmp[5]; // edit summary (or action reason) 357d559c7fSBen Coburn $info['extra'] = rtrim($tmp[6], "\n"); // extra data (varies by line type) 367d559c7fSBen Coburn return $info; 377d559c7fSBen Coburn } else { return false; } 387d559c7fSBen Coburn} 397d559c7fSBen Coburn 407d559c7fSBen Coburn/** 417d559c7fSBen Coburn * Add's an entry to the changelog and saves the metadata for the page 427d559c7fSBen Coburn * 43a365baeeSDominik Eckelmann * @param int $date Timestamp of the change 44a365baeeSDominik Eckelmann * @param String $id Name of the affected page 45a365baeeSDominik Eckelmann * @param String $type Type of the change see DOKU_CHANGE_TYPE_* 46a365baeeSDominik Eckelmann * @param String $summary Summary of the change 47a365baeeSDominik Eckelmann * @param mixed $extra In case of a revert the revision (timestmp) of the reverted page 48a365baeeSDominik Eckelmann * @param array $flags Additional flags in a key value array. 494f1e2cb3SGerrit Uitslag * Available flags: 50a365baeeSDominik Eckelmann * - ExternalEdit - mark as an external edit. 51a365baeeSDominik Eckelmann * 527d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org> 537d559c7fSBen Coburn * @author Esther Brunner <wikidesign@gmail.com> 547d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net> 557d559c7fSBen Coburn */ 56ebf1501fSBen Coburnfunction addLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){ 577d559c7fSBen Coburn global $conf, $INFO; 58585bf44eSChristopher Smith /** @var Input $INPUT */ 59585bf44eSChristopher Smith global $INPUT; 607d559c7fSBen Coburn 615aa52fafSBen Coburn // check for special flags as keys 625aa52fafSBen Coburn if (!is_array($flags)) { $flags = array(); } 635aa52fafSBen Coburn $flagExternalEdit = isset($flags['ExternalEdit']); 645aa52fafSBen Coburn 657d559c7fSBen Coburn $id = cleanid($id); 667d559c7fSBen Coburn $file = wikiFN($id); 677d559c7fSBen Coburn $created = @filectime($file); 68ebf1501fSBen Coburn $minor = ($type===DOKU_CHANGE_TYPE_MINOR_EDIT); 69ebf1501fSBen Coburn $wasRemoved = ($type===DOKU_CHANGE_TYPE_DELETE); 707d559c7fSBen Coburn 717d559c7fSBen Coburn if(!$date) $date = time(); //use current time if none supplied 722f9daf16SAndreas Gohr $remote = (!$flagExternalEdit)?clientIP(true):'127.0.0.1'; 73585bf44eSChristopher Smith $user = (!$flagExternalEdit)?$INPUT->server->str('REMOTE_USER'):''; 747d559c7fSBen Coburn 757d559c7fSBen Coburn $strip = array("\t", "\n"); 767d559c7fSBen Coburn $logline = array( 777d559c7fSBen Coburn 'date' => $date, 787d559c7fSBen Coburn 'ip' => $remote, 797d559c7fSBen Coburn 'type' => str_replace($strip, '', $type), 807d559c7fSBen Coburn 'id' => $id, 817d559c7fSBen Coburn 'user' => $user, 827fa35bb1SAndreas Gohr 'sum' => utf8_substr(str_replace($strip, '', $summary),0,255), 837d559c7fSBen Coburn 'extra' => str_replace($strip, '', $extra) 847d559c7fSBen Coburn ); 857d559c7fSBen Coburn 86*fed2ee90SGerrit Uitslag $wasCreated = ($type===DOKU_CHANGE_TYPE_CREATE); 87*fed2ee90SGerrit Uitslag $wasReverted = ($type===DOKU_CHANGE_TYPE_REVERT); 887d559c7fSBen Coburn // update metadata 897d559c7fSBen Coburn if (!$wasRemoved) { 903d1f9ec3SMichael Klier $oldmeta = p_read_metadata($id); 917d559c7fSBen Coburn $meta = array(); 92*fed2ee90SGerrit Uitslag if ($wasCreated && empty($oldmeta['persistent']['date']['created'])){ // newly created 937d559c7fSBen Coburn $meta['date']['created'] = $created; 94a8e72133SAndreas Gohr if ($user){ 95a8e72133SAndreas Gohr $meta['creator'] = $INFO['userinfo']['name']; 96a8e72133SAndreas Gohr $meta['user'] = $user; 97a8e72133SAndreas Gohr } 98*fed2ee90SGerrit Uitslag } elseif (($wasCreated || $wasReverted) && !empty($oldmeta['persistent']['date']['created'])) { // re-created / restored 993d1f9ec3SMichael Klier $meta['date']['created'] = $oldmeta['persistent']['date']['created']; 1003d1f9ec3SMichael Klier $meta['date']['modified'] = $created; // use the files ctime here 1013d1f9ec3SMichael Klier $meta['creator'] = $oldmeta['persistent']['creator']; 1023d1f9ec3SMichael Klier if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name']; 1037d559c7fSBen Coburn } elseif (!$minor) { // non-minor modification 1047d559c7fSBen Coburn $meta['date']['modified'] = $date; 1057d559c7fSBen Coburn if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name']; 1067d559c7fSBen Coburn } 1077d559c7fSBen Coburn $meta['last_change'] = $logline; 108ee4d22e0SChristopher Smith p_set_metadata($id, $meta); 1097d559c7fSBen Coburn } 1107d559c7fSBen Coburn 1117d559c7fSBen Coburn // add changelog lines 1127d559c7fSBen Coburn $logline = implode("\t", $logline)."\n"; 1137d559c7fSBen Coburn io_saveFile(metaFN($id,'.changes'),$logline,true); //page changelog 1147d559c7fSBen Coburn io_saveFile($conf['changelog'],$logline,true); //global changelog cache 1157d559c7fSBen Coburn} 1167d559c7fSBen Coburn 1177d559c7fSBen Coburn/** 11899c8d7f2Smichael * Add's an entry to the media changelog 11999c8d7f2Smichael * 12099c8d7f2Smichael * @author Michael Hamann <michael@content-space.de> 12199c8d7f2Smichael * @author Andreas Gohr <andi@splitbrain.org> 12299c8d7f2Smichael * @author Esther Brunner <wikidesign@gmail.com> 12399c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net> 1244f1e2cb3SGerrit Uitslag * 1254f1e2cb3SGerrit Uitslag * @param int $date Timestamp of the change 1264f1e2cb3SGerrit Uitslag * @param String $id Name of the affected page 1274f1e2cb3SGerrit Uitslag * @param String $type Type of the change see DOKU_CHANGE_TYPE_* 1284f1e2cb3SGerrit Uitslag * @param String $summary Summary of the change 1294f1e2cb3SGerrit Uitslag * @param mixed $extra In case of a revert the revision (timestmp) of the reverted page 1304f1e2cb3SGerrit Uitslag * @param array $flags Additional flags in a key value array. 1314f1e2cb3SGerrit Uitslag * Available flags: 1324f1e2cb3SGerrit Uitslag * - (none, so far) 13399c8d7f2Smichael */ 13499c8d7f2Smichaelfunction addMediaLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){ 135de3eb1d7SAdrian Lang global $conf; 136585bf44eSChristopher Smith /** @var Input $INPUT */ 137585bf44eSChristopher Smith global $INPUT; 13899c8d7f2Smichael 13999c8d7f2Smichael $id = cleanid($id); 14099c8d7f2Smichael 14199c8d7f2Smichael if(!$date) $date = time(); //use current time if none supplied 1422f9daf16SAndreas Gohr $remote = clientIP(true); 143585bf44eSChristopher Smith $user = $INPUT->server->str('REMOTE_USER'); 14499c8d7f2Smichael 14599c8d7f2Smichael $strip = array("\t", "\n"); 14699c8d7f2Smichael $logline = array( 14799c8d7f2Smichael 'date' => $date, 14899c8d7f2Smichael 'ip' => $remote, 14999c8d7f2Smichael 'type' => str_replace($strip, '', $type), 15099c8d7f2Smichael 'id' => $id, 15199c8d7f2Smichael 'user' => $user, 1527fa35bb1SAndreas Gohr 'sum' => utf8_substr(str_replace($strip, '', $summary),0,255), 15399c8d7f2Smichael 'extra' => str_replace($strip, '', $extra) 15499c8d7f2Smichael ); 15599c8d7f2Smichael 15699c8d7f2Smichael // add changelog lines 15799c8d7f2Smichael $logline = implode("\t", $logline)."\n"; 15899c8d7f2Smichael io_saveFile($conf['media_changelog'],$logline,true); //global media changelog cache 159e4f389efSKate Arzamastseva io_saveFile(mediaMetaFN($id,'.changes'),$logline,true); //media file's changelog 16099c8d7f2Smichael} 16199c8d7f2Smichael 16299c8d7f2Smichael/** 1637d559c7fSBen Coburn * returns an array of recently changed files using the 1647d559c7fSBen Coburn * changelog 1657d559c7fSBen Coburn * 1667d559c7fSBen Coburn * The following constants can be used to control which changes are 1677d559c7fSBen Coburn * included. Add them together as needed. 1687d559c7fSBen Coburn * 1697d559c7fSBen Coburn * RECENTS_SKIP_DELETED - don't include deleted pages 1707d559c7fSBen Coburn * RECENTS_SKIP_MINORS - don't include minor changes 1717d559c7fSBen Coburn * RECENTS_SKIP_SUBSPACES - don't include subspaces 1720b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES - return media changes instead of page changes 1730b926329SKate Arzamastseva * RECENTS_MEDIA_PAGES_MIXED - return both media changes and page changes 1747d559c7fSBen Coburn * 1757d559c7fSBen Coburn * @param int $first number of first entry returned (for paginating 1767d559c7fSBen Coburn * @param int $num return $num entries 1777d559c7fSBen Coburn * @param string $ns restrict to given namespace 17859f20ea3SMichael Hamann * @param int $flags see above 17959f20ea3SMichael Hamann * @return array recently changed files 1807d559c7fSBen Coburn * 1817d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net> 18229778747SKate Arzamastseva * @author Kate Arzamastseva <pshns@ukr.net> 1837d559c7fSBen Coburn */ 1847d559c7fSBen Coburnfunction getRecents($first,$num,$ns='',$flags=0){ 1857d559c7fSBen Coburn global $conf; 1867d559c7fSBen Coburn $recent = array(); 1877d559c7fSBen Coburn $count = 0; 1887d559c7fSBen Coburn 1897d559c7fSBen Coburn if(!$num) 1907d559c7fSBen Coburn return $recent; 1917d559c7fSBen Coburn 1927d559c7fSBen Coburn // read all recent changes. (kept short) 1930b926329SKate Arzamastseva if ($flags & RECENTS_MEDIA_CHANGES) { 19499c8d7f2Smichael $lines = @file($conf['media_changelog']); 19599c8d7f2Smichael } else { 19676d47b34SDavid Lorentsen $lines = @file($conf['changelog']); 19799c8d7f2Smichael } 19829778747SKate Arzamastseva $lines_position = count($lines)-1; 19959f20ea3SMichael Hamann $media_lines_position = 0; 20059f20ea3SMichael Hamann $media_lines = array(); 20129778747SKate Arzamastseva 2020b926329SKate Arzamastseva if ($flags & RECENTS_MEDIA_PAGES_MIXED) { 20329778747SKate Arzamastseva $media_lines = @file($conf['media_changelog']); 20429778747SKate Arzamastseva $media_lines_position = count($media_lines)-1; 20529778747SKate Arzamastseva } 20629778747SKate Arzamastseva 20729778747SKate Arzamastseva $seen = array(); // caches seen lines, _handleRecent() skips them 2087d559c7fSBen Coburn 2097d559c7fSBen Coburn // handle lines 2100b926329SKate Arzamastseva while ($lines_position >= 0 || (($flags & RECENTS_MEDIA_PAGES_MIXED) && $media_lines_position >=0)) { 21129778747SKate Arzamastseva if (empty($rec) && $lines_position >= 0) { 2121d901ab2SAndreas Gohr $rec = _handleRecent(@$lines[$lines_position], $ns, $flags, $seen); 21329778747SKate Arzamastseva if (!$rec) { 21429778747SKate Arzamastseva $lines_position --; 21529778747SKate Arzamastseva continue; 21629778747SKate Arzamastseva } 21729778747SKate Arzamastseva } 2180b926329SKate Arzamastseva if (($flags & RECENTS_MEDIA_PAGES_MIXED) && empty($media_rec) && $media_lines_position >= 0) { 21942025dfdSMichael Hamann $media_rec = _handleRecent(@$media_lines[$media_lines_position], $ns, $flags | RECENTS_MEDIA_CHANGES, $seen); 22029778747SKate Arzamastseva if (!$media_rec) { 22129778747SKate Arzamastseva $media_lines_position --; 22229778747SKate Arzamastseva continue; 22329778747SKate Arzamastseva } 22429778747SKate Arzamastseva } 2250b926329SKate Arzamastseva if (($flags & RECENTS_MEDIA_PAGES_MIXED) && @$media_rec['date'] >= @$rec['date']) { 22629778747SKate Arzamastseva $media_lines_position--; 22729778747SKate Arzamastseva $x = $media_rec; 228b5941dfaSKate Arzamastseva $x['media'] = true; 22929778747SKate Arzamastseva $media_rec = false; 23029778747SKate Arzamastseva } else { 23129778747SKate Arzamastseva $lines_position--; 23229778747SKate Arzamastseva $x = $rec; 233421ec38eSKate Arzamastseva if ($flags & RECENTS_MEDIA_CHANGES) $x['media'] = true; 23429778747SKate Arzamastseva $rec = false; 23529778747SKate Arzamastseva } 2367d559c7fSBen Coburn if(--$first >= 0) continue; // skip first entries 23729778747SKate Arzamastseva $recent[] = $x; 2387d559c7fSBen Coburn $count++; 2397d559c7fSBen Coburn // break when we have enough entries 2407d559c7fSBen Coburn if($count >= $num){ break; } 2417d559c7fSBen Coburn } 2427d559c7fSBen Coburn return $recent; 2437d559c7fSBen Coburn} 2447d559c7fSBen Coburn 2457d559c7fSBen Coburn/** 24699c8d7f2Smichael * returns an array of files changed since a given time using the 24799c8d7f2Smichael * changelog 24899c8d7f2Smichael * 24999c8d7f2Smichael * The following constants can be used to control which changes are 25099c8d7f2Smichael * included. Add them together as needed. 25199c8d7f2Smichael * 25299c8d7f2Smichael * RECENTS_SKIP_DELETED - don't include deleted pages 25399c8d7f2Smichael * RECENTS_SKIP_MINORS - don't include minor changes 25499c8d7f2Smichael * RECENTS_SKIP_SUBSPACES - don't include subspaces 2550b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES - return media changes instead of page changes 25699c8d7f2Smichael * 25799c8d7f2Smichael * @param int $from date of the oldest entry to return 25899c8d7f2Smichael * @param int $to date of the newest entry to return (for pagination, optional) 25999c8d7f2Smichael * @param string $ns restrict to given namespace (optional) 26059f20ea3SMichael Hamann * @param int $flags see above (optional) 26159f20ea3SMichael Hamann * @return array of files 26299c8d7f2Smichael * 26399c8d7f2Smichael * @author Michael Hamann <michael@content-space.de> 26499c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net> 26599c8d7f2Smichael */ 26699c8d7f2Smichaelfunction getRecentsSince($from,$to=null,$ns='',$flags=0){ 26799c8d7f2Smichael global $conf; 26899c8d7f2Smichael $recent = array(); 26999c8d7f2Smichael 27099c8d7f2Smichael if($to && $to < $from) 27199c8d7f2Smichael return $recent; 27299c8d7f2Smichael 27399c8d7f2Smichael // read all recent changes. (kept short) 2740b926329SKate Arzamastseva if ($flags & RECENTS_MEDIA_CHANGES) { 27599c8d7f2Smichael $lines = @file($conf['media_changelog']); 27699c8d7f2Smichael } else { 27799c8d7f2Smichael $lines = @file($conf['changelog']); 27899c8d7f2Smichael } 279e920a0a1SAndreas Gohr if(!$lines) return $recent; 28099c8d7f2Smichael 28199c8d7f2Smichael // we start searching at the end of the list 28299c8d7f2Smichael $lines = array_reverse($lines); 28399c8d7f2Smichael 28499c8d7f2Smichael // handle lines 28599c8d7f2Smichael $seen = array(); // caches seen lines, _handleRecent() skips them 28699c8d7f2Smichael 28799c8d7f2Smichael foreach($lines as $line){ 28899c8d7f2Smichael $rec = _handleRecent($line, $ns, $flags, $seen); 28999c8d7f2Smichael if($rec !== false) { 29099c8d7f2Smichael if ($rec['date'] >= $from) { 29199c8d7f2Smichael if (!$to || $rec['date'] <= $to) { 29299c8d7f2Smichael $recent[] = $rec; 29399c8d7f2Smichael } 29499c8d7f2Smichael } else { 29599c8d7f2Smichael break; 29699c8d7f2Smichael } 29799c8d7f2Smichael } 29899c8d7f2Smichael } 29999c8d7f2Smichael 30099c8d7f2Smichael return array_reverse($recent); 30199c8d7f2Smichael} 30299c8d7f2Smichael 30399c8d7f2Smichael/** 3047d559c7fSBen Coburn * Internal function used by getRecents 3057d559c7fSBen Coburn * 3067d559c7fSBen Coburn * don't call directly 3077d559c7fSBen Coburn * 3087d559c7fSBen Coburn * @see getRecents() 3097d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org> 3107d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net> 3114f1e2cb3SGerrit Uitslag * 3124f1e2cb3SGerrit Uitslag * @param string $line changelog line 3134f1e2cb3SGerrit Uitslag * @param string $ns restrict to given namespace 3144f1e2cb3SGerrit Uitslag * @param int $flags flags to control which changes are included 3154f1e2cb3SGerrit Uitslag * @param array $seen listing of seen pages 3164f1e2cb3SGerrit Uitslag * @return array|bool false or array with info about a change 3177d559c7fSBen Coburn */ 31899c8d7f2Smichaelfunction _handleRecent($line,$ns,$flags,&$seen){ 3197d559c7fSBen Coburn if(empty($line)) return false; //skip empty lines 3207d559c7fSBen Coburn 3217d559c7fSBen Coburn // split the line into parts 3227d559c7fSBen Coburn $recent = parseChangelogLine($line); 3237d559c7fSBen Coburn if ($recent===false) { return false; } 3247d559c7fSBen Coburn 3257d559c7fSBen Coburn // skip seen ones 3267d559c7fSBen Coburn if(isset($seen[$recent['id']])) return false; 3277d559c7fSBen Coburn 3287d559c7fSBen Coburn // skip minors 329ebf1501fSBen Coburn if($recent['type']===DOKU_CHANGE_TYPE_MINOR_EDIT && ($flags & RECENTS_SKIP_MINORS)) return false; 3307d559c7fSBen Coburn 3317d559c7fSBen Coburn // remember in seen to skip additional sights 3327d559c7fSBen Coburn $seen[$recent['id']] = 1; 3337d559c7fSBen Coburn 3347d559c7fSBen Coburn // check if it's a hidden page 3357d559c7fSBen Coburn if(isHiddenPage($recent['id'])) return false; 3367d559c7fSBen Coburn 3377d559c7fSBen Coburn // filter namespace 3387d559c7fSBen Coburn if (($ns) && (strpos($recent['id'],$ns.':') !== 0)) return false; 3397d559c7fSBen Coburn 3407d559c7fSBen Coburn // exclude subnamespaces 3417d559c7fSBen Coburn if (($flags & RECENTS_SKIP_SUBSPACES) && (getNS($recent['id']) != $ns)) return false; 3427d559c7fSBen Coburn 3437d559c7fSBen Coburn // check ACL 34442025dfdSMichael Hamann if ($flags & RECENTS_MEDIA_CHANGES) { 34542025dfdSMichael Hamann $recent['perms'] = auth_quickaclcheck(getNS($recent['id']).':*'); 34642025dfdSMichael Hamann } else { 34799c8d7f2Smichael $recent['perms'] = auth_quickaclcheck($recent['id']); 34842025dfdSMichael Hamann } 34999c8d7f2Smichael if ($recent['perms'] < AUTH_READ) return false; 3507d559c7fSBen Coburn 3517d559c7fSBen Coburn // check existance 3521d901ab2SAndreas Gohr if($flags & RECENTS_SKIP_DELETED){ 35342025dfdSMichael Hamann $fn = (($flags & RECENTS_MEDIA_CHANGES) ? mediaFN($recent['id']) : wikiFN($recent['id'])); 3541d901ab2SAndreas Gohr if(!@file_exists($fn)) return false; 3551d901ab2SAndreas Gohr } 3567d559c7fSBen Coburn 3577d559c7fSBen Coburn return $recent; 3587d559c7fSBen Coburn} 3597d559c7fSBen Coburn 3607d559c7fSBen Coburn/** 361047bad06SGerrit Uitslag * Class ChangeLog 362047bad06SGerrit Uitslag * methods for handling of changelog of pages or media files 3638eccf945SGerrit Uitslag */ 364047bad06SGerrit Uitslagabstract class ChangeLog { 3658eccf945SGerrit Uitslag 3668eccf945SGerrit Uitslag /** @var string */ 367047bad06SGerrit Uitslag protected $id; 3688eccf945SGerrit Uitslag /** @var int */ 369047bad06SGerrit Uitslag protected $chunk_size; 3708eccf945SGerrit Uitslag /** @var array */ 371047bad06SGerrit Uitslag protected $cache; 3728eccf945SGerrit Uitslag 3738eccf945SGerrit Uitslag /** 3748eccf945SGerrit Uitslag * Constructor 3758eccf945SGerrit Uitslag * 3768eccf945SGerrit Uitslag * @param string $id page id 3778eccf945SGerrit Uitslag * @param int $chunk_size maximum block size read from file 3788eccf945SGerrit Uitslag */ 3798eccf945SGerrit Uitslag public function __construct($id, $chunk_size = 8192) { 3808eccf945SGerrit Uitslag global $cache_revinfo; 3818eccf945SGerrit Uitslag 3828eccf945SGerrit Uitslag $this->cache =& $cache_revinfo; 3838eccf945SGerrit Uitslag if(!isset($this->cache[$id])) { 3848eccf945SGerrit Uitslag $this->cache[$id] = array(); 3858eccf945SGerrit Uitslag } 3868eccf945SGerrit Uitslag 3878eccf945SGerrit Uitslag $this->id = $id; 3888eccf945SGerrit Uitslag $this->setChunkSize($chunk_size); 3898eccf945SGerrit Uitslag 3908eccf945SGerrit Uitslag } 3918eccf945SGerrit Uitslag 3928eccf945SGerrit Uitslag /** 3938eccf945SGerrit Uitslag * Set chunk size for file reading 394047bad06SGerrit Uitslag * Chunk size zero let read whole file at once 3958eccf945SGerrit Uitslag * 3968eccf945SGerrit Uitslag * @param int $chunk_size maximum block size read from file 3978eccf945SGerrit Uitslag */ 3988eccf945SGerrit Uitslag public function setChunkSize($chunk_size) { 3998eccf945SGerrit Uitslag if(!is_numeric($chunk_size)) $chunk_size = 0; 4008eccf945SGerrit Uitslag 4018eccf945SGerrit Uitslag $this->chunk_size = (int) max($chunk_size, 0); 4028eccf945SGerrit Uitslag } 4038eccf945SGerrit Uitslag 4048eccf945SGerrit Uitslag /** 405047bad06SGerrit Uitslag * Returns path to changelog 406047bad06SGerrit Uitslag * 407047bad06SGerrit Uitslag * @return string path to file 408047bad06SGerrit Uitslag */ 409047bad06SGerrit Uitslag abstract protected function getChangelogFilename(); 410047bad06SGerrit Uitslag 411047bad06SGerrit Uitslag /** 412047bad06SGerrit Uitslag * Returns path to current page/media 413047bad06SGerrit Uitslag * 414047bad06SGerrit Uitslag * @return string path to file 415047bad06SGerrit Uitslag */ 416047bad06SGerrit Uitslag abstract protected function getFilename(); 417047bad06SGerrit Uitslag 418047bad06SGerrit Uitslag /** 4198eccf945SGerrit Uitslag * Get the changelog information for a specific page id and revision (timestamp) 4208eccf945SGerrit Uitslag * 4218eccf945SGerrit Uitslag * Adjacent changelog lines are optimistically parsed and cached to speed up 4228eccf945SGerrit Uitslag * consecutive calls to getRevisionInfo. For large changelog files, only the chunk 4238eccf945SGerrit Uitslag * containing the requested changelog line is read. 4248eccf945SGerrit Uitslag * 4258eccf945SGerrit Uitslag * @param int $rev revision timestamp 4268eccf945SGerrit Uitslag * @return bool|array false or array with entries: 4278eccf945SGerrit Uitslag * - date: unix timestamp 4288eccf945SGerrit Uitslag * - ip: IPv4 address (127.0.0.1) 4298eccf945SGerrit Uitslag * - type: log line type 4308eccf945SGerrit Uitslag * - id: page id 4318eccf945SGerrit Uitslag * - user: user name 4328eccf945SGerrit Uitslag * - sum: edit summary (or action reason) 4338eccf945SGerrit Uitslag * - extra: extra data (varies by line type) 4347d559c7fSBen Coburn * 4357d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net> 43629778747SKate Arzamastseva * @author Kate Arzamastseva <pshns@ukr.net> 4377d559c7fSBen Coburn */ 438047bad06SGerrit Uitslag public function getRevisionInfo($rev) { 4397d559c7fSBen Coburn $rev = max($rev, 0); 4407d559c7fSBen Coburn 4417d559c7fSBen Coburn // check if it's already in the memory cache 4428eccf945SGerrit Uitslag if(isset($this->cache[$this->id]) && isset($this->cache[$this->id][$rev])) { 4438eccf945SGerrit Uitslag return $this->cache[$this->id][$rev]; 444e4f389efSKate Arzamastseva } 4457d559c7fSBen Coburn 446040f0e13SKlap-in //read lines from changelog 447047bad06SGerrit Uitslag list($fp, $lines) = $this->readloglines($rev); 448040f0e13SKlap-in if($fp) { 4497d559c7fSBen Coburn fclose($fp); 4507d559c7fSBen Coburn } 451040f0e13SKlap-in if(empty($lines)) return false; 4527d559c7fSBen Coburn 4537d559c7fSBen Coburn // parse and cache changelog lines 4547d559c7fSBen Coburn foreach($lines as $value) { 4557d559c7fSBen Coburn $tmp = parseChangelogLine($value); 4567d559c7fSBen Coburn if($tmp !== false) { 4578eccf945SGerrit Uitslag $this->cache[$this->id][$tmp['date']] = $tmp; 4587d559c7fSBen Coburn } 4597d559c7fSBen Coburn } 4608eccf945SGerrit Uitslag if(!isset($this->cache[$this->id][$rev])) { 4618eccf945SGerrit Uitslag return false; 4628eccf945SGerrit Uitslag } 4638eccf945SGerrit Uitslag return $this->cache[$this->id][$rev]; 4647d559c7fSBen Coburn } 4657d559c7fSBen Coburn 4667d559c7fSBen Coburn /** 4677d559c7fSBen Coburn * Return a list of page revisions numbers 4688eccf945SGerrit Uitslag * 4697d559c7fSBen Coburn * Does not guarantee that the revision exists in the attic, 4707d559c7fSBen Coburn * only that a line with the date exists in the changelog. 4717d559c7fSBen Coburn * By default the current revision is skipped. 4727d559c7fSBen Coburn * 4737d559c7fSBen Coburn * The current revision is automatically skipped when the page exists. 4747d559c7fSBen Coburn * See $INFO['meta']['last_change'] for the current revision. 4758eccf945SGerrit Uitslag * A negative $first let read the current revision too. 4767d559c7fSBen Coburn * 4777d559c7fSBen Coburn * For efficiency, the log lines are parsed and cached for later 4787d559c7fSBen Coburn * calls to getRevisionInfo. Large changelog files are read 479c66972f2SAdrian Lang * backwards in chunks until the requested number of changelog 4807d559c7fSBen Coburn * lines are recieved. 4817d559c7fSBen Coburn * 4828eccf945SGerrit Uitslag * @param int $first skip the first n changelog lines 4838eccf945SGerrit Uitslag * @param int $num number of revisions to return 4848eccf945SGerrit Uitslag * @return array with the revision timestamps 4858eccf945SGerrit Uitslag * 4867d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net> 48729778747SKate Arzamastseva * @author Kate Arzamastseva <pshns@ukr.net> 4887d559c7fSBen Coburn */ 489047bad06SGerrit Uitslag public function getRevisions($first, $num) { 4907d559c7fSBen Coburn $revs = array(); 4917d559c7fSBen Coburn $lines = array(); 4927d559c7fSBen Coburn $count = 0; 493047bad06SGerrit Uitslag 4947d559c7fSBen Coburn $num = max($num, 0); 4957d1e323eSGerrit Uitslag if($num == 0) { 4967d1e323eSGerrit Uitslag return $revs; 4977d1e323eSGerrit Uitslag } 498092b7683SKlap-in 499b824abd4SAndreas Gohr if($first < 0) { 500b824abd4SAndreas Gohr $first = 0; 501047bad06SGerrit Uitslag } else if(@file_exists($this->getFilename())) { 5027d559c7fSBen Coburn // skip current revision if the page exists 5037d559c7fSBen Coburn $first = max($first + 1, 0); 5047d559c7fSBen Coburn } 5057d559c7fSBen Coburn 506047bad06SGerrit Uitslag $file = $this->getChangelogFilename(); 507047bad06SGerrit Uitslag 5087d1e323eSGerrit Uitslag if(!@file_exists($file)) { 5097d1e323eSGerrit Uitslag return $revs; 5107d1e323eSGerrit Uitslag } 5118eccf945SGerrit Uitslag if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) { 5127d559c7fSBen Coburn // read whole file 5137d559c7fSBen Coburn $lines = file($file); 5147d1e323eSGerrit Uitslag if($lines === false) { 5157d1e323eSGerrit Uitslag return $revs; 5167d1e323eSGerrit Uitslag } 5177d559c7fSBen Coburn } else { 5187d559c7fSBen Coburn // read chunks backwards 5197d559c7fSBen Coburn $fp = fopen($file, 'rb'); // "file pointer" 5207d1e323eSGerrit Uitslag if($fp === false) { 5217d1e323eSGerrit Uitslag return $revs; 5227d1e323eSGerrit Uitslag } 5237d559c7fSBen Coburn fseek($fp, 0, SEEK_END); 5247d559c7fSBen Coburn $tail = ftell($fp); 5257d559c7fSBen Coburn 5267d559c7fSBen Coburn // chunk backwards 5278eccf945SGerrit Uitslag $finger = max($tail - $this->chunk_size, 0); 5287d559c7fSBen Coburn while($count < $num + $first) { 5297d1e323eSGerrit Uitslag $nl = $this->getNewlinepointer($fp, $finger); 530b824abd4SAndreas Gohr 531b824abd4SAndreas Gohr // was the chunk big enough? if not, take another bite 532b824abd4SAndreas Gohr if($nl > 0 && $tail <= $nl) { 5338eccf945SGerrit Uitslag $finger = max($finger - $this->chunk_size, 0); 534b824abd4SAndreas Gohr continue; 535b824abd4SAndreas Gohr } else { 536b824abd4SAndreas Gohr $finger = $nl; 5377d559c7fSBen Coburn } 5387d559c7fSBen Coburn 5397d559c7fSBen Coburn // read chunk 5407d559c7fSBen Coburn $chunk = ''; 5417d559c7fSBen Coburn $read_size = max($tail - $finger, 0); // found chunk size 5427d559c7fSBen Coburn $got = 0; 5437d559c7fSBen Coburn while($got < $read_size && !feof($fp)) { 54480e97297SGerrit Uitslag $tmp = @fread($fp, max(min($this->chunk_size, $read_size - $got), 0)); 5457d1e323eSGerrit Uitslag if($tmp === false) { 5467d1e323eSGerrit Uitslag break; 5477d1e323eSGerrit Uitslag } //error state 5487d559c7fSBen Coburn $got += strlen($tmp); 5497d559c7fSBen Coburn $chunk .= $tmp; 5507d559c7fSBen Coburn } 5517d559c7fSBen Coburn $tmp = explode("\n", $chunk); 5527d559c7fSBen Coburn array_pop($tmp); // remove trailing newline 5537d559c7fSBen Coburn 5547d559c7fSBen Coburn // combine with previous chunk 5557d559c7fSBen Coburn $count += count($tmp); 5567d559c7fSBen Coburn $lines = array_merge($tmp, $lines); 5577d559c7fSBen Coburn 5587d559c7fSBen Coburn // next chunk 5597d1e323eSGerrit Uitslag if($finger == 0) { 5607d1e323eSGerrit Uitslag break; 5617d1e323eSGerrit Uitslag } // already read all the lines 5627d559c7fSBen Coburn else { 5637d559c7fSBen Coburn $tail = $finger; 5648eccf945SGerrit Uitslag $finger = max($tail - $this->chunk_size, 0); 5657d559c7fSBen Coburn } 5667d559c7fSBen Coburn } 5677d559c7fSBen Coburn fclose($fp); 5687d559c7fSBen Coburn } 5697d559c7fSBen Coburn 5707d559c7fSBen Coburn // skip parsing extra lines 5717d559c7fSBen Coburn $num = max(min(count($lines) - $first, $num), 0); 5727d559c7fSBen Coburn if ($first > 0 && $num > 0) { $lines = array_slice($lines, max(count($lines) - $first - $num, 0), $num); } 5737d559c7fSBen Coburn else if($first > 0 && $num == 0) { $lines = array_slice($lines, 0, max(count($lines) - $first, 0)); } 5747d559c7fSBen Coburn else if($first == 0 && $num > 0) { $lines = array_slice($lines, max(count($lines) - $num, 0)); } 5757d559c7fSBen Coburn 5767d559c7fSBen Coburn // handle lines in reverse order 5777d559c7fSBen Coburn for($i = count($lines) - 1; $i >= 0; $i--) { 5787d559c7fSBen Coburn $tmp = parseChangelogLine($lines[$i]); 5797d559c7fSBen Coburn if($tmp !== false) { 5808eccf945SGerrit Uitslag $this->cache[$this->id][$tmp['date']] = $tmp; 5817d559c7fSBen Coburn $revs[] = $tmp['date']; 5827d559c7fSBen Coburn } 5837d559c7fSBen Coburn } 5847d559c7fSBen Coburn 5857d559c7fSBen Coburn return $revs; 5867d559c7fSBen Coburn } 5877d559c7fSBen Coburn 588f9528c0cSKlap-in /** 5898eccf945SGerrit Uitslag * Get the nth revision left or right handside for a specific page id and revision (timestamp) 5908eccf945SGerrit Uitslag * 5918eccf945SGerrit Uitslag * For large changelog files, only the chunk containing the 592f9528c0cSKlap-in * reference revision $rev is read and sometimes a next chunck. 593f9528c0cSKlap-in * 594f9528c0cSKlap-in * Adjacent changelog lines are optimistically parsed and cached to speed up 595f9528c0cSKlap-in * consecutive calls to getRevisionInfo. 596f9528c0cSKlap-in * 597f9528c0cSKlap-in * @param int $rev revision timestamp used as startdate (doesn't need to be revisionnumber) 598f9528c0cSKlap-in * @param int $direction give position of returned revision with respect to $rev; positive=next, negative=prev 5998eccf945SGerrit Uitslag * @return bool|int 6008eccf945SGerrit Uitslag * timestamp of the requested revision 6018eccf945SGerrit Uitslag * otherwise false 602f9528c0cSKlap-in */ 603047bad06SGerrit Uitslag public function getRelativeRevision($rev, $direction) { 604f9528c0cSKlap-in $rev = max($rev, 0); 605040f0e13SKlap-in $direction = (int) $direction; 6067d559c7fSBen Coburn 607f9528c0cSKlap-in //no direction given or last rev, so no follow-up 608ee33e0c5SGerrit Uitslag if(!$direction || ($direction > 0 && $this->isCurrentRevision($rev))) { 609f9528c0cSKlap-in return false; 610f9528c0cSKlap-in } 611f9528c0cSKlap-in 612040f0e13SKlap-in //get lines from changelog 613047bad06SGerrit Uitslag list($fp, $lines, $head, $tail, $eof) = $this->readloglines($rev); 614040f0e13SKlap-in if(empty($lines)) return false; 615040f0e13SKlap-in 616040f0e13SKlap-in // look for revisions later/earlier then $rev, when founded count till the wanted revision is reached 617040f0e13SKlap-in // also parse and cache changelog lines for getRevisionInfo(). 618040f0e13SKlap-in $revcounter = 0; 619040f0e13SKlap-in $relativerev = false; 620040f0e13SKlap-in $checkotherchunck = true; //always runs once 621040f0e13SKlap-in while(!$relativerev && $checkotherchunck) { 622040f0e13SKlap-in $tmp = array(); 623040f0e13SKlap-in //parse in normal or reverse order 624040f0e13SKlap-in $count = count($lines); 625040f0e13SKlap-in if($direction > 0) { 626040f0e13SKlap-in $start = 0; 627040f0e13SKlap-in $step = 1; 628040f0e13SKlap-in } else { 629040f0e13SKlap-in $start = $count - 1; 630040f0e13SKlap-in $step = -1; 631040f0e13SKlap-in } 632040f0e13SKlap-in for($i = $start; $i >= 0 && $i < $count; $i = $i + $step) { 633040f0e13SKlap-in $tmp = parseChangelogLine($lines[$i]); 634040f0e13SKlap-in if($tmp !== false) { 6358eccf945SGerrit Uitslag $this->cache[$this->id][$tmp['date']] = $tmp; 636040f0e13SKlap-in //look for revs older/earlier then reference $rev and select $direction-th one 637040f0e13SKlap-in if(($direction > 0 && $tmp['date'] > $rev) || ($direction < 0 && $tmp['date'] < $rev)) { 638040f0e13SKlap-in $revcounter++; 639040f0e13SKlap-in if($revcounter == abs($direction)) { 640040f0e13SKlap-in $relativerev = $tmp['date']; 641040f0e13SKlap-in } 642040f0e13SKlap-in } 643040f0e13SKlap-in } 644040f0e13SKlap-in } 645040f0e13SKlap-in 646040f0e13SKlap-in //true when $rev is found, but not the wanted follow-up. 647040f0e13SKlap-in $checkotherchunck = $fp 648040f0e13SKlap-in && ($tmp['date'] == $rev || ($revcounter > 0 && !$relativerev)) 649040f0e13SKlap-in && !(($tail == $eof && $direction > 0) || ($head == 0 && $direction < 0)); 650040f0e13SKlap-in 651040f0e13SKlap-in if($checkotherchunck) { 6521da8dc97SGerrit Uitslag list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, $direction); 653040f0e13SKlap-in 654040f0e13SKlap-in if(empty($lines)) break; 655040f0e13SKlap-in } 656040f0e13SKlap-in } 657040f0e13SKlap-in if($fp) { 658040f0e13SKlap-in fclose($fp); 659040f0e13SKlap-in } 660040f0e13SKlap-in 661040f0e13SKlap-in return $relativerev; 662040f0e13SKlap-in } 663040f0e13SKlap-in 664040f0e13SKlap-in /** 6651da8dc97SGerrit Uitslag * Returns revisions around rev1 and rev2 6661da8dc97SGerrit Uitslag * When available it returns $max entries for each revision 6671da8dc97SGerrit Uitslag * 6681da8dc97SGerrit Uitslag * @param int $rev1 oldest revision timestamp 669621bbd2aSGerrit Uitslag * @param int $rev2 newest revision timestamp (0 looks up last revision) 6701da8dc97SGerrit Uitslag * @param int $max maximum number of revisions returned 6711da8dc97SGerrit Uitslag * @return array with two arrays with revisions surrounding rev1 respectively rev2 6721da8dc97SGerrit Uitslag */ 6731da8dc97SGerrit Uitslag public function getRevisionsAround($rev1, $rev2, $max = 50) { 6741da8dc97SGerrit Uitslag $max = floor(abs($max) / 2)*2 + 1; 6751da8dc97SGerrit Uitslag $rev1 = max($rev1, 0); 6761da8dc97SGerrit Uitslag $rev2 = max($rev2, 0); 6771da8dc97SGerrit Uitslag 678621bbd2aSGerrit Uitslag if($rev2) { 6791da8dc97SGerrit Uitslag if($rev2 < $rev1) { 6801da8dc97SGerrit Uitslag $rev = $rev2; 6811da8dc97SGerrit Uitslag $rev2 = $rev1; 6821da8dc97SGerrit Uitslag $rev1 = $rev; 6831da8dc97SGerrit Uitslag } 684621bbd2aSGerrit Uitslag } else { 685621bbd2aSGerrit Uitslag //empty right side means a removed page. Look up last revision. 686621bbd2aSGerrit Uitslag $revs = $this->getRevisions(-1, 1); 687621bbd2aSGerrit Uitslag $rev2 = $revs[0]; 688621bbd2aSGerrit Uitslag } 6891da8dc97SGerrit Uitslag //collect revisions around rev2 6901da8dc97SGerrit Uitslag list($revs2, $allrevs, $fp, $lines, $head, $tail) = $this->retrieveRevisionsAround($rev2, $max); 6911da8dc97SGerrit Uitslag 6921da8dc97SGerrit Uitslag if(empty($revs2)) return array(array(), array()); 6931da8dc97SGerrit Uitslag 6941da8dc97SGerrit Uitslag //collect revisions around rev1 6951da8dc97SGerrit Uitslag $index = array_search($rev1, $allrevs); 6961da8dc97SGerrit Uitslag if($index === false) { 6971da8dc97SGerrit Uitslag //no overlapping revisions 6981da8dc97SGerrit Uitslag list($revs1,,,,,) = $this->retrieveRevisionsAround($rev1, $max); 6991da8dc97SGerrit Uitslag if(empty($revs1)) $revs1 = array(); 7001da8dc97SGerrit Uitslag } else { 7011da8dc97SGerrit Uitslag //revisions overlaps, reuse revisions around rev2 7021da8dc97SGerrit Uitslag $revs1 = $allrevs; 7031da8dc97SGerrit Uitslag while($head > 0) { 7041da8dc97SGerrit Uitslag for($i = count($lines) - 1; $i >= 0; $i--) { 7051da8dc97SGerrit Uitslag $tmp = parseChangelogLine($lines[$i]); 7061da8dc97SGerrit Uitslag if($tmp !== false) { 7071da8dc97SGerrit Uitslag $this->cache[$this->id][$tmp['date']] = $tmp; 7081da8dc97SGerrit Uitslag $revs1[] = $tmp['date']; 7091da8dc97SGerrit Uitslag $index++; 7101da8dc97SGerrit Uitslag 7111da8dc97SGerrit Uitslag if($index > floor($max / 2)) break 2; 7121da8dc97SGerrit Uitslag } 7131da8dc97SGerrit Uitslag } 7141da8dc97SGerrit Uitslag 7151da8dc97SGerrit Uitslag list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1); 7161da8dc97SGerrit Uitslag } 7171da8dc97SGerrit Uitslag sort($revs1); 7181da8dc97SGerrit Uitslag //return wanted selection 7191da8dc97SGerrit Uitslag $revs1 = array_slice($revs1, max($index - floor($max/2), 0), $max); 7201da8dc97SGerrit Uitslag } 7211da8dc97SGerrit Uitslag 7222e608c52SGerrit Uitslag return array(array_reverse($revs1), array_reverse($revs2)); 7231da8dc97SGerrit Uitslag } 7241da8dc97SGerrit Uitslag 7251da8dc97SGerrit Uitslag /** 7268eccf945SGerrit Uitslag * Returns lines from changelog. 727040f0e13SKlap-in * If file larger than $chuncksize, only chunck is read that could contain $rev. 728040f0e13SKlap-in * 729040f0e13SKlap-in * @param int $rev revision timestamp 730040f0e13SKlap-in * @return array(fp, array(changeloglines), $head, $tail, $eof)|bool 731040f0e13SKlap-in * returns false when not succeed. fp only defined for chuck reading, needs closing. 732040f0e13SKlap-in */ 733047bad06SGerrit Uitslag protected function readloglines($rev) { 734047bad06SGerrit Uitslag $file = $this->getChangelogFilename(); 7358eccf945SGerrit Uitslag 736f9528c0cSKlap-in if(!@file_exists($file)) { 737f9528c0cSKlap-in return false; 738f9528c0cSKlap-in } 739f9528c0cSKlap-in 740f9528c0cSKlap-in $fp = null; 741f9528c0cSKlap-in $head = 0; 742040f0e13SKlap-in $tail = 0; 743f9528c0cSKlap-in $eof = 0; 7448eccf945SGerrit Uitslag 7458eccf945SGerrit Uitslag if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) { 746f9528c0cSKlap-in // read whole file 747f9528c0cSKlap-in $lines = file($file); 748f9528c0cSKlap-in if($lines === false) { 749f9528c0cSKlap-in return false; 750f9528c0cSKlap-in } 751f9528c0cSKlap-in } else { 752f9528c0cSKlap-in // read by chunk 753f9528c0cSKlap-in $fp = fopen($file, 'rb'); // "file pointer" 754f9528c0cSKlap-in if($fp === false) { 755f9528c0cSKlap-in return false; 756040f0e13SKlap-in } 757f9528c0cSKlap-in $head = 0; 758040f0e13SKlap-in fseek($fp, 0, SEEK_END); 759040f0e13SKlap-in $eof = ftell($fp); 760040f0e13SKlap-in $tail = $eof; 761f9528c0cSKlap-in 762f9528c0cSKlap-in // find chunk 7638eccf945SGerrit Uitslag while($tail - $head > $this->chunk_size) { 764f9528c0cSKlap-in $finger = $head + floor(($tail - $head) / 2.0); 7658eccf945SGerrit Uitslag $finger = $this->getNewlinepointer($fp, $finger); 766040f0e13SKlap-in $tmp = fgets($fp); 767f9528c0cSKlap-in if($finger == $head || $finger == $tail) { 768f9528c0cSKlap-in break; 769f9528c0cSKlap-in } 77059cce2d9SGerrit Uitslag $tmp = parseChangelogLine($tmp); 77159cce2d9SGerrit Uitslag $finger_rev = $tmp['date']; 77259cce2d9SGerrit Uitslag 773f9528c0cSKlap-in if($finger_rev > $rev) { 774f9528c0cSKlap-in $tail = $finger; 775f9528c0cSKlap-in } else { 776f9528c0cSKlap-in $head = $finger; 777f9528c0cSKlap-in } 778f9528c0cSKlap-in } 779f9528c0cSKlap-in 780f9528c0cSKlap-in if($tail - $head < 1) { 781f9528c0cSKlap-in // cound not find chunk, assume requested rev is missing 782f9528c0cSKlap-in fclose($fp); 783f9528c0cSKlap-in return false; 784f9528c0cSKlap-in } 785f9528c0cSKlap-in 7868eccf945SGerrit Uitslag $lines = $this->readChunk($fp, $head, $tail); 787f9528c0cSKlap-in } 788040f0e13SKlap-in return array( 789040f0e13SKlap-in $fp, 790040f0e13SKlap-in $lines, 791040f0e13SKlap-in $head, 792040f0e13SKlap-in $tail, 793040f0e13SKlap-in $eof 794040f0e13SKlap-in ); 795f9528c0cSKlap-in } 796f9528c0cSKlap-in 797f9528c0cSKlap-in /** 798f9528c0cSKlap-in * Read chunk and return array with lines of given chunck. 799f9528c0cSKlap-in * Has no check if $head and $tail are really at a new line 800f9528c0cSKlap-in * 8014f1e2cb3SGerrit Uitslag * @param resource $fp resource filepointer 8024f1e2cb3SGerrit Uitslag * @param int $head start point chunck 8034f1e2cb3SGerrit Uitslag * @param int $tail end point chunck 804f9528c0cSKlap-in * @return array lines read from chunck 805f9528c0cSKlap-in */ 8068eccf945SGerrit Uitslag protected function readChunk($fp, $head, $tail) { 807f9528c0cSKlap-in $chunk = ''; 808f9528c0cSKlap-in $chunk_size = max($tail - $head, 0); // found chunk size 809f9528c0cSKlap-in $got = 0; 810f9528c0cSKlap-in fseek($fp, $head); 811f9528c0cSKlap-in while($got < $chunk_size && !feof($fp)) { 81259cce2d9SGerrit Uitslag $tmp = @fread($fp, max(min($this->chunk_size, $chunk_size - $got), 0)); 813040f0e13SKlap-in if($tmp === false) { //error state 814f9528c0cSKlap-in break; 815040f0e13SKlap-in } 816f9528c0cSKlap-in $got += strlen($tmp); 817f9528c0cSKlap-in $chunk .= $tmp; 818f9528c0cSKlap-in } 819f9528c0cSKlap-in $lines = explode("\n", $chunk); 820f9528c0cSKlap-in array_pop($lines); // remove trailing newline 821f9528c0cSKlap-in return $lines; 822f9528c0cSKlap-in } 823f9528c0cSKlap-in 824f9528c0cSKlap-in /** 825f9528c0cSKlap-in * Set pointer to first new line after $finger and return its position 826f9528c0cSKlap-in * 8271da8dc97SGerrit Uitslag * @param resource $fp filepointer 8284f1e2cb3SGerrit Uitslag * @param int $finger a pointer 829f9528c0cSKlap-in * @return int pointer 830f9528c0cSKlap-in */ 8318eccf945SGerrit Uitslag protected function getNewlinepointer($fp, $finger) { 832f9528c0cSKlap-in fseek($fp, $finger); 83359cce2d9SGerrit Uitslag $nl = $finger; 83459cce2d9SGerrit Uitslag if($finger > 0) { 835f9528c0cSKlap-in fgets($fp); // slip the finger forward to a new line 83659cce2d9SGerrit Uitslag $nl = ftell($fp); 83759cce2d9SGerrit Uitslag } 83859cce2d9SGerrit Uitslag return $nl; 839f9528c0cSKlap-in } 8408eccf945SGerrit Uitslag 8418eccf945SGerrit Uitslag /** 8428eccf945SGerrit Uitslag * Check whether given revision is the current page 8438eccf945SGerrit Uitslag * 8448eccf945SGerrit Uitslag * @param int $rev timestamp of current page 8458eccf945SGerrit Uitslag * @return bool true if $rev is current revision, otherwise false 8468eccf945SGerrit Uitslag */ 847ee33e0c5SGerrit Uitslag public function isCurrentRevision($rev) { 848047bad06SGerrit Uitslag return $rev == @filemtime($this->getFilename()); 8498eccf945SGerrit Uitslag } 85078b874e6Slisps 85178b874e6Slisps /** 85278b874e6Slisps * Return an existing revision for a specific date which is 85378b874e6Slisps * the current one or younger or equal then the date 85478b874e6Slisps * 85578b874e6Slisps * @param string $id 85678b874e6Slisps * @param number $date_at timestamp 85778b874e6Slisps * @return string revision ('' for current) 85878b874e6Slisps */ 85978b874e6Slisps function getLastRevisionAt($date_at){ 86078b874e6Slisps //requested date_at(timestamp) younger or equal then modified_time($this->id) => load current 86178b874e6Slisps if($date_at >= @filemtime($this->getFilename())) { 86278b874e6Slisps return ''; 86378b874e6Slisps } else if ($rev = $this->getRelativeRevision($date_at+1, -1)) { //+1 to get also the requested date revision 86478b874e6Slisps return $rev; 86578b874e6Slisps } else { 86678b874e6Slisps return false; 86778b874e6Slisps } 86878b874e6Slisps } 869f2643d9fSlisps 870f2643d9fSlisps /** 8711da8dc97SGerrit Uitslag * Returns the next lines of the changelog of the chunck before head or after tail 8721da8dc97SGerrit Uitslag * 8731da8dc97SGerrit Uitslag * @param resource $fp filepointer 8741da8dc97SGerrit Uitslag * @param int $head position head of last chunk 8751da8dc97SGerrit Uitslag * @param int $tail position tail of last chunk 8761da8dc97SGerrit Uitslag * @param int $direction positive forward, negative backward 8771da8dc97SGerrit Uitslag * @return array with entries: 8781da8dc97SGerrit Uitslag * - $lines: changelog lines of readed chunk 8791da8dc97SGerrit Uitslag * - $head: head of chunk 8801da8dc97SGerrit Uitslag * - $tail: tail of chunk 8811da8dc97SGerrit Uitslag */ 8821da8dc97SGerrit Uitslag protected function readAdjacentChunk($fp, $head, $tail, $direction) { 8831da8dc97SGerrit Uitslag if(!$fp) return array(array(), $head, $tail); 8841da8dc97SGerrit Uitslag 8851da8dc97SGerrit Uitslag if($direction > 0) { 8861da8dc97SGerrit Uitslag //read forward 8871da8dc97SGerrit Uitslag $head = $tail; 8881da8dc97SGerrit Uitslag $tail = $head + floor($this->chunk_size * (2 / 3)); 8891da8dc97SGerrit Uitslag $tail = $this->getNewlinepointer($fp, $tail); 8901da8dc97SGerrit Uitslag } else { 8911da8dc97SGerrit Uitslag //read backward 8921da8dc97SGerrit Uitslag $tail = $head; 8931da8dc97SGerrit Uitslag $head = max($tail - $this->chunk_size, 0); 8941da8dc97SGerrit Uitslag while(true) { 8951da8dc97SGerrit Uitslag $nl = $this->getNewlinepointer($fp, $head); 8961da8dc97SGerrit Uitslag // was the chunk big enough? if not, take another bite 8971da8dc97SGerrit Uitslag if($nl > 0 && $tail <= $nl) { 8981da8dc97SGerrit Uitslag $head = max($head - $this->chunk_size, 0); 8991da8dc97SGerrit Uitslag } else { 9001da8dc97SGerrit Uitslag $head = $nl; 9011da8dc97SGerrit Uitslag break; 9021da8dc97SGerrit Uitslag } 9031da8dc97SGerrit Uitslag } 9048eccf945SGerrit Uitslag } 9058eccf945SGerrit Uitslag 9061da8dc97SGerrit Uitslag //load next chunck 9071da8dc97SGerrit Uitslag $lines = $this->readChunk($fp, $head, $tail); 9081da8dc97SGerrit Uitslag return array($lines, $head, $tail); 9091da8dc97SGerrit Uitslag } 9101da8dc97SGerrit Uitslag 9111da8dc97SGerrit Uitslag /** 9121da8dc97SGerrit Uitslag * Collect the $max revisions near to the timestamp $rev 9131da8dc97SGerrit Uitslag * 9141da8dc97SGerrit Uitslag * @param int $rev revision timestamp 9151da8dc97SGerrit Uitslag * @param int $max maximum number of revisions to be returned 9161da8dc97SGerrit Uitslag * @return bool|array 9171da8dc97SGerrit Uitslag * return array with entries: 9181da8dc97SGerrit Uitslag * - $requestedrevs: array of with $max revision timestamps 9191da8dc97SGerrit Uitslag * - $revs: all parsed revision timestamps 9201da8dc97SGerrit Uitslag * - $fp: filepointer only defined for chuck reading, needs closing. 9211da8dc97SGerrit Uitslag * - $lines: non-parsed changelog lines before the parsed revisions 9221da8dc97SGerrit Uitslag * - $head: position of first readed changelogline 9231da8dc97SGerrit Uitslag * - $lasttail: position of end of last readed changelogline 9241da8dc97SGerrit Uitslag * otherwise false 9251da8dc97SGerrit Uitslag */ 9261da8dc97SGerrit Uitslag protected function retrieveRevisionsAround($rev, $max) { 9271da8dc97SGerrit Uitslag //get lines from changelog 9284f1e2cb3SGerrit Uitslag list($fp, $lines, $starthead, $starttail, /* $eof */) = $this->readloglines($rev); 9291da8dc97SGerrit Uitslag if(empty($lines)) return false; 9301da8dc97SGerrit Uitslag 9311da8dc97SGerrit Uitslag //parse chunk containing $rev, and read forward more chunks until $max/2 is reached 9321da8dc97SGerrit Uitslag $head = $starthead; 9331da8dc97SGerrit Uitslag $tail = $starttail; 9341da8dc97SGerrit Uitslag $revs = array(); 9351da8dc97SGerrit Uitslag $aftercount = $beforecount = 0; 9361da8dc97SGerrit Uitslag while(count($lines) > 0) { 9371da8dc97SGerrit Uitslag foreach($lines as $line) { 9381da8dc97SGerrit Uitslag $tmp = parseChangelogLine($line); 9391da8dc97SGerrit Uitslag if($tmp !== false) { 9401da8dc97SGerrit Uitslag $this->cache[$this->id][$tmp['date']] = $tmp; 9411da8dc97SGerrit Uitslag $revs[] = $tmp['date']; 9421da8dc97SGerrit Uitslag if($tmp['date'] >= $rev) { 9431da8dc97SGerrit Uitslag //count revs after reference $rev 9441da8dc97SGerrit Uitslag $aftercount++; 9451da8dc97SGerrit Uitslag if($aftercount == 1) $beforecount = count($revs); 9461da8dc97SGerrit Uitslag } 9471da8dc97SGerrit Uitslag //enough revs after reference $rev? 9481da8dc97SGerrit Uitslag if($aftercount > floor($max / 2)) break 2; 9491da8dc97SGerrit Uitslag } 9501da8dc97SGerrit Uitslag } 9511da8dc97SGerrit Uitslag //retrieve next chunk 9521da8dc97SGerrit Uitslag list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, 1); 9531da8dc97SGerrit Uitslag } 9541da8dc97SGerrit Uitslag if($aftercount == 0) return false; 9551da8dc97SGerrit Uitslag 9561da8dc97SGerrit Uitslag $lasttail = $tail; 9571da8dc97SGerrit Uitslag 9581da8dc97SGerrit Uitslag //read additional chuncks backward until $max/2 is reached and total number of revs is equal to $max 9591da8dc97SGerrit Uitslag $lines = array(); 9601da8dc97SGerrit Uitslag $i = 0; 9611da8dc97SGerrit Uitslag if($aftercount > 0) { 9621da8dc97SGerrit Uitslag $head = $starthead; 9631da8dc97SGerrit Uitslag $tail = $starttail; 9641da8dc97SGerrit Uitslag while($head > 0) { 9651da8dc97SGerrit Uitslag list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1); 9661da8dc97SGerrit Uitslag 9671da8dc97SGerrit Uitslag for($i = count($lines) - 1; $i >= 0; $i--) { 9681da8dc97SGerrit Uitslag $tmp = parseChangelogLine($lines[$i]); 9691da8dc97SGerrit Uitslag if($tmp !== false) { 9701da8dc97SGerrit Uitslag $this->cache[$this->id][$tmp['date']] = $tmp; 9711da8dc97SGerrit Uitslag $revs[] = $tmp['date']; 9721da8dc97SGerrit Uitslag $beforecount++; 9731da8dc97SGerrit Uitslag //enough revs before reference $rev? 9741da8dc97SGerrit Uitslag if($beforecount > max(floor($max / 2), $max - $aftercount)) break 2; 9751da8dc97SGerrit Uitslag } 9761da8dc97SGerrit Uitslag } 9771da8dc97SGerrit Uitslag } 9781da8dc97SGerrit Uitslag } 9791da8dc97SGerrit Uitslag sort($revs); 9801da8dc97SGerrit Uitslag 9811da8dc97SGerrit Uitslag //keep only non-parsed lines 9821da8dc97SGerrit Uitslag $lines = array_slice($lines, 0, $i); 9831da8dc97SGerrit Uitslag //trunk desired selection 9841da8dc97SGerrit Uitslag $requestedrevs = array_slice($revs, -$max, $max); 9851da8dc97SGerrit Uitslag 9861da8dc97SGerrit Uitslag return array($requestedrevs, $revs, $fp, $lines, $head, $lasttail); 9871da8dc97SGerrit Uitslag } 9881da8dc97SGerrit Uitslag} 9891da8dc97SGerrit Uitslag 9901da8dc97SGerrit Uitslag/** 9911da8dc97SGerrit Uitslag * Class PageChangelog handles changelog of a wiki page 9921da8dc97SGerrit Uitslag */ 993047bad06SGerrit Uitslagclass PageChangelog extends ChangeLog { 994047bad06SGerrit Uitslag 995047bad06SGerrit Uitslag /** 996047bad06SGerrit Uitslag * Returns path to changelog 997047bad06SGerrit Uitslag * 998047bad06SGerrit Uitslag * @return string path to file 999047bad06SGerrit Uitslag */ 1000047bad06SGerrit Uitslag protected function getChangelogFilename() { 1001047bad06SGerrit Uitslag return metaFN($this->id, '.changes'); 1002047bad06SGerrit Uitslag } 1003047bad06SGerrit Uitslag 1004047bad06SGerrit Uitslag /** 1005047bad06SGerrit Uitslag * Returns path to current page/media 1006047bad06SGerrit Uitslag * 1007047bad06SGerrit Uitslag * @return string path to file 1008047bad06SGerrit Uitslag */ 1009047bad06SGerrit Uitslag protected function getFilename() { 1010047bad06SGerrit Uitslag return wikiFN($this->id); 1011047bad06SGerrit Uitslag } 1012047bad06SGerrit Uitslag} 1013047bad06SGerrit Uitslag 10141da8dc97SGerrit Uitslag/** 10151da8dc97SGerrit Uitslag * Class MediaChangelog handles changelog of a media file 10161da8dc97SGerrit Uitslag */ 1017047bad06SGerrit Uitslagclass MediaChangelog extends ChangeLog { 1018047bad06SGerrit Uitslag 1019047bad06SGerrit Uitslag /** 1020047bad06SGerrit Uitslag * Returns path to changelog 1021047bad06SGerrit Uitslag * 1022047bad06SGerrit Uitslag * @return string path to file 1023047bad06SGerrit Uitslag */ 1024047bad06SGerrit Uitslag protected function getChangelogFilename() { 1025047bad06SGerrit Uitslag return mediaMetaFN($this->id, '.changes'); 1026047bad06SGerrit Uitslag } 1027047bad06SGerrit Uitslag 1028047bad06SGerrit Uitslag /** 1029047bad06SGerrit Uitslag * Returns path to current page/media 1030047bad06SGerrit Uitslag * 1031047bad06SGerrit Uitslag * @return string path to file 1032047bad06SGerrit Uitslag */ 1033047bad06SGerrit Uitslag protected function getFilename() { 1034047bad06SGerrit Uitslag return mediaFN($this->id); 1035047bad06SGerrit Uitslag } 1036047bad06SGerrit Uitslag} 1037047bad06SGerrit Uitslag 10388eccf945SGerrit Uitslag/** 10398eccf945SGerrit Uitslag * Get the changelog information for a specific page id 10408eccf945SGerrit Uitslag * and revision (timestamp). Adjacent changelog lines 10418eccf945SGerrit Uitslag * are optimistically parsed and cached to speed up 10428eccf945SGerrit Uitslag * consecutive calls to getRevisionInfo. For large 10438eccf945SGerrit Uitslag * changelog files, only the chunk containing the 10448eccf945SGerrit Uitslag * requested changelog line is read. 10458eccf945SGerrit Uitslag * 10461419a485SAndreas Gohr * @deprecated 2013-11-20 10478eccf945SGerrit Uitslag * 10488eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net> 10498eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net> 10508eccf945SGerrit Uitslag */ 10518eccf945SGerrit Uitslagfunction getRevisionInfo($id, $rev, $chunk_size = 8192, $media = false) { 10524f1e2cb3SGerrit Uitslag dbg_deprecated('class PageChangeLog or class MediaChangelog'); 1053047bad06SGerrit Uitslag if($media) { 1054047bad06SGerrit Uitslag $changelog = new MediaChangeLog($id, $chunk_size); 1055047bad06SGerrit Uitslag } else { 1056047bad06SGerrit Uitslag $changelog = new PageChangeLog($id, $chunk_size); 1057047bad06SGerrit Uitslag } 1058047bad06SGerrit Uitslag return $changelog->getRevisionInfo($rev); 10598eccf945SGerrit Uitslag} 10608eccf945SGerrit Uitslag 10618eccf945SGerrit Uitslag/** 10628eccf945SGerrit Uitslag * Return a list of page revisions numbers 10638eccf945SGerrit Uitslag * Does not guarantee that the revision exists in the attic, 10648eccf945SGerrit Uitslag * only that a line with the date exists in the changelog. 10658eccf945SGerrit Uitslag * By default the current revision is skipped. 10668eccf945SGerrit Uitslag * 10678eccf945SGerrit Uitslag * The current revision is automatically skipped when the page exists. 10688eccf945SGerrit Uitslag * See $INFO['meta']['last_change'] for the current revision. 10698eccf945SGerrit Uitslag * 10708eccf945SGerrit Uitslag * For efficiency, the log lines are parsed and cached for later 10718eccf945SGerrit Uitslag * calls to getRevisionInfo. Large changelog files are read 10728eccf945SGerrit Uitslag * backwards in chunks until the requested number of changelog 10738eccf945SGerrit Uitslag * lines are recieved. 10748eccf945SGerrit Uitslag * 10751419a485SAndreas Gohr * @deprecated 2013-11-20 10768eccf945SGerrit Uitslag * 10778eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net> 10788eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net> 10794f1e2cb3SGerrit Uitslag * 10804f1e2cb3SGerrit Uitslag * @param string $id the page of interest 10814f1e2cb3SGerrit Uitslag * @param int $first skip the first n changelog lines 10824f1e2cb3SGerrit Uitslag * @param int $num number of revisions to return 10834f1e2cb3SGerrit Uitslag * @param int $chunk_size 10844f1e2cb3SGerrit Uitslag * @param bool $media 10854f1e2cb3SGerrit Uitslag * @return array 10868eccf945SGerrit Uitslag */ 10878eccf945SGerrit Uitslagfunction getRevisions($id, $first, $num, $chunk_size = 8192, $media = false) { 10884f1e2cb3SGerrit Uitslag dbg_deprecated('class PageChangeLog or class MediaChangelog'); 1089047bad06SGerrit Uitslag if($media) { 1090047bad06SGerrit Uitslag $changelog = new MediaChangeLog($id, $chunk_size); 1091047bad06SGerrit Uitslag } else { 1092047bad06SGerrit Uitslag $changelog = new PageChangeLog($id, $chunk_size); 1093047bad06SGerrit Uitslag } 1094047bad06SGerrit Uitslag return $changelog->getRevisions($first, $num); 10958eccf945SGerrit Uitslag} 10965c2eed9aSlisps 1097