xref: /dokuwiki/inc/changelog.php (revision f2643d9ff318af1d2fbb6249e929212381959247)
17d559c7fSBen Coburn<?php
27d559c7fSBen Coburn/**
37d559c7fSBen Coburn * Changelog handling functions
47d559c7fSBen Coburn *
57d559c7fSBen Coburn * @license    GPL 2 (http://www.gnu.org/licenses/gpl.html)
67d559c7fSBen Coburn * @author     Andreas Gohr <andi@splitbrain.org>
77d559c7fSBen Coburn */
87d559c7fSBen Coburn
9ebf1501fSBen Coburn// Constants for known core changelog line types.
10ebf1501fSBen Coburn// Use these in place of string literals for more readable code.
11ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_CREATE',       'C');
12ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_EDIT',         'E');
13ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_MINOR_EDIT',   'e');
14ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_DELETE',       'D');
15ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_REVERT',       'R');
16ebf1501fSBen Coburn
177d559c7fSBen Coburn/**
187d559c7fSBen Coburn * parses a changelog line into it's components
197d559c7fSBen Coburn *
207d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
217d559c7fSBen Coburn */
227d559c7fSBen Coburnfunction parseChangelogLine($line) {
237d559c7fSBen Coburn    $tmp = explode("\t", $line);
247d559c7fSBen Coburn    if ($tmp!==false && count($tmp)>1) {
257d559c7fSBen Coburn        $info = array();
26e16d739eSBen Coburn        $info['date']  = (int)$tmp[0]; // unix timestamp
277d559c7fSBen Coburn        $info['ip']    = $tmp[1]; // IPv4 address (127.0.0.1)
287d559c7fSBen Coburn        $info['type']  = $tmp[2]; // log line type
297d559c7fSBen Coburn        $info['id']    = $tmp[3]; // page id
307d559c7fSBen Coburn        $info['user']  = $tmp[4]; // user name
317d559c7fSBen Coburn        $info['sum']   = $tmp[5]; // edit summary (or action reason)
327d559c7fSBen Coburn        $info['extra'] = rtrim($tmp[6], "\n"); // extra data (varies by line type)
337d559c7fSBen Coburn        return $info;
347d559c7fSBen Coburn    } else { return false; }
357d559c7fSBen Coburn}
367d559c7fSBen Coburn
377d559c7fSBen Coburn/**
387d559c7fSBen Coburn * Add's an entry to the changelog and saves the metadata for the page
397d559c7fSBen Coburn *
40a365baeeSDominik Eckelmann * @param int    $date      Timestamp of the change
41a365baeeSDominik Eckelmann * @param String $id        Name of the affected page
42a365baeeSDominik Eckelmann * @param String $type      Type of the change see DOKU_CHANGE_TYPE_*
43a365baeeSDominik Eckelmann * @param String $summary   Summary of the change
44a365baeeSDominik Eckelmann * @param mixed  $extra     In case of a revert the revision (timestmp) of the reverted page
45a365baeeSDominik Eckelmann * @param array  $flags     Additional flags in a key value array.
46a365baeeSDominik Eckelmann *                             Availible flags:
47a365baeeSDominik Eckelmann *                             - ExternalEdit - mark as an external edit.
48a365baeeSDominik Eckelmann *
497d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org>
507d559c7fSBen Coburn * @author Esther Brunner <wikidesign@gmail.com>
517d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
527d559c7fSBen Coburn */
53ebf1501fSBen Coburnfunction addLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){
547d559c7fSBen Coburn    global $conf, $INFO;
557d559c7fSBen Coburn
565aa52fafSBen Coburn    // check for special flags as keys
575aa52fafSBen Coburn    if (!is_array($flags)) { $flags = array(); }
585aa52fafSBen Coburn    $flagExternalEdit = isset($flags['ExternalEdit']);
595aa52fafSBen Coburn
607d559c7fSBen Coburn    $id = cleanid($id);
617d559c7fSBen Coburn    $file = wikiFN($id);
627d559c7fSBen Coburn    $created = @filectime($file);
63ebf1501fSBen Coburn    $minor = ($type===DOKU_CHANGE_TYPE_MINOR_EDIT);
64ebf1501fSBen Coburn    $wasRemoved = ($type===DOKU_CHANGE_TYPE_DELETE);
657d559c7fSBen Coburn
667d559c7fSBen Coburn    if(!$date) $date = time(); //use current time if none supplied
672f9daf16SAndreas Gohr    $remote = (!$flagExternalEdit)?clientIP(true):'127.0.0.1';
685aa52fafSBen Coburn    $user   = (!$flagExternalEdit)?$_SERVER['REMOTE_USER']:'';
697d559c7fSBen Coburn
707d559c7fSBen Coburn    $strip = array("\t", "\n");
717d559c7fSBen Coburn    $logline = array(
727d559c7fSBen Coburn            'date'  => $date,
737d559c7fSBen Coburn            'ip'    => $remote,
747d559c7fSBen Coburn            'type'  => str_replace($strip, '', $type),
757d559c7fSBen Coburn            'id'    => $id,
767d559c7fSBen Coburn            'user'  => $user,
777fa35bb1SAndreas Gohr            'sum'   => utf8_substr(str_replace($strip, '', $summary),0,255),
787d559c7fSBen Coburn            'extra' => str_replace($strip, '', $extra)
797d559c7fSBen Coburn            );
807d559c7fSBen Coburn
817d559c7fSBen Coburn    // update metadata
827d559c7fSBen Coburn    if (!$wasRemoved) {
833d1f9ec3SMichael Klier        $oldmeta = p_read_metadata($id);
847d559c7fSBen Coburn        $meta    = array();
853d1f9ec3SMichael Klier        if (!$INFO['exists'] && empty($oldmeta['persistent']['date']['created'])){ // newly created
867d559c7fSBen Coburn            $meta['date']['created'] = $created;
87a8e72133SAndreas Gohr            if ($user){
88a8e72133SAndreas Gohr                $meta['creator'] = $INFO['userinfo']['name'];
89a8e72133SAndreas Gohr                $meta['user']    = $user;
90a8e72133SAndreas Gohr            }
913d1f9ec3SMichael Klier        } elseif (!$INFO['exists'] && !empty($oldmeta['persistent']['date']['created'])) { // re-created / restored
923d1f9ec3SMichael Klier            $meta['date']['created']  = $oldmeta['persistent']['date']['created'];
933d1f9ec3SMichael Klier            $meta['date']['modified'] = $created; // use the files ctime here
943d1f9ec3SMichael Klier            $meta['creator'] = $oldmeta['persistent']['creator'];
953d1f9ec3SMichael Klier            if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name'];
967d559c7fSBen Coburn        } elseif (!$minor) {   // non-minor modification
977d559c7fSBen Coburn            $meta['date']['modified'] = $date;
987d559c7fSBen Coburn            if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name'];
997d559c7fSBen Coburn        }
1007d559c7fSBen Coburn        $meta['last_change'] = $logline;
101ee4d22e0SChristopher Smith        p_set_metadata($id, $meta);
1027d559c7fSBen Coburn    }
1037d559c7fSBen Coburn
1047d559c7fSBen Coburn    // add changelog lines
1057d559c7fSBen Coburn    $logline = implode("\t", $logline)."\n";
1067d559c7fSBen Coburn    io_saveFile(metaFN($id,'.changes'),$logline,true); //page changelog
1077d559c7fSBen Coburn    io_saveFile($conf['changelog'],$logline,true); //global changelog cache
1087d559c7fSBen Coburn}
1097d559c7fSBen Coburn
1107d559c7fSBen Coburn/**
11199c8d7f2Smichael * Add's an entry to the media changelog
11299c8d7f2Smichael *
11399c8d7f2Smichael * @author Michael Hamann <michael@content-space.de>
11499c8d7f2Smichael * @author Andreas Gohr <andi@splitbrain.org>
11599c8d7f2Smichael * @author Esther Brunner <wikidesign@gmail.com>
11699c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net>
11799c8d7f2Smichael */
11899c8d7f2Smichaelfunction addMediaLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){
119de3eb1d7SAdrian Lang    global $conf;
12099c8d7f2Smichael
12199c8d7f2Smichael    $id = cleanid($id);
12299c8d7f2Smichael
12399c8d7f2Smichael    if(!$date) $date = time(); //use current time if none supplied
1242f9daf16SAndreas Gohr    $remote = clientIP(true);
12599c8d7f2Smichael    $user   = $_SERVER['REMOTE_USER'];
12699c8d7f2Smichael
12799c8d7f2Smichael    $strip = array("\t", "\n");
12899c8d7f2Smichael    $logline = array(
12999c8d7f2Smichael            'date'  => $date,
13099c8d7f2Smichael            'ip'    => $remote,
13199c8d7f2Smichael            'type'  => str_replace($strip, '', $type),
13299c8d7f2Smichael            'id'    => $id,
13399c8d7f2Smichael            'user'  => $user,
1347fa35bb1SAndreas Gohr            'sum'   => utf8_substr(str_replace($strip, '', $summary),0,255),
13599c8d7f2Smichael            'extra' => str_replace($strip, '', $extra)
13699c8d7f2Smichael            );
13799c8d7f2Smichael
13899c8d7f2Smichael    // add changelog lines
13999c8d7f2Smichael    $logline = implode("\t", $logline)."\n";
14099c8d7f2Smichael    io_saveFile($conf['media_changelog'],$logline,true); //global media changelog cache
141e4f389efSKate Arzamastseva    io_saveFile(mediaMetaFN($id,'.changes'),$logline,true); //media file's changelog
14299c8d7f2Smichael}
14399c8d7f2Smichael
14499c8d7f2Smichael/**
1457d559c7fSBen Coburn * returns an array of recently changed files using the
1467d559c7fSBen Coburn * changelog
1477d559c7fSBen Coburn *
1487d559c7fSBen Coburn * The following constants can be used to control which changes are
1497d559c7fSBen Coburn * included. Add them together as needed.
1507d559c7fSBen Coburn *
1517d559c7fSBen Coburn * RECENTS_SKIP_DELETED   - don't include deleted pages
1527d559c7fSBen Coburn * RECENTS_SKIP_MINORS    - don't include minor changes
1537d559c7fSBen Coburn * RECENTS_SKIP_SUBSPACES - don't include subspaces
1540b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES  - return media changes instead of page changes
1550b926329SKate Arzamastseva * RECENTS_MEDIA_PAGES_MIXED  - return both media changes and page changes
1567d559c7fSBen Coburn *
1577d559c7fSBen Coburn * @param int    $first   number of first entry returned (for paginating
1587d559c7fSBen Coburn * @param int    $num     return $num entries
1597d559c7fSBen Coburn * @param string $ns      restrict to given namespace
16059f20ea3SMichael Hamann * @param int    $flags   see above
16159f20ea3SMichael Hamann * @return array recently changed files
1627d559c7fSBen Coburn *
1637d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
16429778747SKate Arzamastseva * @author Kate Arzamastseva <pshns@ukr.net>
1657d559c7fSBen Coburn */
1667d559c7fSBen Coburnfunction getRecents($first,$num,$ns='',$flags=0){
1677d559c7fSBen Coburn    global $conf;
1687d559c7fSBen Coburn    $recent = array();
1697d559c7fSBen Coburn    $count  = 0;
1707d559c7fSBen Coburn
1717d559c7fSBen Coburn    if(!$num)
1727d559c7fSBen Coburn        return $recent;
1737d559c7fSBen Coburn
1747d559c7fSBen Coburn    // read all recent changes. (kept short)
1750b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_CHANGES) {
17699c8d7f2Smichael        $lines = @file($conf['media_changelog']);
17799c8d7f2Smichael    } else {
17876d47b34SDavid Lorentsen        $lines = @file($conf['changelog']);
17999c8d7f2Smichael    }
18029778747SKate Arzamastseva    $lines_position = count($lines)-1;
18159f20ea3SMichael Hamann    $media_lines_position = 0;
18259f20ea3SMichael Hamann    $media_lines = array();
18329778747SKate Arzamastseva
1840b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_PAGES_MIXED) {
18529778747SKate Arzamastseva        $media_lines = @file($conf['media_changelog']);
18629778747SKate Arzamastseva        $media_lines_position = count($media_lines)-1;
18729778747SKate Arzamastseva    }
18829778747SKate Arzamastseva
18929778747SKate Arzamastseva    $seen = array(); // caches seen lines, _handleRecent() skips them
1907d559c7fSBen Coburn
1917d559c7fSBen Coburn    // handle lines
1920b926329SKate Arzamastseva    while ($lines_position >= 0 || (($flags & RECENTS_MEDIA_PAGES_MIXED) && $media_lines_position >=0)) {
19329778747SKate Arzamastseva        if (empty($rec) && $lines_position >= 0) {
1941d901ab2SAndreas Gohr            $rec = _handleRecent(@$lines[$lines_position], $ns, $flags, $seen);
19529778747SKate Arzamastseva            if (!$rec) {
19629778747SKate Arzamastseva                $lines_position --;
19729778747SKate Arzamastseva                continue;
19829778747SKate Arzamastseva            }
19929778747SKate Arzamastseva        }
2000b926329SKate Arzamastseva        if (($flags & RECENTS_MEDIA_PAGES_MIXED) && empty($media_rec) && $media_lines_position >= 0) {
20142025dfdSMichael Hamann            $media_rec = _handleRecent(@$media_lines[$media_lines_position], $ns, $flags | RECENTS_MEDIA_CHANGES, $seen);
20229778747SKate Arzamastseva            if (!$media_rec) {
20329778747SKate Arzamastseva                $media_lines_position --;
20429778747SKate Arzamastseva                continue;
20529778747SKate Arzamastseva            }
20629778747SKate Arzamastseva        }
2070b926329SKate Arzamastseva        if (($flags & RECENTS_MEDIA_PAGES_MIXED) && @$media_rec['date'] >= @$rec['date']) {
20829778747SKate Arzamastseva            $media_lines_position--;
20929778747SKate Arzamastseva            $x = $media_rec;
210b5941dfaSKate Arzamastseva            $x['media'] = true;
21129778747SKate Arzamastseva            $media_rec = false;
21229778747SKate Arzamastseva        } else {
21329778747SKate Arzamastseva            $lines_position--;
21429778747SKate Arzamastseva            $x = $rec;
215421ec38eSKate Arzamastseva            if ($flags & RECENTS_MEDIA_CHANGES) $x['media'] = true;
21629778747SKate Arzamastseva            $rec = false;
21729778747SKate Arzamastseva        }
2187d559c7fSBen Coburn        if(--$first >= 0) continue; // skip first entries
21929778747SKate Arzamastseva        $recent[] = $x;
2207d559c7fSBen Coburn        $count++;
2217d559c7fSBen Coburn        // break when we have enough entries
2227d559c7fSBen Coburn        if($count >= $num){ break; }
2237d559c7fSBen Coburn    }
2247d559c7fSBen Coburn    return $recent;
2257d559c7fSBen Coburn}
2267d559c7fSBen Coburn
2277d559c7fSBen Coburn/**
22899c8d7f2Smichael * returns an array of files changed since a given time using the
22999c8d7f2Smichael * changelog
23099c8d7f2Smichael *
23199c8d7f2Smichael * The following constants can be used to control which changes are
23299c8d7f2Smichael * included. Add them together as needed.
23399c8d7f2Smichael *
23499c8d7f2Smichael * RECENTS_SKIP_DELETED   - don't include deleted pages
23599c8d7f2Smichael * RECENTS_SKIP_MINORS    - don't include minor changes
23699c8d7f2Smichael * RECENTS_SKIP_SUBSPACES - don't include subspaces
2370b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES  - return media changes instead of page changes
23899c8d7f2Smichael *
23999c8d7f2Smichael * @param int    $from    date of the oldest entry to return
24099c8d7f2Smichael * @param int    $to      date of the newest entry to return (for pagination, optional)
24199c8d7f2Smichael * @param string $ns      restrict to given namespace (optional)
24259f20ea3SMichael Hamann * @param int    $flags   see above (optional)
24359f20ea3SMichael Hamann * @return array of files
24499c8d7f2Smichael *
24599c8d7f2Smichael * @author Michael Hamann <michael@content-space.de>
24699c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net>
24799c8d7f2Smichael */
24899c8d7f2Smichaelfunction getRecentsSince($from,$to=null,$ns='',$flags=0){
24999c8d7f2Smichael    global $conf;
25099c8d7f2Smichael    $recent = array();
25199c8d7f2Smichael
25299c8d7f2Smichael    if($to && $to < $from)
25399c8d7f2Smichael        return $recent;
25499c8d7f2Smichael
25599c8d7f2Smichael    // read all recent changes. (kept short)
2560b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_CHANGES) {
25799c8d7f2Smichael        $lines = @file($conf['media_changelog']);
25899c8d7f2Smichael    } else {
25999c8d7f2Smichael        $lines = @file($conf['changelog']);
26099c8d7f2Smichael    }
261e920a0a1SAndreas Gohr    if(!$lines) return $recent;
26299c8d7f2Smichael
26399c8d7f2Smichael    // we start searching at the end of the list
26499c8d7f2Smichael    $lines = array_reverse($lines);
26599c8d7f2Smichael
26699c8d7f2Smichael    // handle lines
26799c8d7f2Smichael    $seen = array(); // caches seen lines, _handleRecent() skips them
26899c8d7f2Smichael
26999c8d7f2Smichael    foreach($lines as $line){
27099c8d7f2Smichael        $rec = _handleRecent($line, $ns, $flags, $seen);
27199c8d7f2Smichael        if($rec !== false) {
27299c8d7f2Smichael            if ($rec['date'] >= $from) {
27399c8d7f2Smichael                if (!$to || $rec['date'] <= $to) {
27499c8d7f2Smichael                    $recent[] = $rec;
27599c8d7f2Smichael                }
27699c8d7f2Smichael            } else {
27799c8d7f2Smichael                break;
27899c8d7f2Smichael            }
27999c8d7f2Smichael        }
28099c8d7f2Smichael    }
28199c8d7f2Smichael
28299c8d7f2Smichael    return array_reverse($recent);
28399c8d7f2Smichael}
28499c8d7f2Smichael
28599c8d7f2Smichael/**
2867d559c7fSBen Coburn * Internal function used by getRecents
2877d559c7fSBen Coburn *
2887d559c7fSBen Coburn * don't call directly
2897d559c7fSBen Coburn *
2907d559c7fSBen Coburn * @see getRecents()
2917d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org>
2927d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
2937d559c7fSBen Coburn */
29499c8d7f2Smichaelfunction _handleRecent($line,$ns,$flags,&$seen){
2957d559c7fSBen Coburn    if(empty($line)) return false;   //skip empty lines
2967d559c7fSBen Coburn
2977d559c7fSBen Coburn    // split the line into parts
2987d559c7fSBen Coburn    $recent = parseChangelogLine($line);
2997d559c7fSBen Coburn    if ($recent===false) { return false; }
3007d559c7fSBen Coburn
3017d559c7fSBen Coburn    // skip seen ones
3027d559c7fSBen Coburn    if(isset($seen[$recent['id']])) return false;
3037d559c7fSBen Coburn
3047d559c7fSBen Coburn    // skip minors
305ebf1501fSBen Coburn    if($recent['type']===DOKU_CHANGE_TYPE_MINOR_EDIT && ($flags & RECENTS_SKIP_MINORS)) return false;
3067d559c7fSBen Coburn
3077d559c7fSBen Coburn    // remember in seen to skip additional sights
3087d559c7fSBen Coburn    $seen[$recent['id']] = 1;
3097d559c7fSBen Coburn
3107d559c7fSBen Coburn    // check if it's a hidden page
3117d559c7fSBen Coburn    if(isHiddenPage($recent['id'])) return false;
3127d559c7fSBen Coburn
3137d559c7fSBen Coburn    // filter namespace
3147d559c7fSBen Coburn    if (($ns) && (strpos($recent['id'],$ns.':') !== 0)) return false;
3157d559c7fSBen Coburn
3167d559c7fSBen Coburn    // exclude subnamespaces
3177d559c7fSBen Coburn    if (($flags & RECENTS_SKIP_SUBSPACES) && (getNS($recent['id']) != $ns)) return false;
3187d559c7fSBen Coburn
3197d559c7fSBen Coburn    // check ACL
32042025dfdSMichael Hamann    if ($flags & RECENTS_MEDIA_CHANGES) {
32142025dfdSMichael Hamann        $recent['perms'] = auth_quickaclcheck(getNS($recent['id']).':*');
32242025dfdSMichael Hamann    } else {
32399c8d7f2Smichael        $recent['perms'] = auth_quickaclcheck($recent['id']);
32442025dfdSMichael Hamann    }
32599c8d7f2Smichael    if ($recent['perms'] < AUTH_READ) return false;
3267d559c7fSBen Coburn
3277d559c7fSBen Coburn    // check existance
3281d901ab2SAndreas Gohr    if($flags & RECENTS_SKIP_DELETED){
32942025dfdSMichael Hamann        $fn = (($flags & RECENTS_MEDIA_CHANGES) ? mediaFN($recent['id']) : wikiFN($recent['id']));
3301d901ab2SAndreas Gohr        if(!@file_exists($fn)) return false;
3311d901ab2SAndreas Gohr    }
3327d559c7fSBen Coburn
3337d559c7fSBen Coburn    return $recent;
3347d559c7fSBen Coburn}
3357d559c7fSBen Coburn
3367d559c7fSBen Coburn/**
337047bad06SGerrit Uitslag * Class ChangeLog
338047bad06SGerrit Uitslag * methods for handling of changelog of pages or media files
3398eccf945SGerrit Uitslag */
340047bad06SGerrit Uitslagabstract class ChangeLog {
3418eccf945SGerrit Uitslag
3428eccf945SGerrit Uitslag    /** @var string */
343047bad06SGerrit Uitslag    protected $id;
3448eccf945SGerrit Uitslag    /** @var int */
345047bad06SGerrit Uitslag    protected $chunk_size;
3468eccf945SGerrit Uitslag    /** @var array */
347047bad06SGerrit Uitslag    protected $cache;
3488eccf945SGerrit Uitslag
3498eccf945SGerrit Uitslag    /**
3508eccf945SGerrit Uitslag     * Constructor
3518eccf945SGerrit Uitslag     *
3528eccf945SGerrit Uitslag     * @param string $id         page id
3538eccf945SGerrit Uitslag     * @param int $chunk_size maximum block size read from file
3548eccf945SGerrit Uitslag     */
3558eccf945SGerrit Uitslag    public function __construct($id, $chunk_size = 8192) {
3568eccf945SGerrit Uitslag        global $cache_revinfo;
3578eccf945SGerrit Uitslag
3588eccf945SGerrit Uitslag        $this->cache =& $cache_revinfo;
3598eccf945SGerrit Uitslag        if(!isset($this->cache[$id])) {
3608eccf945SGerrit Uitslag            $this->cache[$id] = array();
3618eccf945SGerrit Uitslag        }
3628eccf945SGerrit Uitslag
3638eccf945SGerrit Uitslag        $this->id = $id;
3648eccf945SGerrit Uitslag        $this->setChunkSize($chunk_size);
3658eccf945SGerrit Uitslag
3668eccf945SGerrit Uitslag    }
3678eccf945SGerrit Uitslag
3688eccf945SGerrit Uitslag    /**
3698eccf945SGerrit Uitslag     * Set chunk size for file reading
370047bad06SGerrit Uitslag     * Chunk size zero let read whole file at once
3718eccf945SGerrit Uitslag     *
3728eccf945SGerrit Uitslag     * @param int $chunk_size maximum block size read from file
3738eccf945SGerrit Uitslag     */
3748eccf945SGerrit Uitslag    public function setChunkSize($chunk_size) {
3758eccf945SGerrit Uitslag        if(!is_numeric($chunk_size)) $chunk_size = 0;
3768eccf945SGerrit Uitslag
3778eccf945SGerrit Uitslag        $this->chunk_size = (int) max($chunk_size, 0);
3788eccf945SGerrit Uitslag    }
3798eccf945SGerrit Uitslag
3808eccf945SGerrit Uitslag    /**
381047bad06SGerrit Uitslag     * Returns path to changelog
382047bad06SGerrit Uitslag     *
383047bad06SGerrit Uitslag     * @return string path to file
384047bad06SGerrit Uitslag     */
385047bad06SGerrit Uitslag    abstract protected function getChangelogFilename();
386047bad06SGerrit Uitslag
387047bad06SGerrit Uitslag    /**
388047bad06SGerrit Uitslag     * Returns path to current page/media
389047bad06SGerrit Uitslag     *
390047bad06SGerrit Uitslag     * @return string path to file
391047bad06SGerrit Uitslag     */
392047bad06SGerrit Uitslag    abstract protected function getFilename();
393047bad06SGerrit Uitslag
394047bad06SGerrit Uitslag    /**
3958eccf945SGerrit Uitslag     * Get the changelog information for a specific page id and revision (timestamp)
3968eccf945SGerrit Uitslag     *
3978eccf945SGerrit Uitslag     * Adjacent changelog lines are optimistically parsed and cached to speed up
3988eccf945SGerrit Uitslag     * consecutive calls to getRevisionInfo. For large changelog files, only the chunk
3998eccf945SGerrit Uitslag     * containing the requested changelog line is read.
4008eccf945SGerrit Uitslag     *
4018eccf945SGerrit Uitslag     * @param int $rev        revision timestamp
4028eccf945SGerrit Uitslag     * @return bool|array false or array with entries:
4038eccf945SGerrit Uitslag     *      - date:  unix timestamp
4048eccf945SGerrit Uitslag     *      - ip:    IPv4 address (127.0.0.1)
4058eccf945SGerrit Uitslag     *      - type:  log line type
4068eccf945SGerrit Uitslag     *      - id:    page id
4078eccf945SGerrit Uitslag     *      - user:  user name
4088eccf945SGerrit Uitslag     *      - sum:   edit summary (or action reason)
4098eccf945SGerrit Uitslag     *      - extra: extra data (varies by line type)
4107d559c7fSBen Coburn     *
4117d559c7fSBen Coburn     * @author Ben Coburn <btcoburn@silicodon.net>
41229778747SKate Arzamastseva     * @author Kate Arzamastseva <pshns@ukr.net>
4137d559c7fSBen Coburn     */
414047bad06SGerrit Uitslag    public function getRevisionInfo($rev) {
4157d559c7fSBen Coburn        $rev = max($rev, 0);
4167d559c7fSBen Coburn
4177d559c7fSBen Coburn        // check if it's already in the memory cache
4188eccf945SGerrit Uitslag        if(isset($this->cache[$this->id]) && isset($this->cache[$this->id][$rev])) {
4198eccf945SGerrit Uitslag            return $this->cache[$this->id][$rev];
420e4f389efSKate Arzamastseva        }
4217d559c7fSBen Coburn
422040f0e13SKlap-in        //read lines from changelog
423047bad06SGerrit Uitslag        list($fp, $lines) = $this->readloglines($rev);
424040f0e13SKlap-in        if($fp) {
4257d559c7fSBen Coburn            fclose($fp);
4267d559c7fSBen Coburn        }
427040f0e13SKlap-in        if(empty($lines)) return false;
4287d559c7fSBen Coburn
4297d559c7fSBen Coburn        // parse and cache changelog lines
4307d559c7fSBen Coburn        foreach($lines as $value) {
4317d559c7fSBen Coburn            $tmp = parseChangelogLine($value);
4327d559c7fSBen Coburn            if($tmp !== false) {
4338eccf945SGerrit Uitslag                $this->cache[$this->id][$tmp['date']] = $tmp;
4347d559c7fSBen Coburn            }
4357d559c7fSBen Coburn        }
4368eccf945SGerrit Uitslag        if(!isset($this->cache[$this->id][$rev])) {
4378eccf945SGerrit Uitslag            return false;
4388eccf945SGerrit Uitslag        }
4398eccf945SGerrit Uitslag        return $this->cache[$this->id][$rev];
4407d559c7fSBen Coburn    }
4417d559c7fSBen Coburn
4427d559c7fSBen Coburn    /**
4437d559c7fSBen Coburn     * Return a list of page revisions numbers
4448eccf945SGerrit Uitslag     *
4457d559c7fSBen Coburn     * Does not guarantee that the revision exists in the attic,
4467d559c7fSBen Coburn     * only that a line with the date exists in the changelog.
4477d559c7fSBen Coburn     * By default the current revision is skipped.
4487d559c7fSBen Coburn     *
4497d559c7fSBen Coburn     * The current revision is automatically skipped when the page exists.
4507d559c7fSBen Coburn     * See $INFO['meta']['last_change'] for the current revision.
4518eccf945SGerrit Uitslag     * A negative $first let read the current revision too.
4527d559c7fSBen Coburn     *
4537d559c7fSBen Coburn     * For efficiency, the log lines are parsed and cached for later
4547d559c7fSBen Coburn     * calls to getRevisionInfo. Large changelog files are read
455c66972f2SAdrian Lang     * backwards in chunks until the requested number of changelog
4567d559c7fSBen Coburn     * lines are recieved.
4577d559c7fSBen Coburn     *
4588eccf945SGerrit Uitslag     * @param int $first      skip the first n changelog lines
4598eccf945SGerrit Uitslag     * @param int $num        number of revisions to return
4608eccf945SGerrit Uitslag     * @return array with the revision timestamps
4618eccf945SGerrit Uitslag     *
4627d559c7fSBen Coburn     * @author Ben Coburn <btcoburn@silicodon.net>
46329778747SKate Arzamastseva     * @author Kate Arzamastseva <pshns@ukr.net>
4647d559c7fSBen Coburn     */
465047bad06SGerrit Uitslag    public function getRevisions($first, $num) {
4667d559c7fSBen Coburn        $revs = array();
4677d559c7fSBen Coburn        $lines = array();
4687d559c7fSBen Coburn        $count = 0;
469047bad06SGerrit Uitslag
4707d559c7fSBen Coburn        $num = max($num, 0);
4717d1e323eSGerrit Uitslag        if($num == 0) {
4727d1e323eSGerrit Uitslag            return $revs;
4737d1e323eSGerrit Uitslag        }
474092b7683SKlap-in
475b824abd4SAndreas Gohr        if($first < 0) {
476b824abd4SAndreas Gohr            $first = 0;
477047bad06SGerrit Uitslag        } else if(@file_exists($this->getFilename())) {
4787d559c7fSBen Coburn            // skip current revision if the page exists
4797d559c7fSBen Coburn            $first = max($first + 1, 0);
4807d559c7fSBen Coburn        }
4817d559c7fSBen Coburn
482047bad06SGerrit Uitslag        $file = $this->getChangelogFilename();
483047bad06SGerrit Uitslag
4847d1e323eSGerrit Uitslag        if(!@file_exists($file)) {
4857d1e323eSGerrit Uitslag            return $revs;
4867d1e323eSGerrit Uitslag        }
4878eccf945SGerrit Uitslag        if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) {
4887d559c7fSBen Coburn            // read whole file
4897d559c7fSBen Coburn            $lines = file($file);
4907d1e323eSGerrit Uitslag            if($lines === false) {
4917d1e323eSGerrit Uitslag                return $revs;
4927d1e323eSGerrit Uitslag            }
4937d559c7fSBen Coburn        } else {
4947d559c7fSBen Coburn            // read chunks backwards
4957d559c7fSBen Coburn            $fp = fopen($file, 'rb'); // "file pointer"
4967d1e323eSGerrit Uitslag            if($fp === false) {
4977d1e323eSGerrit Uitslag                return $revs;
4987d1e323eSGerrit Uitslag            }
4997d559c7fSBen Coburn            fseek($fp, 0, SEEK_END);
5007d559c7fSBen Coburn            $tail = ftell($fp);
5017d559c7fSBen Coburn
5027d559c7fSBen Coburn            // chunk backwards
5038eccf945SGerrit Uitslag            $finger = max($tail - $this->chunk_size, 0);
5047d559c7fSBen Coburn            while($count < $num + $first) {
5057d1e323eSGerrit Uitslag                $nl = $this->getNewlinepointer($fp, $finger);
506b824abd4SAndreas Gohr
507b824abd4SAndreas Gohr                // was the chunk big enough? if not, take another bite
508b824abd4SAndreas Gohr                if($nl > 0 && $tail <= $nl) {
5098eccf945SGerrit Uitslag                    $finger = max($finger - $this->chunk_size, 0);
510b824abd4SAndreas Gohr                    continue;
511b824abd4SAndreas Gohr                } else {
512b824abd4SAndreas Gohr                    $finger = $nl;
5137d559c7fSBen Coburn                }
5147d559c7fSBen Coburn
5157d559c7fSBen Coburn                // read chunk
5167d559c7fSBen Coburn                $chunk = '';
5177d559c7fSBen Coburn                $read_size = max($tail - $finger, 0); // found chunk size
5187d559c7fSBen Coburn                $got = 0;
5197d559c7fSBen Coburn                while($got < $read_size && !feof($fp)) {
52080e97297SGerrit Uitslag                    $tmp = @fread($fp, max(min($this->chunk_size, $read_size - $got), 0));
5217d1e323eSGerrit Uitslag                    if($tmp === false) {
5227d1e323eSGerrit Uitslag                        break;
5237d1e323eSGerrit Uitslag                    } //error state
5247d559c7fSBen Coburn                    $got += strlen($tmp);
5257d559c7fSBen Coburn                    $chunk .= $tmp;
5267d559c7fSBen Coburn                }
5277d559c7fSBen Coburn                $tmp = explode("\n", $chunk);
5287d559c7fSBen Coburn                array_pop($tmp); // remove trailing newline
5297d559c7fSBen Coburn
5307d559c7fSBen Coburn                // combine with previous chunk
5317d559c7fSBen Coburn                $count += count($tmp);
5327d559c7fSBen Coburn                $lines = array_merge($tmp, $lines);
5337d559c7fSBen Coburn
5347d559c7fSBen Coburn                // next chunk
5357d1e323eSGerrit Uitslag                if($finger == 0) {
5367d1e323eSGerrit Uitslag                    break;
5377d1e323eSGerrit Uitslag                } // already read all the lines
5387d559c7fSBen Coburn                else {
5397d559c7fSBen Coburn                    $tail = $finger;
5408eccf945SGerrit Uitslag                    $finger = max($tail - $this->chunk_size, 0);
5417d559c7fSBen Coburn                }
5427d559c7fSBen Coburn            }
5437d559c7fSBen Coburn            fclose($fp);
5447d559c7fSBen Coburn        }
5457d559c7fSBen Coburn
5467d559c7fSBen Coburn        // skip parsing extra lines
5477d559c7fSBen Coburn        $num = max(min(count($lines) - $first, $num), 0);
5487d559c7fSBen Coburn        if     ($first > 0 && $num > 0)  { $lines = array_slice($lines, max(count($lines) - $first - $num, 0), $num); }
5497d559c7fSBen Coburn        else if($first > 0 && $num == 0) { $lines = array_slice($lines, 0, max(count($lines) - $first, 0)); }
5507d559c7fSBen Coburn        else if($first == 0 && $num > 0) { $lines = array_slice($lines, max(count($lines) - $num, 0)); }
5517d559c7fSBen Coburn
5527d559c7fSBen Coburn        // handle lines in reverse order
5537d559c7fSBen Coburn        for($i = count($lines) - 1; $i >= 0; $i--) {
5547d559c7fSBen Coburn            $tmp = parseChangelogLine($lines[$i]);
5557d559c7fSBen Coburn            if($tmp !== false) {
5568eccf945SGerrit Uitslag                $this->cache[$this->id][$tmp['date']] = $tmp;
5577d559c7fSBen Coburn                $revs[] = $tmp['date'];
5587d559c7fSBen Coburn            }
5597d559c7fSBen Coburn        }
5607d559c7fSBen Coburn
5617d559c7fSBen Coburn        return $revs;
5627d559c7fSBen Coburn    }
5637d559c7fSBen Coburn
564f9528c0cSKlap-in    /**
5658eccf945SGerrit Uitslag     * Get the nth revision left or right handside  for a specific page id and revision (timestamp)
5668eccf945SGerrit Uitslag     *
5678eccf945SGerrit Uitslag     * For large changelog files, only the chunk containing the
568f9528c0cSKlap-in     * reference revision $rev is read and sometimes a next chunck.
569f9528c0cSKlap-in     *
570f9528c0cSKlap-in     * Adjacent changelog lines are optimistically parsed and cached to speed up
571f9528c0cSKlap-in     * consecutive calls to getRevisionInfo.
572f9528c0cSKlap-in     *
573f9528c0cSKlap-in     * @param int $rev        revision timestamp used as startdate (doesn't need to be revisionnumber)
574f9528c0cSKlap-in     * @param int $direction  give position of returned revision with respect to $rev; positive=next, negative=prev
5758eccf945SGerrit Uitslag     * @return bool|int
5768eccf945SGerrit Uitslag     *      timestamp of the requested revision
5778eccf945SGerrit Uitslag     *      otherwise false
578f9528c0cSKlap-in     */
579047bad06SGerrit Uitslag    public function getRelativeRevision($rev, $direction) {
580f9528c0cSKlap-in        $rev = max($rev, 0);
581040f0e13SKlap-in        $direction = (int) $direction;
5827d559c7fSBen Coburn
583f9528c0cSKlap-in        //no direction given or last rev, so no follow-up
584ee33e0c5SGerrit Uitslag        if(!$direction || ($direction > 0 && $this->isCurrentRevision($rev))) {
585f9528c0cSKlap-in            return false;
586f9528c0cSKlap-in        }
587f9528c0cSKlap-in
588040f0e13SKlap-in        //get lines from changelog
589047bad06SGerrit Uitslag        list($fp, $lines, $head, $tail, $eof) = $this->readloglines($rev);
590040f0e13SKlap-in        if(empty($lines)) return false;
591040f0e13SKlap-in
592040f0e13SKlap-in        // look for revisions later/earlier then $rev, when founded count till the wanted revision is reached
593040f0e13SKlap-in        // also parse and cache changelog lines for getRevisionInfo().
594040f0e13SKlap-in        $revcounter = 0;
595040f0e13SKlap-in        $relativerev = false;
596040f0e13SKlap-in        $checkotherchunck = true; //always runs once
597040f0e13SKlap-in        while(!$relativerev && $checkotherchunck) {
598040f0e13SKlap-in            $tmp = array();
599040f0e13SKlap-in            //parse in normal or reverse order
600040f0e13SKlap-in            $count = count($lines);
601040f0e13SKlap-in            if($direction > 0) {
602040f0e13SKlap-in                $start = 0;
603040f0e13SKlap-in                $step = 1;
604040f0e13SKlap-in            } else {
605040f0e13SKlap-in                $start = $count - 1;
606040f0e13SKlap-in                $step = -1;
607040f0e13SKlap-in            }
608040f0e13SKlap-in            for($i = $start; $i >= 0 && $i < $count; $i = $i + $step) {
609040f0e13SKlap-in                $tmp = parseChangelogLine($lines[$i]);
610040f0e13SKlap-in                if($tmp !== false) {
6118eccf945SGerrit Uitslag                    $this->cache[$this->id][$tmp['date']] = $tmp;
612040f0e13SKlap-in                    //look for revs older/earlier then reference $rev and select $direction-th one
613040f0e13SKlap-in                    if(($direction > 0 && $tmp['date'] > $rev) || ($direction < 0 && $tmp['date'] < $rev)) {
614040f0e13SKlap-in                        $revcounter++;
615040f0e13SKlap-in                        if($revcounter == abs($direction)) {
616040f0e13SKlap-in                            $relativerev = $tmp['date'];
617040f0e13SKlap-in                        }
618040f0e13SKlap-in                    }
619040f0e13SKlap-in                }
620040f0e13SKlap-in            }
621040f0e13SKlap-in
622040f0e13SKlap-in            //true when $rev is found, but not the wanted follow-up.
623040f0e13SKlap-in            $checkotherchunck = $fp
624040f0e13SKlap-in                && ($tmp['date'] == $rev || ($revcounter > 0 && !$relativerev))
625040f0e13SKlap-in                && !(($tail == $eof && $direction > 0) || ($head == 0 && $direction < 0));
626040f0e13SKlap-in
627040f0e13SKlap-in            if($checkotherchunck) {
6281da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, $direction);
629040f0e13SKlap-in
630040f0e13SKlap-in                if(empty($lines)) break;
631040f0e13SKlap-in            }
632040f0e13SKlap-in        }
633040f0e13SKlap-in        if($fp) {
634040f0e13SKlap-in            fclose($fp);
635040f0e13SKlap-in        }
636040f0e13SKlap-in
637040f0e13SKlap-in        return $relativerev;
638040f0e13SKlap-in    }
639040f0e13SKlap-in
640040f0e13SKlap-in    /**
6411da8dc97SGerrit Uitslag     * Returns revisions around rev1 and rev2
6421da8dc97SGerrit Uitslag     * When available it returns $max entries for each revision
6431da8dc97SGerrit Uitslag     *
6441da8dc97SGerrit Uitslag     * @param int $rev1 oldest revision timestamp
6451da8dc97SGerrit Uitslag     * @param int $rev2 newest revision timestamp
6461da8dc97SGerrit Uitslag     * @param int $max maximum number of revisions returned
6471da8dc97SGerrit Uitslag     * @return array with two arrays with revisions surrounding rev1 respectively rev2
6481da8dc97SGerrit Uitslag     */
6491da8dc97SGerrit Uitslag    public function getRevisionsAround($rev1, $rev2, $max = 50) {
6501da8dc97SGerrit Uitslag        $max = floor(abs($max) / 2)*2 + 1;
6511da8dc97SGerrit Uitslag        $rev1 = max($rev1, 0);
6521da8dc97SGerrit Uitslag        $rev2 = max($rev2, 0);
6531da8dc97SGerrit Uitslag
6541da8dc97SGerrit Uitslag        if($rev2 < $rev1) {
6551da8dc97SGerrit Uitslag            $rev = $rev2;
6561da8dc97SGerrit Uitslag            $rev2 = $rev1;
6571da8dc97SGerrit Uitslag            $rev1 = $rev;
6581da8dc97SGerrit Uitslag        }
6591da8dc97SGerrit Uitslag        //collect revisions around rev2
6601da8dc97SGerrit Uitslag        list($revs2, $allrevs, $fp, $lines, $head, $tail) = $this->retrieveRevisionsAround($rev2, $max);
6611da8dc97SGerrit Uitslag
6621da8dc97SGerrit Uitslag        if(empty($revs2)) return array(array(), array());
6631da8dc97SGerrit Uitslag
6641da8dc97SGerrit Uitslag        //collect revisions around rev1
6651da8dc97SGerrit Uitslag        $index = array_search($rev1, $allrevs);
6661da8dc97SGerrit Uitslag        if($index === false) {
6671da8dc97SGerrit Uitslag            //no overlapping revisions
6681da8dc97SGerrit Uitslag            list($revs1,,,,,) = $this->retrieveRevisionsAround($rev1, $max);
6691da8dc97SGerrit Uitslag            if(empty($revs1)) $revs1 = array();
6701da8dc97SGerrit Uitslag        } else {
6711da8dc97SGerrit Uitslag            //revisions overlaps, reuse revisions around rev2
6721da8dc97SGerrit Uitslag            $revs1 = $allrevs;
6731da8dc97SGerrit Uitslag            while($head > 0) {
6741da8dc97SGerrit Uitslag                for($i = count($lines) - 1; $i >= 0; $i--) {
6751da8dc97SGerrit Uitslag                    $tmp = parseChangelogLine($lines[$i]);
6761da8dc97SGerrit Uitslag                    if($tmp !== false) {
6771da8dc97SGerrit Uitslag                        $this->cache[$this->id][$tmp['date']] = $tmp;
6781da8dc97SGerrit Uitslag                        $revs1[] = $tmp['date'];
6791da8dc97SGerrit Uitslag                        $index++;
6801da8dc97SGerrit Uitslag
6811da8dc97SGerrit Uitslag                        if($index > floor($max / 2)) break 2;
6821da8dc97SGerrit Uitslag                    }
6831da8dc97SGerrit Uitslag                }
6841da8dc97SGerrit Uitslag
6851da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1);
6861da8dc97SGerrit Uitslag            }
6871da8dc97SGerrit Uitslag            sort($revs1);
6881da8dc97SGerrit Uitslag            //return wanted selection
6891da8dc97SGerrit Uitslag            $revs1 = array_slice($revs1, max($index - floor($max/2), 0), $max);
6901da8dc97SGerrit Uitslag        }
6911da8dc97SGerrit Uitslag
6921da8dc97SGerrit Uitslag        return array($revs1, $revs2);
6931da8dc97SGerrit Uitslag    }
6941da8dc97SGerrit Uitslag
6951da8dc97SGerrit Uitslag    /**
6968eccf945SGerrit Uitslag     * Returns lines from changelog.
697040f0e13SKlap-in     * If file larger than $chuncksize, only chunck is read that could contain $rev.
698040f0e13SKlap-in     *
699040f0e13SKlap-in     * @param int $rev   revision timestamp
700040f0e13SKlap-in     * @return array(fp, array(changeloglines), $head, $tail, $eof)|bool
701040f0e13SKlap-in     *     returns false when not succeed. fp only defined for chuck reading, needs closing.
702040f0e13SKlap-in     */
703047bad06SGerrit Uitslag    protected function readloglines($rev) {
704047bad06SGerrit Uitslag        $file = $this->getChangelogFilename();
7058eccf945SGerrit Uitslag
706f9528c0cSKlap-in        if(!@file_exists($file)) {
707f9528c0cSKlap-in            return false;
708f9528c0cSKlap-in        }
709f9528c0cSKlap-in
710f9528c0cSKlap-in        $fp = null;
711f9528c0cSKlap-in        $head = 0;
712040f0e13SKlap-in        $tail = 0;
713f9528c0cSKlap-in        $eof = 0;
7148eccf945SGerrit Uitslag
7158eccf945SGerrit Uitslag        if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) {
716f9528c0cSKlap-in            // read whole file
717f9528c0cSKlap-in            $lines = file($file);
718f9528c0cSKlap-in            if($lines === false) {
719f9528c0cSKlap-in                return false;
720f9528c0cSKlap-in            }
721f9528c0cSKlap-in        } else {
722f9528c0cSKlap-in            // read by chunk
723f9528c0cSKlap-in            $fp = fopen($file, 'rb'); // "file pointer"
724f9528c0cSKlap-in            if($fp === false) {
725f9528c0cSKlap-in                return false;
726040f0e13SKlap-in            }
727f9528c0cSKlap-in            $head = 0;
728040f0e13SKlap-in            fseek($fp, 0, SEEK_END);
729040f0e13SKlap-in            $eof = ftell($fp);
730040f0e13SKlap-in            $tail = $eof;
731f9528c0cSKlap-in
732f9528c0cSKlap-in            // find chunk
7338eccf945SGerrit Uitslag            while($tail - $head > $this->chunk_size) {
734f9528c0cSKlap-in                $finger = $head + floor(($tail - $head) / 2.0);
7358eccf945SGerrit Uitslag                $finger = $this->getNewlinepointer($fp, $finger);
736040f0e13SKlap-in                $tmp = fgets($fp);
737f9528c0cSKlap-in                if($finger == $head || $finger == $tail) {
738f9528c0cSKlap-in                    break;
739f9528c0cSKlap-in                }
74059cce2d9SGerrit Uitslag                $tmp = parseChangelogLine($tmp);
74159cce2d9SGerrit Uitslag                $finger_rev = $tmp['date'];
74259cce2d9SGerrit Uitslag
743f9528c0cSKlap-in                if($finger_rev > $rev) {
744f9528c0cSKlap-in                    $tail = $finger;
745f9528c0cSKlap-in                } else {
746f9528c0cSKlap-in                    $head = $finger;
747f9528c0cSKlap-in                }
748f9528c0cSKlap-in            }
749f9528c0cSKlap-in
750f9528c0cSKlap-in            if($tail - $head < 1) {
751f9528c0cSKlap-in                // cound not find chunk, assume requested rev is missing
752f9528c0cSKlap-in                fclose($fp);
753f9528c0cSKlap-in                return false;
754f9528c0cSKlap-in            }
755f9528c0cSKlap-in
7568eccf945SGerrit Uitslag            $lines = $this->readChunk($fp, $head, $tail);
757f9528c0cSKlap-in        }
758040f0e13SKlap-in        return array(
759040f0e13SKlap-in            $fp,
760040f0e13SKlap-in            $lines,
761040f0e13SKlap-in            $head,
762040f0e13SKlap-in            $tail,
763040f0e13SKlap-in            $eof
764040f0e13SKlap-in        );
765f9528c0cSKlap-in    }
766f9528c0cSKlap-in
767f9528c0cSKlap-in    /**
768f9528c0cSKlap-in     * Read chunk and return array with lines of given chunck.
769f9528c0cSKlap-in     * Has no check if $head and $tail are really at a new line
770f9528c0cSKlap-in     *
771f9528c0cSKlap-in     * @param $fp resource filepointer
772f9528c0cSKlap-in     * @param $head int start point chunck
773f9528c0cSKlap-in     * @param $tail int end point chunck
774f9528c0cSKlap-in     * @return array lines read from chunck
775f9528c0cSKlap-in     */
7768eccf945SGerrit Uitslag    protected function readChunk($fp, $head, $tail) {
777f9528c0cSKlap-in        $chunk = '';
778f9528c0cSKlap-in        $chunk_size = max($tail - $head, 0); // found chunk size
779f9528c0cSKlap-in        $got = 0;
780f9528c0cSKlap-in        fseek($fp, $head);
781f9528c0cSKlap-in        while($got < $chunk_size && !feof($fp)) {
78259cce2d9SGerrit Uitslag            $tmp = @fread($fp, max(min($this->chunk_size, $chunk_size - $got), 0));
783040f0e13SKlap-in            if($tmp === false) { //error state
784f9528c0cSKlap-in                break;
785040f0e13SKlap-in            }
786f9528c0cSKlap-in            $got += strlen($tmp);
787f9528c0cSKlap-in            $chunk .= $tmp;
788f9528c0cSKlap-in        }
789f9528c0cSKlap-in        $lines = explode("\n", $chunk);
790f9528c0cSKlap-in        array_pop($lines); // remove trailing newline
791f9528c0cSKlap-in        return $lines;
792f9528c0cSKlap-in    }
793f9528c0cSKlap-in
794f9528c0cSKlap-in    /**
795f9528c0cSKlap-in     * Set pointer to first new line after $finger and return its position
796f9528c0cSKlap-in     *
7971da8dc97SGerrit Uitslag     * @param resource $fp filepointer
798f9528c0cSKlap-in     * @param $finger int a pointer
799f9528c0cSKlap-in     * @return int pointer
800f9528c0cSKlap-in     */
8018eccf945SGerrit Uitslag    protected function getNewlinepointer($fp, $finger) {
802f9528c0cSKlap-in        fseek($fp, $finger);
80359cce2d9SGerrit Uitslag        $nl = $finger;
80459cce2d9SGerrit Uitslag        if($finger > 0) {
805f9528c0cSKlap-in            fgets($fp); // slip the finger forward to a new line
80659cce2d9SGerrit Uitslag            $nl = ftell($fp);
80759cce2d9SGerrit Uitslag        }
80859cce2d9SGerrit Uitslag        return $nl;
809f9528c0cSKlap-in    }
8108eccf945SGerrit Uitslag
8118eccf945SGerrit Uitslag    /**
8128eccf945SGerrit Uitslag     * Check whether given revision is the current page
8138eccf945SGerrit Uitslag     *
8148eccf945SGerrit Uitslag     * @param int $rev   timestamp of current page
8158eccf945SGerrit Uitslag     * @return bool true if $rev is current revision, otherwise false
8168eccf945SGerrit Uitslag     */
817ee33e0c5SGerrit Uitslag    public function isCurrentRevision($rev) {
818047bad06SGerrit Uitslag        return $rev == @filemtime($this->getFilename());
8198eccf945SGerrit Uitslag    }
82078b874e6Slisps
82178b874e6Slisps    /**
82278b874e6Slisps    * Return an existing revision for a specific date which is
82378b874e6Slisps    * the current one or younger or equal then the date
82478b874e6Slisps    *
82578b874e6Slisps    * @param string $id
82678b874e6Slisps    * @param number $date_at timestamp
82778b874e6Slisps    * @return string revision ('' for current)
82878b874e6Slisps    */
82978b874e6Slisps    function getLastRevisionAt($date_at){
83078b874e6Slisps        //requested date_at(timestamp) younger or equal then modified_time($this->id) => load current
83178b874e6Slisps        if($date_at >= @filemtime($this->getFilename())) {
83278b874e6Slisps            return '';
83378b874e6Slisps        } else if ($rev = $this->getRelativeRevision($date_at+1, -1)) { //+1 to get also the requested date revision
83478b874e6Slisps            return $rev;
83578b874e6Slisps        } else {
83678b874e6Slisps            return false;
83778b874e6Slisps        }
83878b874e6Slisps    }
839*f2643d9fSlisps
840*f2643d9fSlisps    /**
8411da8dc97SGerrit Uitslag     * Returns the next lines of the changelog  of the chunck before head or after tail
8421da8dc97SGerrit Uitslag     *
8431da8dc97SGerrit Uitslag     * @param resource $fp filepointer
8441da8dc97SGerrit Uitslag     * @param int $head position head of last chunk
8451da8dc97SGerrit Uitslag     * @param int $tail position tail of last chunk
8461da8dc97SGerrit Uitslag     * @param int $direction positive forward, negative backward
8471da8dc97SGerrit Uitslag     * @return array with entries:
8481da8dc97SGerrit Uitslag     *    - $lines: changelog lines of readed chunk
8491da8dc97SGerrit Uitslag     *    - $head: head of chunk
8501da8dc97SGerrit Uitslag     *    - $tail: tail of chunk
8511da8dc97SGerrit Uitslag     */
8521da8dc97SGerrit Uitslag    protected function readAdjacentChunk($fp, $head, $tail, $direction) {
8531da8dc97SGerrit Uitslag        if(!$fp) return array(array(), $head, $tail);
8541da8dc97SGerrit Uitslag
8551da8dc97SGerrit Uitslag        if($direction > 0) {
8561da8dc97SGerrit Uitslag            //read forward
8571da8dc97SGerrit Uitslag            $head = $tail;
8581da8dc97SGerrit Uitslag            $tail = $head + floor($this->chunk_size * (2 / 3));
8591da8dc97SGerrit Uitslag            $tail = $this->getNewlinepointer($fp, $tail);
8601da8dc97SGerrit Uitslag        } else {
8611da8dc97SGerrit Uitslag            //read backward
8621da8dc97SGerrit Uitslag            $tail = $head;
8631da8dc97SGerrit Uitslag            $head = max($tail - $this->chunk_size, 0);
8641da8dc97SGerrit Uitslag            while(true) {
8651da8dc97SGerrit Uitslag                $nl = $this->getNewlinepointer($fp, $head);
8661da8dc97SGerrit Uitslag                // was the chunk big enough? if not, take another bite
8671da8dc97SGerrit Uitslag                if($nl > 0 && $tail <= $nl) {
8681da8dc97SGerrit Uitslag                    $head = max($head - $this->chunk_size, 0);
8691da8dc97SGerrit Uitslag                } else {
8701da8dc97SGerrit Uitslag                    $head = $nl;
8711da8dc97SGerrit Uitslag                    break;
8721da8dc97SGerrit Uitslag                }
8731da8dc97SGerrit Uitslag            }
8748eccf945SGerrit Uitslag        }
8758eccf945SGerrit Uitslag
8761da8dc97SGerrit Uitslag        //load next chunck
8771da8dc97SGerrit Uitslag        $lines = $this->readChunk($fp, $head, $tail);
8781da8dc97SGerrit Uitslag        return array($lines, $head, $tail);
8791da8dc97SGerrit Uitslag    }
8801da8dc97SGerrit Uitslag
8811da8dc97SGerrit Uitslag    /**
8821da8dc97SGerrit Uitslag     * Collect the $max revisions near to the timestamp $rev
8831da8dc97SGerrit Uitslag     *
8841da8dc97SGerrit Uitslag     * @param int $rev revision timestamp
8851da8dc97SGerrit Uitslag     * @param int $max maximum number of revisions to be returned
8861da8dc97SGerrit Uitslag     * @return bool|array
8871da8dc97SGerrit Uitslag     *     return array with entries:
8881da8dc97SGerrit Uitslag     *       - $requestedrevs: array of with $max revision timestamps
8891da8dc97SGerrit Uitslag     *       - $revs: all parsed revision timestamps
8901da8dc97SGerrit Uitslag     *       - $fp: filepointer only defined for chuck reading, needs closing.
8911da8dc97SGerrit Uitslag     *       - $lines: non-parsed changelog lines before the parsed revisions
8921da8dc97SGerrit Uitslag     *       - $head: position of first readed changelogline
8931da8dc97SGerrit Uitslag     *       - $lasttail: position of end of last readed changelogline
8941da8dc97SGerrit Uitslag     *     otherwise false
8951da8dc97SGerrit Uitslag     */
8961da8dc97SGerrit Uitslag    protected function retrieveRevisionsAround($rev, $max) {
8971da8dc97SGerrit Uitslag        //get lines from changelog
8981da8dc97SGerrit Uitslag        list($fp, $lines, $starthead, $starttail, $eof) = $this->readloglines($rev);
8991da8dc97SGerrit Uitslag        if(empty($lines)) return false;
9001da8dc97SGerrit Uitslag
9011da8dc97SGerrit Uitslag        //parse chunk containing $rev, and read forward more chunks until $max/2 is reached
9021da8dc97SGerrit Uitslag        $head = $starthead;
9031da8dc97SGerrit Uitslag        $tail = $starttail;
9041da8dc97SGerrit Uitslag        $revs = array();
9051da8dc97SGerrit Uitslag        $aftercount = $beforecount = 0;
9061da8dc97SGerrit Uitslag        while(count($lines) > 0) {
9071da8dc97SGerrit Uitslag            foreach($lines as $line) {
9081da8dc97SGerrit Uitslag                $tmp = parseChangelogLine($line);
9091da8dc97SGerrit Uitslag                if($tmp !== false) {
9101da8dc97SGerrit Uitslag                    $this->cache[$this->id][$tmp['date']] = $tmp;
9111da8dc97SGerrit Uitslag                    $revs[] = $tmp['date'];
9121da8dc97SGerrit Uitslag                    if($tmp['date'] >= $rev) {
9131da8dc97SGerrit Uitslag                        //count revs after reference $rev
9141da8dc97SGerrit Uitslag                        $aftercount++;
9151da8dc97SGerrit Uitslag                        if($aftercount == 1) $beforecount = count($revs);
9161da8dc97SGerrit Uitslag                    }
9171da8dc97SGerrit Uitslag                    //enough revs after reference $rev?
9181da8dc97SGerrit Uitslag                    if($aftercount > floor($max / 2)) break 2;
9191da8dc97SGerrit Uitslag                }
9201da8dc97SGerrit Uitslag            }
9211da8dc97SGerrit Uitslag            //retrieve next chunk
9221da8dc97SGerrit Uitslag            list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, 1);
9231da8dc97SGerrit Uitslag        }
9241da8dc97SGerrit Uitslag        if($aftercount == 0) return false;
9251da8dc97SGerrit Uitslag
9261da8dc97SGerrit Uitslag        $lasttail = $tail;
9271da8dc97SGerrit Uitslag
9281da8dc97SGerrit Uitslag        //read additional chuncks backward until $max/2 is reached and total number of revs is equal to $max
9291da8dc97SGerrit Uitslag        $lines = array();
9301da8dc97SGerrit Uitslag        $i = 0;
9311da8dc97SGerrit Uitslag        if($aftercount > 0) {
9321da8dc97SGerrit Uitslag            $head = $starthead;
9331da8dc97SGerrit Uitslag            $tail = $starttail;
9341da8dc97SGerrit Uitslag            while($head > 0) {
9351da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1);
9361da8dc97SGerrit Uitslag
9371da8dc97SGerrit Uitslag                for($i = count($lines) - 1; $i >= 0; $i--) {
9381da8dc97SGerrit Uitslag                    $tmp = parseChangelogLine($lines[$i]);
9391da8dc97SGerrit Uitslag                    if($tmp !== false) {
9401da8dc97SGerrit Uitslag                        $this->cache[$this->id][$tmp['date']] = $tmp;
9411da8dc97SGerrit Uitslag                        $revs[] = $tmp['date'];
9421da8dc97SGerrit Uitslag                        $beforecount++;
9431da8dc97SGerrit Uitslag                        //enough revs before reference $rev?
9441da8dc97SGerrit Uitslag                        if($beforecount > max(floor($max / 2), $max - $aftercount)) break 2;
9451da8dc97SGerrit Uitslag                    }
9461da8dc97SGerrit Uitslag                }
9471da8dc97SGerrit Uitslag            }
9481da8dc97SGerrit Uitslag        }
9491da8dc97SGerrit Uitslag        sort($revs);
9501da8dc97SGerrit Uitslag
9511da8dc97SGerrit Uitslag        //keep only non-parsed lines
9521da8dc97SGerrit Uitslag        $lines = array_slice($lines, 0, $i);
9531da8dc97SGerrit Uitslag        //trunk desired selection
9541da8dc97SGerrit Uitslag        $requestedrevs = array_slice($revs, -$max, $max);
9551da8dc97SGerrit Uitslag
9561da8dc97SGerrit Uitslag        return array($requestedrevs, $revs, $fp, $lines, $head, $lasttail);
9571da8dc97SGerrit Uitslag    }
9581da8dc97SGerrit Uitslag}
9591da8dc97SGerrit Uitslag
9601da8dc97SGerrit Uitslag/**
9611da8dc97SGerrit Uitslag * Class PageChangelog handles changelog of a wiki page
9621da8dc97SGerrit Uitslag */
963047bad06SGerrit Uitslagclass PageChangelog extends ChangeLog {
964047bad06SGerrit Uitslag
965047bad06SGerrit Uitslag    /**
966047bad06SGerrit Uitslag     * Returns path to changelog
967047bad06SGerrit Uitslag     *
968047bad06SGerrit Uitslag     * @return string path to file
969047bad06SGerrit Uitslag     */
970047bad06SGerrit Uitslag    protected function getChangelogFilename() {
971047bad06SGerrit Uitslag        return metaFN($this->id, '.changes');
972047bad06SGerrit Uitslag    }
973047bad06SGerrit Uitslag
974047bad06SGerrit Uitslag    /**
975047bad06SGerrit Uitslag     * Returns path to current page/media
976047bad06SGerrit Uitslag     *
977047bad06SGerrit Uitslag     * @return string path to file
978047bad06SGerrit Uitslag     */
979047bad06SGerrit Uitslag    protected function getFilename() {
980047bad06SGerrit Uitslag        return wikiFN($this->id);
981047bad06SGerrit Uitslag    }
982047bad06SGerrit Uitslag}
983047bad06SGerrit Uitslag
9841da8dc97SGerrit Uitslag/**
9851da8dc97SGerrit Uitslag * Class MediaChangelog handles changelog of a media file
9861da8dc97SGerrit Uitslag */
987047bad06SGerrit Uitslagclass MediaChangelog extends ChangeLog {
988047bad06SGerrit Uitslag
989047bad06SGerrit Uitslag    /**
990047bad06SGerrit Uitslag     * Returns path to changelog
991047bad06SGerrit Uitslag     *
992047bad06SGerrit Uitslag     * @return string path to file
993047bad06SGerrit Uitslag     */
994047bad06SGerrit Uitslag    protected function getChangelogFilename() {
995047bad06SGerrit Uitslag        return mediaMetaFN($this->id, '.changes');
996047bad06SGerrit Uitslag    }
997047bad06SGerrit Uitslag
998047bad06SGerrit Uitslag    /**
999047bad06SGerrit Uitslag     * Returns path to current page/media
1000047bad06SGerrit Uitslag     *
1001047bad06SGerrit Uitslag     * @return string path to file
1002047bad06SGerrit Uitslag     */
1003047bad06SGerrit Uitslag    protected function getFilename() {
1004047bad06SGerrit Uitslag        return mediaFN($this->id);
1005047bad06SGerrit Uitslag    }
1006047bad06SGerrit Uitslag}
1007047bad06SGerrit Uitslag
10088eccf945SGerrit Uitslag/**
10098eccf945SGerrit Uitslag * Get the changelog information for a specific page id
10108eccf945SGerrit Uitslag * and revision (timestamp). Adjacent changelog lines
10118eccf945SGerrit Uitslag * are optimistically parsed and cached to speed up
10128eccf945SGerrit Uitslag * consecutive calls to getRevisionInfo. For large
10138eccf945SGerrit Uitslag * changelog files, only the chunk containing the
10148eccf945SGerrit Uitslag * requested changelog line is read.
10158eccf945SGerrit Uitslag *
10168eccf945SGerrit Uitslag * @deprecated 20-11-2013
10178eccf945SGerrit Uitslag *
10188eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net>
10198eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net>
10208eccf945SGerrit Uitslag */
10218eccf945SGerrit Uitslagfunction getRevisionInfo($id, $rev, $chunk_size = 8192, $media = false) {
1022047bad06SGerrit Uitslag    if($media) {
1023047bad06SGerrit Uitslag        $changelog = new MediaChangeLog($id, $chunk_size);
1024047bad06SGerrit Uitslag    } else {
1025047bad06SGerrit Uitslag        $changelog = new PageChangeLog($id, $chunk_size);
1026047bad06SGerrit Uitslag    }
1027047bad06SGerrit Uitslag    return $changelog->getRevisionInfo($rev);
10288eccf945SGerrit Uitslag}
10298eccf945SGerrit Uitslag
10308eccf945SGerrit Uitslag/**
10318eccf945SGerrit Uitslag * Return a list of page revisions numbers
10328eccf945SGerrit Uitslag * Does not guarantee that the revision exists in the attic,
10338eccf945SGerrit Uitslag * only that a line with the date exists in the changelog.
10348eccf945SGerrit Uitslag * By default the current revision is skipped.
10358eccf945SGerrit Uitslag *
10368eccf945SGerrit Uitslag * id:    the page of interest
10378eccf945SGerrit Uitslag * first: skip the first n changelog lines
10388eccf945SGerrit Uitslag * num:   number of revisions to return
10398eccf945SGerrit Uitslag *
10408eccf945SGerrit Uitslag * The current revision is automatically skipped when the page exists.
10418eccf945SGerrit Uitslag * See $INFO['meta']['last_change'] for the current revision.
10428eccf945SGerrit Uitslag *
10438eccf945SGerrit Uitslag * For efficiency, the log lines are parsed and cached for later
10448eccf945SGerrit Uitslag * calls to getRevisionInfo. Large changelog files are read
10458eccf945SGerrit Uitslag * backwards in chunks until the requested number of changelog
10468eccf945SGerrit Uitslag * lines are recieved.
10478eccf945SGerrit Uitslag *
10488eccf945SGerrit Uitslag * @deprecated 20-11-2013
10498eccf945SGerrit Uitslag *
10508eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net>
10518eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net>
10528eccf945SGerrit Uitslag */
10538eccf945SGerrit Uitslagfunction getRevisions($id, $first, $num, $chunk_size = 8192, $media = false) {
1054047bad06SGerrit Uitslag    if($media) {
1055047bad06SGerrit Uitslag        $changelog = new MediaChangeLog($id, $chunk_size);
1056047bad06SGerrit Uitslag    } else {
1057047bad06SGerrit Uitslag        $changelog = new PageChangeLog($id, $chunk_size);
1058047bad06SGerrit Uitslag    }
1059047bad06SGerrit Uitslag    return $changelog->getRevisions($first, $num);
10608eccf945SGerrit Uitslag}
10615c2eed9aSlisps
1062