xref: /dokuwiki/inc/changelog.php (revision fed2ee900d012e5ebccad2796d0850034ac7729b)
17d559c7fSBen Coburn<?php
27d559c7fSBen Coburn/**
37d559c7fSBen Coburn * Changelog handling functions
47d559c7fSBen Coburn *
57d559c7fSBen Coburn * @license    GPL 2 (http://www.gnu.org/licenses/gpl.html)
67d559c7fSBen Coburn * @author     Andreas Gohr <andi@splitbrain.org>
77d559c7fSBen Coburn */
87d559c7fSBen Coburn
9ebf1501fSBen Coburn// Constants for known core changelog line types.
10ebf1501fSBen Coburn// Use these in place of string literals for more readable code.
11ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_CREATE',       'C');
12ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_EDIT',         'E');
13ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_MINOR_EDIT',   'e');
14ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_DELETE',       'D');
15ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_REVERT',       'R');
16ebf1501fSBen Coburn
177d559c7fSBen Coburn/**
187d559c7fSBen Coburn * parses a changelog line into it's components
197d559c7fSBen Coburn *
207d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
214f1e2cb3SGerrit Uitslag *
224f1e2cb3SGerrit Uitslag * @param string $line changelog line
234f1e2cb3SGerrit Uitslag * @return array|bool parsed line or false
247d559c7fSBen Coburn */
257d559c7fSBen Coburnfunction parseChangelogLine($line) {
267d559c7fSBen Coburn    $tmp = explode("\t", $line);
277d559c7fSBen Coburn    if ($tmp!==false && count($tmp)>1) {
287d559c7fSBen Coburn        $info = array();
29e16d739eSBen Coburn        $info['date']  = (int)$tmp[0]; // unix timestamp
307d559c7fSBen Coburn        $info['ip']    = $tmp[1]; // IPv4 address (127.0.0.1)
317d559c7fSBen Coburn        $info['type']  = $tmp[2]; // log line type
327d559c7fSBen Coburn        $info['id']    = $tmp[3]; // page id
337d559c7fSBen Coburn        $info['user']  = $tmp[4]; // user name
347d559c7fSBen Coburn        $info['sum']   = $tmp[5]; // edit summary (or action reason)
357d559c7fSBen Coburn        $info['extra'] = rtrim($tmp[6], "\n"); // extra data (varies by line type)
367d559c7fSBen Coburn        return $info;
377d559c7fSBen Coburn    } else { return false; }
387d559c7fSBen Coburn}
397d559c7fSBen Coburn
407d559c7fSBen Coburn/**
417d559c7fSBen Coburn * Add's an entry to the changelog and saves the metadata for the page
427d559c7fSBen Coburn *
43a365baeeSDominik Eckelmann * @param int    $date      Timestamp of the change
44a365baeeSDominik Eckelmann * @param String $id        Name of the affected page
45a365baeeSDominik Eckelmann * @param String $type      Type of the change see DOKU_CHANGE_TYPE_*
46a365baeeSDominik Eckelmann * @param String $summary   Summary of the change
47a365baeeSDominik Eckelmann * @param mixed  $extra     In case of a revert the revision (timestmp) of the reverted page
48a365baeeSDominik Eckelmann * @param array  $flags     Additional flags in a key value array.
494f1e2cb3SGerrit Uitslag *                             Available flags:
50a365baeeSDominik Eckelmann *                             - ExternalEdit - mark as an external edit.
51a365baeeSDominik Eckelmann *
527d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org>
537d559c7fSBen Coburn * @author Esther Brunner <wikidesign@gmail.com>
547d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
557d559c7fSBen Coburn */
56ebf1501fSBen Coburnfunction addLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){
577d559c7fSBen Coburn    global $conf, $INFO;
58585bf44eSChristopher Smith    /** @var Input $INPUT */
59585bf44eSChristopher Smith    global $INPUT;
607d559c7fSBen Coburn
615aa52fafSBen Coburn    // check for special flags as keys
625aa52fafSBen Coburn    if (!is_array($flags)) { $flags = array(); }
635aa52fafSBen Coburn    $flagExternalEdit = isset($flags['ExternalEdit']);
645aa52fafSBen Coburn
657d559c7fSBen Coburn    $id = cleanid($id);
667d559c7fSBen Coburn    $file = wikiFN($id);
677d559c7fSBen Coburn    $created = @filectime($file);
68ebf1501fSBen Coburn    $minor = ($type===DOKU_CHANGE_TYPE_MINOR_EDIT);
69ebf1501fSBen Coburn    $wasRemoved = ($type===DOKU_CHANGE_TYPE_DELETE);
707d559c7fSBen Coburn
717d559c7fSBen Coburn    if(!$date) $date = time(); //use current time if none supplied
722f9daf16SAndreas Gohr    $remote = (!$flagExternalEdit)?clientIP(true):'127.0.0.1';
73585bf44eSChristopher Smith    $user   = (!$flagExternalEdit)?$INPUT->server->str('REMOTE_USER'):'';
747d559c7fSBen Coburn
757d559c7fSBen Coburn    $strip = array("\t", "\n");
767d559c7fSBen Coburn    $logline = array(
777d559c7fSBen Coburn            'date'  => $date,
787d559c7fSBen Coburn            'ip'    => $remote,
797d559c7fSBen Coburn            'type'  => str_replace($strip, '', $type),
807d559c7fSBen Coburn            'id'    => $id,
817d559c7fSBen Coburn            'user'  => $user,
827fa35bb1SAndreas Gohr            'sum'   => utf8_substr(str_replace($strip, '', $summary),0,255),
837d559c7fSBen Coburn            'extra' => str_replace($strip, '', $extra)
847d559c7fSBen Coburn            );
857d559c7fSBen Coburn
86*fed2ee90SGerrit Uitslag    $wasCreated = ($type===DOKU_CHANGE_TYPE_CREATE);
87*fed2ee90SGerrit Uitslag    $wasReverted = ($type===DOKU_CHANGE_TYPE_REVERT);
887d559c7fSBen Coburn    // update metadata
897d559c7fSBen Coburn    if (!$wasRemoved) {
903d1f9ec3SMichael Klier        $oldmeta = p_read_metadata($id);
917d559c7fSBen Coburn        $meta    = array();
92*fed2ee90SGerrit Uitslag        if ($wasCreated && empty($oldmeta['persistent']['date']['created'])){ // newly created
937d559c7fSBen Coburn            $meta['date']['created'] = $created;
94a8e72133SAndreas Gohr            if ($user){
95a8e72133SAndreas Gohr                $meta['creator'] = $INFO['userinfo']['name'];
96a8e72133SAndreas Gohr                $meta['user']    = $user;
97a8e72133SAndreas Gohr            }
98*fed2ee90SGerrit Uitslag        } elseif (($wasCreated || $wasReverted) && !empty($oldmeta['persistent']['date']['created'])) { // re-created / restored
993d1f9ec3SMichael Klier            $meta['date']['created']  = $oldmeta['persistent']['date']['created'];
1003d1f9ec3SMichael Klier            $meta['date']['modified'] = $created; // use the files ctime here
1013d1f9ec3SMichael Klier            $meta['creator'] = $oldmeta['persistent']['creator'];
1023d1f9ec3SMichael Klier            if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name'];
1037d559c7fSBen Coburn        } elseif (!$minor) {   // non-minor modification
1047d559c7fSBen Coburn            $meta['date']['modified'] = $date;
1057d559c7fSBen Coburn            if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name'];
1067d559c7fSBen Coburn        }
1077d559c7fSBen Coburn        $meta['last_change'] = $logline;
108ee4d22e0SChristopher Smith        p_set_metadata($id, $meta);
1097d559c7fSBen Coburn    }
1107d559c7fSBen Coburn
1117d559c7fSBen Coburn    // add changelog lines
1127d559c7fSBen Coburn    $logline = implode("\t", $logline)."\n";
1137d559c7fSBen Coburn    io_saveFile(metaFN($id,'.changes'),$logline,true); //page changelog
1147d559c7fSBen Coburn    io_saveFile($conf['changelog'],$logline,true); //global changelog cache
1157d559c7fSBen Coburn}
1167d559c7fSBen Coburn
1177d559c7fSBen Coburn/**
11899c8d7f2Smichael * Add's an entry to the media changelog
11999c8d7f2Smichael *
12099c8d7f2Smichael * @author Michael Hamann <michael@content-space.de>
12199c8d7f2Smichael * @author Andreas Gohr <andi@splitbrain.org>
12299c8d7f2Smichael * @author Esther Brunner <wikidesign@gmail.com>
12399c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net>
1244f1e2cb3SGerrit Uitslag *
1254f1e2cb3SGerrit Uitslag * @param int    $date      Timestamp of the change
1264f1e2cb3SGerrit Uitslag * @param String $id        Name of the affected page
1274f1e2cb3SGerrit Uitslag * @param String $type      Type of the change see DOKU_CHANGE_TYPE_*
1284f1e2cb3SGerrit Uitslag * @param String $summary   Summary of the change
1294f1e2cb3SGerrit Uitslag * @param mixed  $extra     In case of a revert the revision (timestmp) of the reverted page
1304f1e2cb3SGerrit Uitslag * @param array  $flags     Additional flags in a key value array.
1314f1e2cb3SGerrit Uitslag *                             Available flags:
1324f1e2cb3SGerrit Uitslag *                             - (none, so far)
13399c8d7f2Smichael */
13499c8d7f2Smichaelfunction addMediaLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){
135de3eb1d7SAdrian Lang    global $conf;
136585bf44eSChristopher Smith    /** @var Input $INPUT */
137585bf44eSChristopher Smith    global $INPUT;
13899c8d7f2Smichael
13999c8d7f2Smichael    $id = cleanid($id);
14099c8d7f2Smichael
14199c8d7f2Smichael    if(!$date) $date = time(); //use current time if none supplied
1422f9daf16SAndreas Gohr    $remote = clientIP(true);
143585bf44eSChristopher Smith    $user   = $INPUT->server->str('REMOTE_USER');
14499c8d7f2Smichael
14599c8d7f2Smichael    $strip = array("\t", "\n");
14699c8d7f2Smichael    $logline = array(
14799c8d7f2Smichael            'date'  => $date,
14899c8d7f2Smichael            'ip'    => $remote,
14999c8d7f2Smichael            'type'  => str_replace($strip, '', $type),
15099c8d7f2Smichael            'id'    => $id,
15199c8d7f2Smichael            'user'  => $user,
1527fa35bb1SAndreas Gohr            'sum'   => utf8_substr(str_replace($strip, '', $summary),0,255),
15399c8d7f2Smichael            'extra' => str_replace($strip, '', $extra)
15499c8d7f2Smichael            );
15599c8d7f2Smichael
15699c8d7f2Smichael    // add changelog lines
15799c8d7f2Smichael    $logline = implode("\t", $logline)."\n";
15899c8d7f2Smichael    io_saveFile($conf['media_changelog'],$logline,true); //global media changelog cache
159e4f389efSKate Arzamastseva    io_saveFile(mediaMetaFN($id,'.changes'),$logline,true); //media file's changelog
16099c8d7f2Smichael}
16199c8d7f2Smichael
16299c8d7f2Smichael/**
1637d559c7fSBen Coburn * returns an array of recently changed files using the
1647d559c7fSBen Coburn * changelog
1657d559c7fSBen Coburn *
1667d559c7fSBen Coburn * The following constants can be used to control which changes are
1677d559c7fSBen Coburn * included. Add them together as needed.
1687d559c7fSBen Coburn *
1697d559c7fSBen Coburn * RECENTS_SKIP_DELETED   - don't include deleted pages
1707d559c7fSBen Coburn * RECENTS_SKIP_MINORS    - don't include minor changes
1717d559c7fSBen Coburn * RECENTS_SKIP_SUBSPACES - don't include subspaces
1720b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES  - return media changes instead of page changes
1730b926329SKate Arzamastseva * RECENTS_MEDIA_PAGES_MIXED  - return both media changes and page changes
1747d559c7fSBen Coburn *
1757d559c7fSBen Coburn * @param int    $first   number of first entry returned (for paginating
1767d559c7fSBen Coburn * @param int    $num     return $num entries
1777d559c7fSBen Coburn * @param string $ns      restrict to given namespace
17859f20ea3SMichael Hamann * @param int    $flags   see above
17959f20ea3SMichael Hamann * @return array recently changed files
1807d559c7fSBen Coburn *
1817d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
18229778747SKate Arzamastseva * @author Kate Arzamastseva <pshns@ukr.net>
1837d559c7fSBen Coburn */
1847d559c7fSBen Coburnfunction getRecents($first,$num,$ns='',$flags=0){
1857d559c7fSBen Coburn    global $conf;
1867d559c7fSBen Coburn    $recent = array();
1877d559c7fSBen Coburn    $count  = 0;
1887d559c7fSBen Coburn
1897d559c7fSBen Coburn    if(!$num)
1907d559c7fSBen Coburn        return $recent;
1917d559c7fSBen Coburn
1927d559c7fSBen Coburn    // read all recent changes. (kept short)
1930b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_CHANGES) {
19499c8d7f2Smichael        $lines = @file($conf['media_changelog']);
19599c8d7f2Smichael    } else {
19676d47b34SDavid Lorentsen        $lines = @file($conf['changelog']);
19799c8d7f2Smichael    }
19829778747SKate Arzamastseva    $lines_position = count($lines)-1;
19959f20ea3SMichael Hamann    $media_lines_position = 0;
20059f20ea3SMichael Hamann    $media_lines = array();
20129778747SKate Arzamastseva
2020b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_PAGES_MIXED) {
20329778747SKate Arzamastseva        $media_lines = @file($conf['media_changelog']);
20429778747SKate Arzamastseva        $media_lines_position = count($media_lines)-1;
20529778747SKate Arzamastseva    }
20629778747SKate Arzamastseva
20729778747SKate Arzamastseva    $seen = array(); // caches seen lines, _handleRecent() skips them
2087d559c7fSBen Coburn
2097d559c7fSBen Coburn    // handle lines
2100b926329SKate Arzamastseva    while ($lines_position >= 0 || (($flags & RECENTS_MEDIA_PAGES_MIXED) && $media_lines_position >=0)) {
21129778747SKate Arzamastseva        if (empty($rec) && $lines_position >= 0) {
2121d901ab2SAndreas Gohr            $rec = _handleRecent(@$lines[$lines_position], $ns, $flags, $seen);
21329778747SKate Arzamastseva            if (!$rec) {
21429778747SKate Arzamastseva                $lines_position --;
21529778747SKate Arzamastseva                continue;
21629778747SKate Arzamastseva            }
21729778747SKate Arzamastseva        }
2180b926329SKate Arzamastseva        if (($flags & RECENTS_MEDIA_PAGES_MIXED) && empty($media_rec) && $media_lines_position >= 0) {
21942025dfdSMichael Hamann            $media_rec = _handleRecent(@$media_lines[$media_lines_position], $ns, $flags | RECENTS_MEDIA_CHANGES, $seen);
22029778747SKate Arzamastseva            if (!$media_rec) {
22129778747SKate Arzamastseva                $media_lines_position --;
22229778747SKate Arzamastseva                continue;
22329778747SKate Arzamastseva            }
22429778747SKate Arzamastseva        }
2250b926329SKate Arzamastseva        if (($flags & RECENTS_MEDIA_PAGES_MIXED) && @$media_rec['date'] >= @$rec['date']) {
22629778747SKate Arzamastseva            $media_lines_position--;
22729778747SKate Arzamastseva            $x = $media_rec;
228b5941dfaSKate Arzamastseva            $x['media'] = true;
22929778747SKate Arzamastseva            $media_rec = false;
23029778747SKate Arzamastseva        } else {
23129778747SKate Arzamastseva            $lines_position--;
23229778747SKate Arzamastseva            $x = $rec;
233421ec38eSKate Arzamastseva            if ($flags & RECENTS_MEDIA_CHANGES) $x['media'] = true;
23429778747SKate Arzamastseva            $rec = false;
23529778747SKate Arzamastseva        }
2367d559c7fSBen Coburn        if(--$first >= 0) continue; // skip first entries
23729778747SKate Arzamastseva        $recent[] = $x;
2387d559c7fSBen Coburn        $count++;
2397d559c7fSBen Coburn        // break when we have enough entries
2407d559c7fSBen Coburn        if($count >= $num){ break; }
2417d559c7fSBen Coburn    }
2427d559c7fSBen Coburn    return $recent;
2437d559c7fSBen Coburn}
2447d559c7fSBen Coburn
2457d559c7fSBen Coburn/**
24699c8d7f2Smichael * returns an array of files changed since a given time using the
24799c8d7f2Smichael * changelog
24899c8d7f2Smichael *
24999c8d7f2Smichael * The following constants can be used to control which changes are
25099c8d7f2Smichael * included. Add them together as needed.
25199c8d7f2Smichael *
25299c8d7f2Smichael * RECENTS_SKIP_DELETED   - don't include deleted pages
25399c8d7f2Smichael * RECENTS_SKIP_MINORS    - don't include minor changes
25499c8d7f2Smichael * RECENTS_SKIP_SUBSPACES - don't include subspaces
2550b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES  - return media changes instead of page changes
25699c8d7f2Smichael *
25799c8d7f2Smichael * @param int    $from    date of the oldest entry to return
25899c8d7f2Smichael * @param int    $to      date of the newest entry to return (for pagination, optional)
25999c8d7f2Smichael * @param string $ns      restrict to given namespace (optional)
26059f20ea3SMichael Hamann * @param int    $flags   see above (optional)
26159f20ea3SMichael Hamann * @return array of files
26299c8d7f2Smichael *
26399c8d7f2Smichael * @author Michael Hamann <michael@content-space.de>
26499c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net>
26599c8d7f2Smichael */
26699c8d7f2Smichaelfunction getRecentsSince($from,$to=null,$ns='',$flags=0){
26799c8d7f2Smichael    global $conf;
26899c8d7f2Smichael    $recent = array();
26999c8d7f2Smichael
27099c8d7f2Smichael    if($to && $to < $from)
27199c8d7f2Smichael        return $recent;
27299c8d7f2Smichael
27399c8d7f2Smichael    // read all recent changes. (kept short)
2740b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_CHANGES) {
27599c8d7f2Smichael        $lines = @file($conf['media_changelog']);
27699c8d7f2Smichael    } else {
27799c8d7f2Smichael        $lines = @file($conf['changelog']);
27899c8d7f2Smichael    }
279e920a0a1SAndreas Gohr    if(!$lines) return $recent;
28099c8d7f2Smichael
28199c8d7f2Smichael    // we start searching at the end of the list
28299c8d7f2Smichael    $lines = array_reverse($lines);
28399c8d7f2Smichael
28499c8d7f2Smichael    // handle lines
28599c8d7f2Smichael    $seen = array(); // caches seen lines, _handleRecent() skips them
28699c8d7f2Smichael
28799c8d7f2Smichael    foreach($lines as $line){
28899c8d7f2Smichael        $rec = _handleRecent($line, $ns, $flags, $seen);
28999c8d7f2Smichael        if($rec !== false) {
29099c8d7f2Smichael            if ($rec['date'] >= $from) {
29199c8d7f2Smichael                if (!$to || $rec['date'] <= $to) {
29299c8d7f2Smichael                    $recent[] = $rec;
29399c8d7f2Smichael                }
29499c8d7f2Smichael            } else {
29599c8d7f2Smichael                break;
29699c8d7f2Smichael            }
29799c8d7f2Smichael        }
29899c8d7f2Smichael    }
29999c8d7f2Smichael
30099c8d7f2Smichael    return array_reverse($recent);
30199c8d7f2Smichael}
30299c8d7f2Smichael
30399c8d7f2Smichael/**
3047d559c7fSBen Coburn * Internal function used by getRecents
3057d559c7fSBen Coburn *
3067d559c7fSBen Coburn * don't call directly
3077d559c7fSBen Coburn *
3087d559c7fSBen Coburn * @see getRecents()
3097d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org>
3107d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
3114f1e2cb3SGerrit Uitslag *
3124f1e2cb3SGerrit Uitslag * @param string $line   changelog line
3134f1e2cb3SGerrit Uitslag * @param string $ns     restrict to given namespace
3144f1e2cb3SGerrit Uitslag * @param int    $flags  flags to control which changes are included
3154f1e2cb3SGerrit Uitslag * @param array  $seen   listing of seen pages
3164f1e2cb3SGerrit Uitslag * @return array|bool    false or array with info about a change
3177d559c7fSBen Coburn */
31899c8d7f2Smichaelfunction _handleRecent($line,$ns,$flags,&$seen){
3197d559c7fSBen Coburn    if(empty($line)) return false;   //skip empty lines
3207d559c7fSBen Coburn
3217d559c7fSBen Coburn    // split the line into parts
3227d559c7fSBen Coburn    $recent = parseChangelogLine($line);
3237d559c7fSBen Coburn    if ($recent===false) { return false; }
3247d559c7fSBen Coburn
3257d559c7fSBen Coburn    // skip seen ones
3267d559c7fSBen Coburn    if(isset($seen[$recent['id']])) return false;
3277d559c7fSBen Coburn
3287d559c7fSBen Coburn    // skip minors
329ebf1501fSBen Coburn    if($recent['type']===DOKU_CHANGE_TYPE_MINOR_EDIT && ($flags & RECENTS_SKIP_MINORS)) return false;
3307d559c7fSBen Coburn
3317d559c7fSBen Coburn    // remember in seen to skip additional sights
3327d559c7fSBen Coburn    $seen[$recent['id']] = 1;
3337d559c7fSBen Coburn
3347d559c7fSBen Coburn    // check if it's a hidden page
3357d559c7fSBen Coburn    if(isHiddenPage($recent['id'])) return false;
3367d559c7fSBen Coburn
3377d559c7fSBen Coburn    // filter namespace
3387d559c7fSBen Coburn    if (($ns) && (strpos($recent['id'],$ns.':') !== 0)) return false;
3397d559c7fSBen Coburn
3407d559c7fSBen Coburn    // exclude subnamespaces
3417d559c7fSBen Coburn    if (($flags & RECENTS_SKIP_SUBSPACES) && (getNS($recent['id']) != $ns)) return false;
3427d559c7fSBen Coburn
3437d559c7fSBen Coburn    // check ACL
34442025dfdSMichael Hamann    if ($flags & RECENTS_MEDIA_CHANGES) {
34542025dfdSMichael Hamann        $recent['perms'] = auth_quickaclcheck(getNS($recent['id']).':*');
34642025dfdSMichael Hamann    } else {
34799c8d7f2Smichael        $recent['perms'] = auth_quickaclcheck($recent['id']);
34842025dfdSMichael Hamann    }
34999c8d7f2Smichael    if ($recent['perms'] < AUTH_READ) return false;
3507d559c7fSBen Coburn
3517d559c7fSBen Coburn    // check existance
3521d901ab2SAndreas Gohr    if($flags & RECENTS_SKIP_DELETED){
35342025dfdSMichael Hamann        $fn = (($flags & RECENTS_MEDIA_CHANGES) ? mediaFN($recent['id']) : wikiFN($recent['id']));
3541d901ab2SAndreas Gohr        if(!@file_exists($fn)) return false;
3551d901ab2SAndreas Gohr    }
3567d559c7fSBen Coburn
3577d559c7fSBen Coburn    return $recent;
3587d559c7fSBen Coburn}
3597d559c7fSBen Coburn
3607d559c7fSBen Coburn/**
361047bad06SGerrit Uitslag * Class ChangeLog
362047bad06SGerrit Uitslag * methods for handling of changelog of pages or media files
3638eccf945SGerrit Uitslag */
364047bad06SGerrit Uitslagabstract class ChangeLog {
3658eccf945SGerrit Uitslag
3668eccf945SGerrit Uitslag    /** @var string */
367047bad06SGerrit Uitslag    protected $id;
3688eccf945SGerrit Uitslag    /** @var int */
369047bad06SGerrit Uitslag    protected $chunk_size;
3708eccf945SGerrit Uitslag    /** @var array */
371047bad06SGerrit Uitslag    protected $cache;
3728eccf945SGerrit Uitslag
3738eccf945SGerrit Uitslag    /**
3748eccf945SGerrit Uitslag     * Constructor
3758eccf945SGerrit Uitslag     *
3768eccf945SGerrit Uitslag     * @param string $id         page id
3778eccf945SGerrit Uitslag     * @param int $chunk_size maximum block size read from file
3788eccf945SGerrit Uitslag     */
3798eccf945SGerrit Uitslag    public function __construct($id, $chunk_size = 8192) {
3808eccf945SGerrit Uitslag        global $cache_revinfo;
3818eccf945SGerrit Uitslag
3828eccf945SGerrit Uitslag        $this->cache =& $cache_revinfo;
3838eccf945SGerrit Uitslag        if(!isset($this->cache[$id])) {
3848eccf945SGerrit Uitslag            $this->cache[$id] = array();
3858eccf945SGerrit Uitslag        }
3868eccf945SGerrit Uitslag
3878eccf945SGerrit Uitslag        $this->id = $id;
3888eccf945SGerrit Uitslag        $this->setChunkSize($chunk_size);
3898eccf945SGerrit Uitslag
3908eccf945SGerrit Uitslag    }
3918eccf945SGerrit Uitslag
3928eccf945SGerrit Uitslag    /**
3938eccf945SGerrit Uitslag     * Set chunk size for file reading
394047bad06SGerrit Uitslag     * Chunk size zero let read whole file at once
3958eccf945SGerrit Uitslag     *
3968eccf945SGerrit Uitslag     * @param int $chunk_size maximum block size read from file
3978eccf945SGerrit Uitslag     */
3988eccf945SGerrit Uitslag    public function setChunkSize($chunk_size) {
3998eccf945SGerrit Uitslag        if(!is_numeric($chunk_size)) $chunk_size = 0;
4008eccf945SGerrit Uitslag
4018eccf945SGerrit Uitslag        $this->chunk_size = (int) max($chunk_size, 0);
4028eccf945SGerrit Uitslag    }
4038eccf945SGerrit Uitslag
4048eccf945SGerrit Uitslag    /**
405047bad06SGerrit Uitslag     * Returns path to changelog
406047bad06SGerrit Uitslag     *
407047bad06SGerrit Uitslag     * @return string path to file
408047bad06SGerrit Uitslag     */
409047bad06SGerrit Uitslag    abstract protected function getChangelogFilename();
410047bad06SGerrit Uitslag
411047bad06SGerrit Uitslag    /**
412047bad06SGerrit Uitslag     * Returns path to current page/media
413047bad06SGerrit Uitslag     *
414047bad06SGerrit Uitslag     * @return string path to file
415047bad06SGerrit Uitslag     */
416047bad06SGerrit Uitslag    abstract protected function getFilename();
417047bad06SGerrit Uitslag
418047bad06SGerrit Uitslag    /**
4198eccf945SGerrit Uitslag     * Get the changelog information for a specific page id and revision (timestamp)
4208eccf945SGerrit Uitslag     *
4218eccf945SGerrit Uitslag     * Adjacent changelog lines are optimistically parsed and cached to speed up
4228eccf945SGerrit Uitslag     * consecutive calls to getRevisionInfo. For large changelog files, only the chunk
4238eccf945SGerrit Uitslag     * containing the requested changelog line is read.
4248eccf945SGerrit Uitslag     *
4258eccf945SGerrit Uitslag     * @param int $rev        revision timestamp
4268eccf945SGerrit Uitslag     * @return bool|array false or array with entries:
4278eccf945SGerrit Uitslag     *      - date:  unix timestamp
4288eccf945SGerrit Uitslag     *      - ip:    IPv4 address (127.0.0.1)
4298eccf945SGerrit Uitslag     *      - type:  log line type
4308eccf945SGerrit Uitslag     *      - id:    page id
4318eccf945SGerrit Uitslag     *      - user:  user name
4328eccf945SGerrit Uitslag     *      - sum:   edit summary (or action reason)
4338eccf945SGerrit Uitslag     *      - extra: extra data (varies by line type)
4347d559c7fSBen Coburn     *
4357d559c7fSBen Coburn     * @author Ben Coburn <btcoburn@silicodon.net>
43629778747SKate Arzamastseva     * @author Kate Arzamastseva <pshns@ukr.net>
4377d559c7fSBen Coburn     */
438047bad06SGerrit Uitslag    public function getRevisionInfo($rev) {
4397d559c7fSBen Coburn        $rev = max($rev, 0);
4407d559c7fSBen Coburn
4417d559c7fSBen Coburn        // check if it's already in the memory cache
4428eccf945SGerrit Uitslag        if(isset($this->cache[$this->id]) && isset($this->cache[$this->id][$rev])) {
4438eccf945SGerrit Uitslag            return $this->cache[$this->id][$rev];
444e4f389efSKate Arzamastseva        }
4457d559c7fSBen Coburn
446040f0e13SKlap-in        //read lines from changelog
447047bad06SGerrit Uitslag        list($fp, $lines) = $this->readloglines($rev);
448040f0e13SKlap-in        if($fp) {
4497d559c7fSBen Coburn            fclose($fp);
4507d559c7fSBen Coburn        }
451040f0e13SKlap-in        if(empty($lines)) return false;
4527d559c7fSBen Coburn
4537d559c7fSBen Coburn        // parse and cache changelog lines
4547d559c7fSBen Coburn        foreach($lines as $value) {
4557d559c7fSBen Coburn            $tmp = parseChangelogLine($value);
4567d559c7fSBen Coburn            if($tmp !== false) {
4578eccf945SGerrit Uitslag                $this->cache[$this->id][$tmp['date']] = $tmp;
4587d559c7fSBen Coburn            }
4597d559c7fSBen Coburn        }
4608eccf945SGerrit Uitslag        if(!isset($this->cache[$this->id][$rev])) {
4618eccf945SGerrit Uitslag            return false;
4628eccf945SGerrit Uitslag        }
4638eccf945SGerrit Uitslag        return $this->cache[$this->id][$rev];
4647d559c7fSBen Coburn    }
4657d559c7fSBen Coburn
4667d559c7fSBen Coburn    /**
4677d559c7fSBen Coburn     * Return a list of page revisions numbers
4688eccf945SGerrit Uitslag     *
4697d559c7fSBen Coburn     * Does not guarantee that the revision exists in the attic,
4707d559c7fSBen Coburn     * only that a line with the date exists in the changelog.
4717d559c7fSBen Coburn     * By default the current revision is skipped.
4727d559c7fSBen Coburn     *
4737d559c7fSBen Coburn     * The current revision is automatically skipped when the page exists.
4747d559c7fSBen Coburn     * See $INFO['meta']['last_change'] for the current revision.
4758eccf945SGerrit Uitslag     * A negative $first let read the current revision too.
4767d559c7fSBen Coburn     *
4777d559c7fSBen Coburn     * For efficiency, the log lines are parsed and cached for later
4787d559c7fSBen Coburn     * calls to getRevisionInfo. Large changelog files are read
479c66972f2SAdrian Lang     * backwards in chunks until the requested number of changelog
4807d559c7fSBen Coburn     * lines are recieved.
4817d559c7fSBen Coburn     *
4828eccf945SGerrit Uitslag     * @param int $first      skip the first n changelog lines
4838eccf945SGerrit Uitslag     * @param int $num        number of revisions to return
4848eccf945SGerrit Uitslag     * @return array with the revision timestamps
4858eccf945SGerrit Uitslag     *
4867d559c7fSBen Coburn     * @author Ben Coburn <btcoburn@silicodon.net>
48729778747SKate Arzamastseva     * @author Kate Arzamastseva <pshns@ukr.net>
4887d559c7fSBen Coburn     */
489047bad06SGerrit Uitslag    public function getRevisions($first, $num) {
4907d559c7fSBen Coburn        $revs = array();
4917d559c7fSBen Coburn        $lines = array();
4927d559c7fSBen Coburn        $count = 0;
493047bad06SGerrit Uitslag
4947d559c7fSBen Coburn        $num = max($num, 0);
4957d1e323eSGerrit Uitslag        if($num == 0) {
4967d1e323eSGerrit Uitslag            return $revs;
4977d1e323eSGerrit Uitslag        }
498092b7683SKlap-in
499b824abd4SAndreas Gohr        if($first < 0) {
500b824abd4SAndreas Gohr            $first = 0;
501047bad06SGerrit Uitslag        } else if(@file_exists($this->getFilename())) {
5027d559c7fSBen Coburn            // skip current revision if the page exists
5037d559c7fSBen Coburn            $first = max($first + 1, 0);
5047d559c7fSBen Coburn        }
5057d559c7fSBen Coburn
506047bad06SGerrit Uitslag        $file = $this->getChangelogFilename();
507047bad06SGerrit Uitslag
5087d1e323eSGerrit Uitslag        if(!@file_exists($file)) {
5097d1e323eSGerrit Uitslag            return $revs;
5107d1e323eSGerrit Uitslag        }
5118eccf945SGerrit Uitslag        if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) {
5127d559c7fSBen Coburn            // read whole file
5137d559c7fSBen Coburn            $lines = file($file);
5147d1e323eSGerrit Uitslag            if($lines === false) {
5157d1e323eSGerrit Uitslag                return $revs;
5167d1e323eSGerrit Uitslag            }
5177d559c7fSBen Coburn        } else {
5187d559c7fSBen Coburn            // read chunks backwards
5197d559c7fSBen Coburn            $fp = fopen($file, 'rb'); // "file pointer"
5207d1e323eSGerrit Uitslag            if($fp === false) {
5217d1e323eSGerrit Uitslag                return $revs;
5227d1e323eSGerrit Uitslag            }
5237d559c7fSBen Coburn            fseek($fp, 0, SEEK_END);
5247d559c7fSBen Coburn            $tail = ftell($fp);
5257d559c7fSBen Coburn
5267d559c7fSBen Coburn            // chunk backwards
5278eccf945SGerrit Uitslag            $finger = max($tail - $this->chunk_size, 0);
5287d559c7fSBen Coburn            while($count < $num + $first) {
5297d1e323eSGerrit Uitslag                $nl = $this->getNewlinepointer($fp, $finger);
530b824abd4SAndreas Gohr
531b824abd4SAndreas Gohr                // was the chunk big enough? if not, take another bite
532b824abd4SAndreas Gohr                if($nl > 0 && $tail <= $nl) {
5338eccf945SGerrit Uitslag                    $finger = max($finger - $this->chunk_size, 0);
534b824abd4SAndreas Gohr                    continue;
535b824abd4SAndreas Gohr                } else {
536b824abd4SAndreas Gohr                    $finger = $nl;
5377d559c7fSBen Coburn                }
5387d559c7fSBen Coburn
5397d559c7fSBen Coburn                // read chunk
5407d559c7fSBen Coburn                $chunk = '';
5417d559c7fSBen Coburn                $read_size = max($tail - $finger, 0); // found chunk size
5427d559c7fSBen Coburn                $got = 0;
5437d559c7fSBen Coburn                while($got < $read_size && !feof($fp)) {
54480e97297SGerrit Uitslag                    $tmp = @fread($fp, max(min($this->chunk_size, $read_size - $got), 0));
5457d1e323eSGerrit Uitslag                    if($tmp === false) {
5467d1e323eSGerrit Uitslag                        break;
5477d1e323eSGerrit Uitslag                    } //error state
5487d559c7fSBen Coburn                    $got += strlen($tmp);
5497d559c7fSBen Coburn                    $chunk .= $tmp;
5507d559c7fSBen Coburn                }
5517d559c7fSBen Coburn                $tmp = explode("\n", $chunk);
5527d559c7fSBen Coburn                array_pop($tmp); // remove trailing newline
5537d559c7fSBen Coburn
5547d559c7fSBen Coburn                // combine with previous chunk
5557d559c7fSBen Coburn                $count += count($tmp);
5567d559c7fSBen Coburn                $lines = array_merge($tmp, $lines);
5577d559c7fSBen Coburn
5587d559c7fSBen Coburn                // next chunk
5597d1e323eSGerrit Uitslag                if($finger == 0) {
5607d1e323eSGerrit Uitslag                    break;
5617d1e323eSGerrit Uitslag                } // already read all the lines
5627d559c7fSBen Coburn                else {
5637d559c7fSBen Coburn                    $tail = $finger;
5648eccf945SGerrit Uitslag                    $finger = max($tail - $this->chunk_size, 0);
5657d559c7fSBen Coburn                }
5667d559c7fSBen Coburn            }
5677d559c7fSBen Coburn            fclose($fp);
5687d559c7fSBen Coburn        }
5697d559c7fSBen Coburn
5707d559c7fSBen Coburn        // skip parsing extra lines
5717d559c7fSBen Coburn        $num = max(min(count($lines) - $first, $num), 0);
5727d559c7fSBen Coburn        if     ($first > 0 && $num > 0)  { $lines = array_slice($lines, max(count($lines) - $first - $num, 0), $num); }
5737d559c7fSBen Coburn        else if($first > 0 && $num == 0) { $lines = array_slice($lines, 0, max(count($lines) - $first, 0)); }
5747d559c7fSBen Coburn        else if($first == 0 && $num > 0) { $lines = array_slice($lines, max(count($lines) - $num, 0)); }
5757d559c7fSBen Coburn
5767d559c7fSBen Coburn        // handle lines in reverse order
5777d559c7fSBen Coburn        for($i = count($lines) - 1; $i >= 0; $i--) {
5787d559c7fSBen Coburn            $tmp = parseChangelogLine($lines[$i]);
5797d559c7fSBen Coburn            if($tmp !== false) {
5808eccf945SGerrit Uitslag                $this->cache[$this->id][$tmp['date']] = $tmp;
5817d559c7fSBen Coburn                $revs[] = $tmp['date'];
5827d559c7fSBen Coburn            }
5837d559c7fSBen Coburn        }
5847d559c7fSBen Coburn
5857d559c7fSBen Coburn        return $revs;
5867d559c7fSBen Coburn    }
5877d559c7fSBen Coburn
588f9528c0cSKlap-in    /**
5898eccf945SGerrit Uitslag     * Get the nth revision left or right handside  for a specific page id and revision (timestamp)
5908eccf945SGerrit Uitslag     *
5918eccf945SGerrit Uitslag     * For large changelog files, only the chunk containing the
592f9528c0cSKlap-in     * reference revision $rev is read and sometimes a next chunck.
593f9528c0cSKlap-in     *
594f9528c0cSKlap-in     * Adjacent changelog lines are optimistically parsed and cached to speed up
595f9528c0cSKlap-in     * consecutive calls to getRevisionInfo.
596f9528c0cSKlap-in     *
597f9528c0cSKlap-in     * @param int $rev        revision timestamp used as startdate (doesn't need to be revisionnumber)
598f9528c0cSKlap-in     * @param int $direction  give position of returned revision with respect to $rev; positive=next, negative=prev
5998eccf945SGerrit Uitslag     * @return bool|int
6008eccf945SGerrit Uitslag     *      timestamp of the requested revision
6018eccf945SGerrit Uitslag     *      otherwise false
602f9528c0cSKlap-in     */
603047bad06SGerrit Uitslag    public function getRelativeRevision($rev, $direction) {
604f9528c0cSKlap-in        $rev = max($rev, 0);
605040f0e13SKlap-in        $direction = (int) $direction;
6067d559c7fSBen Coburn
607f9528c0cSKlap-in        //no direction given or last rev, so no follow-up
608ee33e0c5SGerrit Uitslag        if(!$direction || ($direction > 0 && $this->isCurrentRevision($rev))) {
609f9528c0cSKlap-in            return false;
610f9528c0cSKlap-in        }
611f9528c0cSKlap-in
612040f0e13SKlap-in        //get lines from changelog
613047bad06SGerrit Uitslag        list($fp, $lines, $head, $tail, $eof) = $this->readloglines($rev);
614040f0e13SKlap-in        if(empty($lines)) return false;
615040f0e13SKlap-in
616040f0e13SKlap-in        // look for revisions later/earlier then $rev, when founded count till the wanted revision is reached
617040f0e13SKlap-in        // also parse and cache changelog lines for getRevisionInfo().
618040f0e13SKlap-in        $revcounter = 0;
619040f0e13SKlap-in        $relativerev = false;
620040f0e13SKlap-in        $checkotherchunck = true; //always runs once
621040f0e13SKlap-in        while(!$relativerev && $checkotherchunck) {
622040f0e13SKlap-in            $tmp = array();
623040f0e13SKlap-in            //parse in normal or reverse order
624040f0e13SKlap-in            $count = count($lines);
625040f0e13SKlap-in            if($direction > 0) {
626040f0e13SKlap-in                $start = 0;
627040f0e13SKlap-in                $step = 1;
628040f0e13SKlap-in            } else {
629040f0e13SKlap-in                $start = $count - 1;
630040f0e13SKlap-in                $step = -1;
631040f0e13SKlap-in            }
632040f0e13SKlap-in            for($i = $start; $i >= 0 && $i < $count; $i = $i + $step) {
633040f0e13SKlap-in                $tmp = parseChangelogLine($lines[$i]);
634040f0e13SKlap-in                if($tmp !== false) {
6358eccf945SGerrit Uitslag                    $this->cache[$this->id][$tmp['date']] = $tmp;
636040f0e13SKlap-in                    //look for revs older/earlier then reference $rev and select $direction-th one
637040f0e13SKlap-in                    if(($direction > 0 && $tmp['date'] > $rev) || ($direction < 0 && $tmp['date'] < $rev)) {
638040f0e13SKlap-in                        $revcounter++;
639040f0e13SKlap-in                        if($revcounter == abs($direction)) {
640040f0e13SKlap-in                            $relativerev = $tmp['date'];
641040f0e13SKlap-in                        }
642040f0e13SKlap-in                    }
643040f0e13SKlap-in                }
644040f0e13SKlap-in            }
645040f0e13SKlap-in
646040f0e13SKlap-in            //true when $rev is found, but not the wanted follow-up.
647040f0e13SKlap-in            $checkotherchunck = $fp
648040f0e13SKlap-in                && ($tmp['date'] == $rev || ($revcounter > 0 && !$relativerev))
649040f0e13SKlap-in                && !(($tail == $eof && $direction > 0) || ($head == 0 && $direction < 0));
650040f0e13SKlap-in
651040f0e13SKlap-in            if($checkotherchunck) {
6521da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, $direction);
653040f0e13SKlap-in
654040f0e13SKlap-in                if(empty($lines)) break;
655040f0e13SKlap-in            }
656040f0e13SKlap-in        }
657040f0e13SKlap-in        if($fp) {
658040f0e13SKlap-in            fclose($fp);
659040f0e13SKlap-in        }
660040f0e13SKlap-in
661040f0e13SKlap-in        return $relativerev;
662040f0e13SKlap-in    }
663040f0e13SKlap-in
664040f0e13SKlap-in    /**
6651da8dc97SGerrit Uitslag     * Returns revisions around rev1 and rev2
6661da8dc97SGerrit Uitslag     * When available it returns $max entries for each revision
6671da8dc97SGerrit Uitslag     *
6681da8dc97SGerrit Uitslag     * @param int $rev1 oldest revision timestamp
669621bbd2aSGerrit Uitslag     * @param int $rev2 newest revision timestamp (0 looks up last revision)
6701da8dc97SGerrit Uitslag     * @param int $max maximum number of revisions returned
6711da8dc97SGerrit Uitslag     * @return array with two arrays with revisions surrounding rev1 respectively rev2
6721da8dc97SGerrit Uitslag     */
6731da8dc97SGerrit Uitslag    public function getRevisionsAround($rev1, $rev2, $max = 50) {
6741da8dc97SGerrit Uitslag        $max = floor(abs($max) / 2)*2 + 1;
6751da8dc97SGerrit Uitslag        $rev1 = max($rev1, 0);
6761da8dc97SGerrit Uitslag        $rev2 = max($rev2, 0);
6771da8dc97SGerrit Uitslag
678621bbd2aSGerrit Uitslag        if($rev2) {
6791da8dc97SGerrit Uitslag            if($rev2 < $rev1) {
6801da8dc97SGerrit Uitslag                $rev = $rev2;
6811da8dc97SGerrit Uitslag                $rev2 = $rev1;
6821da8dc97SGerrit Uitslag                $rev1 = $rev;
6831da8dc97SGerrit Uitslag            }
684621bbd2aSGerrit Uitslag        } else {
685621bbd2aSGerrit Uitslag            //empty right side means a removed page. Look up last revision.
686621bbd2aSGerrit Uitslag            $revs = $this->getRevisions(-1, 1);
687621bbd2aSGerrit Uitslag            $rev2 = $revs[0];
688621bbd2aSGerrit Uitslag        }
6891da8dc97SGerrit Uitslag        //collect revisions around rev2
6901da8dc97SGerrit Uitslag        list($revs2, $allrevs, $fp, $lines, $head, $tail) = $this->retrieveRevisionsAround($rev2, $max);
6911da8dc97SGerrit Uitslag
6921da8dc97SGerrit Uitslag        if(empty($revs2)) return array(array(), array());
6931da8dc97SGerrit Uitslag
6941da8dc97SGerrit Uitslag        //collect revisions around rev1
6951da8dc97SGerrit Uitslag        $index = array_search($rev1, $allrevs);
6961da8dc97SGerrit Uitslag        if($index === false) {
6971da8dc97SGerrit Uitslag            //no overlapping revisions
6981da8dc97SGerrit Uitslag            list($revs1,,,,,) = $this->retrieveRevisionsAround($rev1, $max);
6991da8dc97SGerrit Uitslag            if(empty($revs1)) $revs1 = array();
7001da8dc97SGerrit Uitslag        } else {
7011da8dc97SGerrit Uitslag            //revisions overlaps, reuse revisions around rev2
7021da8dc97SGerrit Uitslag            $revs1 = $allrevs;
7031da8dc97SGerrit Uitslag            while($head > 0) {
7041da8dc97SGerrit Uitslag                for($i = count($lines) - 1; $i >= 0; $i--) {
7051da8dc97SGerrit Uitslag                    $tmp = parseChangelogLine($lines[$i]);
7061da8dc97SGerrit Uitslag                    if($tmp !== false) {
7071da8dc97SGerrit Uitslag                        $this->cache[$this->id][$tmp['date']] = $tmp;
7081da8dc97SGerrit Uitslag                        $revs1[] = $tmp['date'];
7091da8dc97SGerrit Uitslag                        $index++;
7101da8dc97SGerrit Uitslag
7111da8dc97SGerrit Uitslag                        if($index > floor($max / 2)) break 2;
7121da8dc97SGerrit Uitslag                    }
7131da8dc97SGerrit Uitslag                }
7141da8dc97SGerrit Uitslag
7151da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1);
7161da8dc97SGerrit Uitslag            }
7171da8dc97SGerrit Uitslag            sort($revs1);
7181da8dc97SGerrit Uitslag            //return wanted selection
7191da8dc97SGerrit Uitslag            $revs1 = array_slice($revs1, max($index - floor($max/2), 0), $max);
7201da8dc97SGerrit Uitslag        }
7211da8dc97SGerrit Uitslag
7222e608c52SGerrit Uitslag        return array(array_reverse($revs1), array_reverse($revs2));
7231da8dc97SGerrit Uitslag    }
7241da8dc97SGerrit Uitslag
7251da8dc97SGerrit Uitslag    /**
7268eccf945SGerrit Uitslag     * Returns lines from changelog.
727040f0e13SKlap-in     * If file larger than $chuncksize, only chunck is read that could contain $rev.
728040f0e13SKlap-in     *
729040f0e13SKlap-in     * @param int $rev   revision timestamp
730040f0e13SKlap-in     * @return array(fp, array(changeloglines), $head, $tail, $eof)|bool
731040f0e13SKlap-in     *     returns false when not succeed. fp only defined for chuck reading, needs closing.
732040f0e13SKlap-in     */
733047bad06SGerrit Uitslag    protected function readloglines($rev) {
734047bad06SGerrit Uitslag        $file = $this->getChangelogFilename();
7358eccf945SGerrit Uitslag
736f9528c0cSKlap-in        if(!@file_exists($file)) {
737f9528c0cSKlap-in            return false;
738f9528c0cSKlap-in        }
739f9528c0cSKlap-in
740f9528c0cSKlap-in        $fp = null;
741f9528c0cSKlap-in        $head = 0;
742040f0e13SKlap-in        $tail = 0;
743f9528c0cSKlap-in        $eof = 0;
7448eccf945SGerrit Uitslag
7458eccf945SGerrit Uitslag        if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) {
746f9528c0cSKlap-in            // read whole file
747f9528c0cSKlap-in            $lines = file($file);
748f9528c0cSKlap-in            if($lines === false) {
749f9528c0cSKlap-in                return false;
750f9528c0cSKlap-in            }
751f9528c0cSKlap-in        } else {
752f9528c0cSKlap-in            // read by chunk
753f9528c0cSKlap-in            $fp = fopen($file, 'rb'); // "file pointer"
754f9528c0cSKlap-in            if($fp === false) {
755f9528c0cSKlap-in                return false;
756040f0e13SKlap-in            }
757f9528c0cSKlap-in            $head = 0;
758040f0e13SKlap-in            fseek($fp, 0, SEEK_END);
759040f0e13SKlap-in            $eof = ftell($fp);
760040f0e13SKlap-in            $tail = $eof;
761f9528c0cSKlap-in
762f9528c0cSKlap-in            // find chunk
7638eccf945SGerrit Uitslag            while($tail - $head > $this->chunk_size) {
764f9528c0cSKlap-in                $finger = $head + floor(($tail - $head) / 2.0);
7658eccf945SGerrit Uitslag                $finger = $this->getNewlinepointer($fp, $finger);
766040f0e13SKlap-in                $tmp = fgets($fp);
767f9528c0cSKlap-in                if($finger == $head || $finger == $tail) {
768f9528c0cSKlap-in                    break;
769f9528c0cSKlap-in                }
77059cce2d9SGerrit Uitslag                $tmp = parseChangelogLine($tmp);
77159cce2d9SGerrit Uitslag                $finger_rev = $tmp['date'];
77259cce2d9SGerrit Uitslag
773f9528c0cSKlap-in                if($finger_rev > $rev) {
774f9528c0cSKlap-in                    $tail = $finger;
775f9528c0cSKlap-in                } else {
776f9528c0cSKlap-in                    $head = $finger;
777f9528c0cSKlap-in                }
778f9528c0cSKlap-in            }
779f9528c0cSKlap-in
780f9528c0cSKlap-in            if($tail - $head < 1) {
781f9528c0cSKlap-in                // cound not find chunk, assume requested rev is missing
782f9528c0cSKlap-in                fclose($fp);
783f9528c0cSKlap-in                return false;
784f9528c0cSKlap-in            }
785f9528c0cSKlap-in
7868eccf945SGerrit Uitslag            $lines = $this->readChunk($fp, $head, $tail);
787f9528c0cSKlap-in        }
788040f0e13SKlap-in        return array(
789040f0e13SKlap-in            $fp,
790040f0e13SKlap-in            $lines,
791040f0e13SKlap-in            $head,
792040f0e13SKlap-in            $tail,
793040f0e13SKlap-in            $eof
794040f0e13SKlap-in        );
795f9528c0cSKlap-in    }
796f9528c0cSKlap-in
797f9528c0cSKlap-in    /**
798f9528c0cSKlap-in     * Read chunk and return array with lines of given chunck.
799f9528c0cSKlap-in     * Has no check if $head and $tail are really at a new line
800f9528c0cSKlap-in     *
8014f1e2cb3SGerrit Uitslag     * @param resource $fp    resource filepointer
8024f1e2cb3SGerrit Uitslag     * @param int      $head  start point chunck
8034f1e2cb3SGerrit Uitslag     * @param int      $tail  end point chunck
804f9528c0cSKlap-in     * @return array lines read from chunck
805f9528c0cSKlap-in     */
8068eccf945SGerrit Uitslag    protected function readChunk($fp, $head, $tail) {
807f9528c0cSKlap-in        $chunk = '';
808f9528c0cSKlap-in        $chunk_size = max($tail - $head, 0); // found chunk size
809f9528c0cSKlap-in        $got = 0;
810f9528c0cSKlap-in        fseek($fp, $head);
811f9528c0cSKlap-in        while($got < $chunk_size && !feof($fp)) {
81259cce2d9SGerrit Uitslag            $tmp = @fread($fp, max(min($this->chunk_size, $chunk_size - $got), 0));
813040f0e13SKlap-in            if($tmp === false) { //error state
814f9528c0cSKlap-in                break;
815040f0e13SKlap-in            }
816f9528c0cSKlap-in            $got += strlen($tmp);
817f9528c0cSKlap-in            $chunk .= $tmp;
818f9528c0cSKlap-in        }
819f9528c0cSKlap-in        $lines = explode("\n", $chunk);
820f9528c0cSKlap-in        array_pop($lines); // remove trailing newline
821f9528c0cSKlap-in        return $lines;
822f9528c0cSKlap-in    }
823f9528c0cSKlap-in
824f9528c0cSKlap-in    /**
825f9528c0cSKlap-in     * Set pointer to first new line after $finger and return its position
826f9528c0cSKlap-in     *
8271da8dc97SGerrit Uitslag     * @param resource $fp      filepointer
8284f1e2cb3SGerrit Uitslag     * @param int      $finger  a pointer
829f9528c0cSKlap-in     * @return int pointer
830f9528c0cSKlap-in     */
8318eccf945SGerrit Uitslag    protected function getNewlinepointer($fp, $finger) {
832f9528c0cSKlap-in        fseek($fp, $finger);
83359cce2d9SGerrit Uitslag        $nl = $finger;
83459cce2d9SGerrit Uitslag        if($finger > 0) {
835f9528c0cSKlap-in            fgets($fp); // slip the finger forward to a new line
83659cce2d9SGerrit Uitslag            $nl = ftell($fp);
83759cce2d9SGerrit Uitslag        }
83859cce2d9SGerrit Uitslag        return $nl;
839f9528c0cSKlap-in    }
8408eccf945SGerrit Uitslag
8418eccf945SGerrit Uitslag    /**
8428eccf945SGerrit Uitslag     * Check whether given revision is the current page
8438eccf945SGerrit Uitslag     *
8448eccf945SGerrit Uitslag     * @param int $rev   timestamp of current page
8458eccf945SGerrit Uitslag     * @return bool true if $rev is current revision, otherwise false
8468eccf945SGerrit Uitslag     */
847ee33e0c5SGerrit Uitslag    public function isCurrentRevision($rev) {
848047bad06SGerrit Uitslag        return $rev == @filemtime($this->getFilename());
8498eccf945SGerrit Uitslag    }
85078b874e6Slisps
85178b874e6Slisps    /**
85278b874e6Slisps    * Return an existing revision for a specific date which is
85378b874e6Slisps    * the current one or younger or equal then the date
85478b874e6Slisps    *
85578b874e6Slisps    * @param string $id
85678b874e6Slisps    * @param number $date_at timestamp
85778b874e6Slisps    * @return string revision ('' for current)
85878b874e6Slisps    */
85978b874e6Slisps    function getLastRevisionAt($date_at){
86078b874e6Slisps        //requested date_at(timestamp) younger or equal then modified_time($this->id) => load current
86178b874e6Slisps        if($date_at >= @filemtime($this->getFilename())) {
86278b874e6Slisps            return '';
86378b874e6Slisps        } else if ($rev = $this->getRelativeRevision($date_at+1, -1)) { //+1 to get also the requested date revision
86478b874e6Slisps            return $rev;
86578b874e6Slisps        } else {
86678b874e6Slisps            return false;
86778b874e6Slisps        }
86878b874e6Slisps    }
869f2643d9fSlisps
870f2643d9fSlisps    /**
8711da8dc97SGerrit Uitslag     * Returns the next lines of the changelog  of the chunck before head or after tail
8721da8dc97SGerrit Uitslag     *
8731da8dc97SGerrit Uitslag     * @param resource $fp filepointer
8741da8dc97SGerrit Uitslag     * @param int $head position head of last chunk
8751da8dc97SGerrit Uitslag     * @param int $tail position tail of last chunk
8761da8dc97SGerrit Uitslag     * @param int $direction positive forward, negative backward
8771da8dc97SGerrit Uitslag     * @return array with entries:
8781da8dc97SGerrit Uitslag     *    - $lines: changelog lines of readed chunk
8791da8dc97SGerrit Uitslag     *    - $head: head of chunk
8801da8dc97SGerrit Uitslag     *    - $tail: tail of chunk
8811da8dc97SGerrit Uitslag     */
8821da8dc97SGerrit Uitslag    protected function readAdjacentChunk($fp, $head, $tail, $direction) {
8831da8dc97SGerrit Uitslag        if(!$fp) return array(array(), $head, $tail);
8841da8dc97SGerrit Uitslag
8851da8dc97SGerrit Uitslag        if($direction > 0) {
8861da8dc97SGerrit Uitslag            //read forward
8871da8dc97SGerrit Uitslag            $head = $tail;
8881da8dc97SGerrit Uitslag            $tail = $head + floor($this->chunk_size * (2 / 3));
8891da8dc97SGerrit Uitslag            $tail = $this->getNewlinepointer($fp, $tail);
8901da8dc97SGerrit Uitslag        } else {
8911da8dc97SGerrit Uitslag            //read backward
8921da8dc97SGerrit Uitslag            $tail = $head;
8931da8dc97SGerrit Uitslag            $head = max($tail - $this->chunk_size, 0);
8941da8dc97SGerrit Uitslag            while(true) {
8951da8dc97SGerrit Uitslag                $nl = $this->getNewlinepointer($fp, $head);
8961da8dc97SGerrit Uitslag                // was the chunk big enough? if not, take another bite
8971da8dc97SGerrit Uitslag                if($nl > 0 && $tail <= $nl) {
8981da8dc97SGerrit Uitslag                    $head = max($head - $this->chunk_size, 0);
8991da8dc97SGerrit Uitslag                } else {
9001da8dc97SGerrit Uitslag                    $head = $nl;
9011da8dc97SGerrit Uitslag                    break;
9021da8dc97SGerrit Uitslag                }
9031da8dc97SGerrit Uitslag            }
9048eccf945SGerrit Uitslag        }
9058eccf945SGerrit Uitslag
9061da8dc97SGerrit Uitslag        //load next chunck
9071da8dc97SGerrit Uitslag        $lines = $this->readChunk($fp, $head, $tail);
9081da8dc97SGerrit Uitslag        return array($lines, $head, $tail);
9091da8dc97SGerrit Uitslag    }
9101da8dc97SGerrit Uitslag
9111da8dc97SGerrit Uitslag    /**
9121da8dc97SGerrit Uitslag     * Collect the $max revisions near to the timestamp $rev
9131da8dc97SGerrit Uitslag     *
9141da8dc97SGerrit Uitslag     * @param int $rev revision timestamp
9151da8dc97SGerrit Uitslag     * @param int $max maximum number of revisions to be returned
9161da8dc97SGerrit Uitslag     * @return bool|array
9171da8dc97SGerrit Uitslag     *     return array with entries:
9181da8dc97SGerrit Uitslag     *       - $requestedrevs: array of with $max revision timestamps
9191da8dc97SGerrit Uitslag     *       - $revs: all parsed revision timestamps
9201da8dc97SGerrit Uitslag     *       - $fp: filepointer only defined for chuck reading, needs closing.
9211da8dc97SGerrit Uitslag     *       - $lines: non-parsed changelog lines before the parsed revisions
9221da8dc97SGerrit Uitslag     *       - $head: position of first readed changelogline
9231da8dc97SGerrit Uitslag     *       - $lasttail: position of end of last readed changelogline
9241da8dc97SGerrit Uitslag     *     otherwise false
9251da8dc97SGerrit Uitslag     */
9261da8dc97SGerrit Uitslag    protected function retrieveRevisionsAround($rev, $max) {
9271da8dc97SGerrit Uitslag        //get lines from changelog
9284f1e2cb3SGerrit Uitslag        list($fp, $lines, $starthead, $starttail, /* $eof */) = $this->readloglines($rev);
9291da8dc97SGerrit Uitslag        if(empty($lines)) return false;
9301da8dc97SGerrit Uitslag
9311da8dc97SGerrit Uitslag        //parse chunk containing $rev, and read forward more chunks until $max/2 is reached
9321da8dc97SGerrit Uitslag        $head = $starthead;
9331da8dc97SGerrit Uitslag        $tail = $starttail;
9341da8dc97SGerrit Uitslag        $revs = array();
9351da8dc97SGerrit Uitslag        $aftercount = $beforecount = 0;
9361da8dc97SGerrit Uitslag        while(count($lines) > 0) {
9371da8dc97SGerrit Uitslag            foreach($lines as $line) {
9381da8dc97SGerrit Uitslag                $tmp = parseChangelogLine($line);
9391da8dc97SGerrit Uitslag                if($tmp !== false) {
9401da8dc97SGerrit Uitslag                    $this->cache[$this->id][$tmp['date']] = $tmp;
9411da8dc97SGerrit Uitslag                    $revs[] = $tmp['date'];
9421da8dc97SGerrit Uitslag                    if($tmp['date'] >= $rev) {
9431da8dc97SGerrit Uitslag                        //count revs after reference $rev
9441da8dc97SGerrit Uitslag                        $aftercount++;
9451da8dc97SGerrit Uitslag                        if($aftercount == 1) $beforecount = count($revs);
9461da8dc97SGerrit Uitslag                    }
9471da8dc97SGerrit Uitslag                    //enough revs after reference $rev?
9481da8dc97SGerrit Uitslag                    if($aftercount > floor($max / 2)) break 2;
9491da8dc97SGerrit Uitslag                }
9501da8dc97SGerrit Uitslag            }
9511da8dc97SGerrit Uitslag            //retrieve next chunk
9521da8dc97SGerrit Uitslag            list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, 1);
9531da8dc97SGerrit Uitslag        }
9541da8dc97SGerrit Uitslag        if($aftercount == 0) return false;
9551da8dc97SGerrit Uitslag
9561da8dc97SGerrit Uitslag        $lasttail = $tail;
9571da8dc97SGerrit Uitslag
9581da8dc97SGerrit Uitslag        //read additional chuncks backward until $max/2 is reached and total number of revs is equal to $max
9591da8dc97SGerrit Uitslag        $lines = array();
9601da8dc97SGerrit Uitslag        $i = 0;
9611da8dc97SGerrit Uitslag        if($aftercount > 0) {
9621da8dc97SGerrit Uitslag            $head = $starthead;
9631da8dc97SGerrit Uitslag            $tail = $starttail;
9641da8dc97SGerrit Uitslag            while($head > 0) {
9651da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1);
9661da8dc97SGerrit Uitslag
9671da8dc97SGerrit Uitslag                for($i = count($lines) - 1; $i >= 0; $i--) {
9681da8dc97SGerrit Uitslag                    $tmp = parseChangelogLine($lines[$i]);
9691da8dc97SGerrit Uitslag                    if($tmp !== false) {
9701da8dc97SGerrit Uitslag                        $this->cache[$this->id][$tmp['date']] = $tmp;
9711da8dc97SGerrit Uitslag                        $revs[] = $tmp['date'];
9721da8dc97SGerrit Uitslag                        $beforecount++;
9731da8dc97SGerrit Uitslag                        //enough revs before reference $rev?
9741da8dc97SGerrit Uitslag                        if($beforecount > max(floor($max / 2), $max - $aftercount)) break 2;
9751da8dc97SGerrit Uitslag                    }
9761da8dc97SGerrit Uitslag                }
9771da8dc97SGerrit Uitslag            }
9781da8dc97SGerrit Uitslag        }
9791da8dc97SGerrit Uitslag        sort($revs);
9801da8dc97SGerrit Uitslag
9811da8dc97SGerrit Uitslag        //keep only non-parsed lines
9821da8dc97SGerrit Uitslag        $lines = array_slice($lines, 0, $i);
9831da8dc97SGerrit Uitslag        //trunk desired selection
9841da8dc97SGerrit Uitslag        $requestedrevs = array_slice($revs, -$max, $max);
9851da8dc97SGerrit Uitslag
9861da8dc97SGerrit Uitslag        return array($requestedrevs, $revs, $fp, $lines, $head, $lasttail);
9871da8dc97SGerrit Uitslag    }
9881da8dc97SGerrit Uitslag}
9891da8dc97SGerrit Uitslag
9901da8dc97SGerrit Uitslag/**
9911da8dc97SGerrit Uitslag * Class PageChangelog handles changelog of a wiki page
9921da8dc97SGerrit Uitslag */
993047bad06SGerrit Uitslagclass PageChangelog extends ChangeLog {
994047bad06SGerrit Uitslag
995047bad06SGerrit Uitslag    /**
996047bad06SGerrit Uitslag     * Returns path to changelog
997047bad06SGerrit Uitslag     *
998047bad06SGerrit Uitslag     * @return string path to file
999047bad06SGerrit Uitslag     */
1000047bad06SGerrit Uitslag    protected function getChangelogFilename() {
1001047bad06SGerrit Uitslag        return metaFN($this->id, '.changes');
1002047bad06SGerrit Uitslag    }
1003047bad06SGerrit Uitslag
1004047bad06SGerrit Uitslag    /**
1005047bad06SGerrit Uitslag     * Returns path to current page/media
1006047bad06SGerrit Uitslag     *
1007047bad06SGerrit Uitslag     * @return string path to file
1008047bad06SGerrit Uitslag     */
1009047bad06SGerrit Uitslag    protected function getFilename() {
1010047bad06SGerrit Uitslag        return wikiFN($this->id);
1011047bad06SGerrit Uitslag    }
1012047bad06SGerrit Uitslag}
1013047bad06SGerrit Uitslag
10141da8dc97SGerrit Uitslag/**
10151da8dc97SGerrit Uitslag * Class MediaChangelog handles changelog of a media file
10161da8dc97SGerrit Uitslag */
1017047bad06SGerrit Uitslagclass MediaChangelog extends ChangeLog {
1018047bad06SGerrit Uitslag
1019047bad06SGerrit Uitslag    /**
1020047bad06SGerrit Uitslag     * Returns path to changelog
1021047bad06SGerrit Uitslag     *
1022047bad06SGerrit Uitslag     * @return string path to file
1023047bad06SGerrit Uitslag     */
1024047bad06SGerrit Uitslag    protected function getChangelogFilename() {
1025047bad06SGerrit Uitslag        return mediaMetaFN($this->id, '.changes');
1026047bad06SGerrit Uitslag    }
1027047bad06SGerrit Uitslag
1028047bad06SGerrit Uitslag    /**
1029047bad06SGerrit Uitslag     * Returns path to current page/media
1030047bad06SGerrit Uitslag     *
1031047bad06SGerrit Uitslag     * @return string path to file
1032047bad06SGerrit Uitslag     */
1033047bad06SGerrit Uitslag    protected function getFilename() {
1034047bad06SGerrit Uitslag        return mediaFN($this->id);
1035047bad06SGerrit Uitslag    }
1036047bad06SGerrit Uitslag}
1037047bad06SGerrit Uitslag
10388eccf945SGerrit Uitslag/**
10398eccf945SGerrit Uitslag * Get the changelog information for a specific page id
10408eccf945SGerrit Uitslag * and revision (timestamp). Adjacent changelog lines
10418eccf945SGerrit Uitslag * are optimistically parsed and cached to speed up
10428eccf945SGerrit Uitslag * consecutive calls to getRevisionInfo. For large
10438eccf945SGerrit Uitslag * changelog files, only the chunk containing the
10448eccf945SGerrit Uitslag * requested changelog line is read.
10458eccf945SGerrit Uitslag *
10461419a485SAndreas Gohr * @deprecated 2013-11-20
10478eccf945SGerrit Uitslag *
10488eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net>
10498eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net>
10508eccf945SGerrit Uitslag */
10518eccf945SGerrit Uitslagfunction getRevisionInfo($id, $rev, $chunk_size = 8192, $media = false) {
10524f1e2cb3SGerrit Uitslag    dbg_deprecated('class PageChangeLog or class MediaChangelog');
1053047bad06SGerrit Uitslag    if($media) {
1054047bad06SGerrit Uitslag        $changelog = new MediaChangeLog($id, $chunk_size);
1055047bad06SGerrit Uitslag    } else {
1056047bad06SGerrit Uitslag        $changelog = new PageChangeLog($id, $chunk_size);
1057047bad06SGerrit Uitslag    }
1058047bad06SGerrit Uitslag    return $changelog->getRevisionInfo($rev);
10598eccf945SGerrit Uitslag}
10608eccf945SGerrit Uitslag
10618eccf945SGerrit Uitslag/**
10628eccf945SGerrit Uitslag * Return a list of page revisions numbers
10638eccf945SGerrit Uitslag * Does not guarantee that the revision exists in the attic,
10648eccf945SGerrit Uitslag * only that a line with the date exists in the changelog.
10658eccf945SGerrit Uitslag * By default the current revision is skipped.
10668eccf945SGerrit Uitslag *
10678eccf945SGerrit Uitslag * The current revision is automatically skipped when the page exists.
10688eccf945SGerrit Uitslag * See $INFO['meta']['last_change'] for the current revision.
10698eccf945SGerrit Uitslag *
10708eccf945SGerrit Uitslag * For efficiency, the log lines are parsed and cached for later
10718eccf945SGerrit Uitslag * calls to getRevisionInfo. Large changelog files are read
10728eccf945SGerrit Uitslag * backwards in chunks until the requested number of changelog
10738eccf945SGerrit Uitslag * lines are recieved.
10748eccf945SGerrit Uitslag *
10751419a485SAndreas Gohr * @deprecated 2013-11-20
10768eccf945SGerrit Uitslag *
10778eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net>
10788eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net>
10794f1e2cb3SGerrit Uitslag *
10804f1e2cb3SGerrit Uitslag * @param string $id          the page of interest
10814f1e2cb3SGerrit Uitslag * @param int    $first       skip the first n changelog lines
10824f1e2cb3SGerrit Uitslag * @param int    $num         number of revisions to return
10834f1e2cb3SGerrit Uitslag * @param int    $chunk_size
10844f1e2cb3SGerrit Uitslag * @param bool   $media
10854f1e2cb3SGerrit Uitslag * @return array
10868eccf945SGerrit Uitslag */
10878eccf945SGerrit Uitslagfunction getRevisions($id, $first, $num, $chunk_size = 8192, $media = false) {
10884f1e2cb3SGerrit Uitslag    dbg_deprecated('class PageChangeLog or class MediaChangelog');
1089047bad06SGerrit Uitslag    if($media) {
1090047bad06SGerrit Uitslag        $changelog = new MediaChangeLog($id, $chunk_size);
1091047bad06SGerrit Uitslag    } else {
1092047bad06SGerrit Uitslag        $changelog = new PageChangeLog($id, $chunk_size);
1093047bad06SGerrit Uitslag    }
1094047bad06SGerrit Uitslag    return $changelog->getRevisions($first, $num);
10958eccf945SGerrit Uitslag}
10965c2eed9aSlisps
1097