xref: /dokuwiki/inc/changelog.php (revision 4f1e2cb398542551e71f50494ed57c567a732980)
17d559c7fSBen Coburn<?php
27d559c7fSBen Coburn/**
37d559c7fSBen Coburn * Changelog handling functions
47d559c7fSBen Coburn *
57d559c7fSBen Coburn * @license    GPL 2 (http://www.gnu.org/licenses/gpl.html)
67d559c7fSBen Coburn * @author     Andreas Gohr <andi@splitbrain.org>
77d559c7fSBen Coburn */
87d559c7fSBen Coburn
9ebf1501fSBen Coburn// Constants for known core changelog line types.
10ebf1501fSBen Coburn// Use these in place of string literals for more readable code.
11ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_CREATE',       'C');
12ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_EDIT',         'E');
13ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_MINOR_EDIT',   'e');
14ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_DELETE',       'D');
15ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_REVERT',       'R');
16ebf1501fSBen Coburn
177d559c7fSBen Coburn/**
187d559c7fSBen Coburn * parses a changelog line into it's components
197d559c7fSBen Coburn *
207d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
21*4f1e2cb3SGerrit Uitslag *
22*4f1e2cb3SGerrit Uitslag * @param string $line changelog line
23*4f1e2cb3SGerrit Uitslag * @return array|bool parsed line or false
247d559c7fSBen Coburn */
257d559c7fSBen Coburnfunction parseChangelogLine($line) {
267d559c7fSBen Coburn    $tmp = explode("\t", $line);
277d559c7fSBen Coburn    if ($tmp!==false && count($tmp)>1) {
287d559c7fSBen Coburn        $info = array();
29e16d739eSBen Coburn        $info['date']  = (int)$tmp[0]; // unix timestamp
307d559c7fSBen Coburn        $info['ip']    = $tmp[1]; // IPv4 address (127.0.0.1)
317d559c7fSBen Coburn        $info['type']  = $tmp[2]; // log line type
327d559c7fSBen Coburn        $info['id']    = $tmp[3]; // page id
337d559c7fSBen Coburn        $info['user']  = $tmp[4]; // user name
347d559c7fSBen Coburn        $info['sum']   = $tmp[5]; // edit summary (or action reason)
357d559c7fSBen Coburn        $info['extra'] = rtrim($tmp[6], "\n"); // extra data (varies by line type)
367d559c7fSBen Coburn        return $info;
377d559c7fSBen Coburn    } else { return false; }
387d559c7fSBen Coburn}
397d559c7fSBen Coburn
407d559c7fSBen Coburn/**
417d559c7fSBen Coburn * Add's an entry to the changelog and saves the metadata for the page
427d559c7fSBen Coburn *
43a365baeeSDominik Eckelmann * @param int    $date      Timestamp of the change
44a365baeeSDominik Eckelmann * @param String $id        Name of the affected page
45a365baeeSDominik Eckelmann * @param String $type      Type of the change see DOKU_CHANGE_TYPE_*
46a365baeeSDominik Eckelmann * @param String $summary   Summary of the change
47a365baeeSDominik Eckelmann * @param mixed  $extra     In case of a revert the revision (timestmp) of the reverted page
48a365baeeSDominik Eckelmann * @param array  $flags     Additional flags in a key value array.
49*4f1e2cb3SGerrit Uitslag *                             Available flags:
50a365baeeSDominik Eckelmann *                             - ExternalEdit - mark as an external edit.
51a365baeeSDominik Eckelmann *
527d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org>
537d559c7fSBen Coburn * @author Esther Brunner <wikidesign@gmail.com>
547d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
557d559c7fSBen Coburn */
56ebf1501fSBen Coburnfunction addLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){
577d559c7fSBen Coburn    global $conf, $INFO;
58585bf44eSChristopher Smith    /** @var Input $INPUT */
59585bf44eSChristopher Smith    global $INPUT;
607d559c7fSBen Coburn
615aa52fafSBen Coburn    // check for special flags as keys
625aa52fafSBen Coburn    if (!is_array($flags)) { $flags = array(); }
635aa52fafSBen Coburn    $flagExternalEdit = isset($flags['ExternalEdit']);
645aa52fafSBen Coburn
657d559c7fSBen Coburn    $id = cleanid($id);
667d559c7fSBen Coburn    $file = wikiFN($id);
677d559c7fSBen Coburn    $created = @filectime($file);
68ebf1501fSBen Coburn    $minor = ($type===DOKU_CHANGE_TYPE_MINOR_EDIT);
69ebf1501fSBen Coburn    $wasRemoved = ($type===DOKU_CHANGE_TYPE_DELETE);
707d559c7fSBen Coburn
717d559c7fSBen Coburn    if(!$date) $date = time(); //use current time if none supplied
722f9daf16SAndreas Gohr    $remote = (!$flagExternalEdit)?clientIP(true):'127.0.0.1';
73585bf44eSChristopher Smith    $user   = (!$flagExternalEdit)?$INPUT->server->str('REMOTE_USER'):'';
747d559c7fSBen Coburn
757d559c7fSBen Coburn    $strip = array("\t", "\n");
767d559c7fSBen Coburn    $logline = array(
777d559c7fSBen Coburn            'date'  => $date,
787d559c7fSBen Coburn            'ip'    => $remote,
797d559c7fSBen Coburn            'type'  => str_replace($strip, '', $type),
807d559c7fSBen Coburn            'id'    => $id,
817d559c7fSBen Coburn            'user'  => $user,
827fa35bb1SAndreas Gohr            'sum'   => utf8_substr(str_replace($strip, '', $summary),0,255),
837d559c7fSBen Coburn            'extra' => str_replace($strip, '', $extra)
847d559c7fSBen Coburn            );
857d559c7fSBen Coburn
867d559c7fSBen Coburn    // update metadata
877d559c7fSBen Coburn    if (!$wasRemoved) {
883d1f9ec3SMichael Klier        $oldmeta = p_read_metadata($id);
897d559c7fSBen Coburn        $meta    = array();
903d1f9ec3SMichael Klier        if (!$INFO['exists'] && empty($oldmeta['persistent']['date']['created'])){ // newly created
917d559c7fSBen Coburn            $meta['date']['created'] = $created;
92a8e72133SAndreas Gohr            if ($user){
93a8e72133SAndreas Gohr                $meta['creator'] = $INFO['userinfo']['name'];
94a8e72133SAndreas Gohr                $meta['user']    = $user;
95a8e72133SAndreas Gohr            }
963d1f9ec3SMichael Klier        } elseif (!$INFO['exists'] && !empty($oldmeta['persistent']['date']['created'])) { // re-created / restored
973d1f9ec3SMichael Klier            $meta['date']['created']  = $oldmeta['persistent']['date']['created'];
983d1f9ec3SMichael Klier            $meta['date']['modified'] = $created; // use the files ctime here
993d1f9ec3SMichael Klier            $meta['creator'] = $oldmeta['persistent']['creator'];
1003d1f9ec3SMichael Klier            if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name'];
1017d559c7fSBen Coburn        } elseif (!$minor) {   // non-minor modification
1027d559c7fSBen Coburn            $meta['date']['modified'] = $date;
1037d559c7fSBen Coburn            if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name'];
1047d559c7fSBen Coburn        }
1057d559c7fSBen Coburn        $meta['last_change'] = $logline;
106ee4d22e0SChristopher Smith        p_set_metadata($id, $meta);
1077d559c7fSBen Coburn    }
1087d559c7fSBen Coburn
1097d559c7fSBen Coburn    // add changelog lines
1107d559c7fSBen Coburn    $logline = implode("\t", $logline)."\n";
1117d559c7fSBen Coburn    io_saveFile(metaFN($id,'.changes'),$logline,true); //page changelog
1127d559c7fSBen Coburn    io_saveFile($conf['changelog'],$logline,true); //global changelog cache
1137d559c7fSBen Coburn}
1147d559c7fSBen Coburn
1157d559c7fSBen Coburn/**
11699c8d7f2Smichael * Add's an entry to the media changelog
11799c8d7f2Smichael *
11899c8d7f2Smichael * @author Michael Hamann <michael@content-space.de>
11999c8d7f2Smichael * @author Andreas Gohr <andi@splitbrain.org>
12099c8d7f2Smichael * @author Esther Brunner <wikidesign@gmail.com>
12199c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net>
122*4f1e2cb3SGerrit Uitslag *
123*4f1e2cb3SGerrit Uitslag * @param int    $date      Timestamp of the change
124*4f1e2cb3SGerrit Uitslag * @param String $id        Name of the affected page
125*4f1e2cb3SGerrit Uitslag * @param String $type      Type of the change see DOKU_CHANGE_TYPE_*
126*4f1e2cb3SGerrit Uitslag * @param String $summary   Summary of the change
127*4f1e2cb3SGerrit Uitslag * @param mixed  $extra     In case of a revert the revision (timestmp) of the reverted page
128*4f1e2cb3SGerrit Uitslag * @param array  $flags     Additional flags in a key value array.
129*4f1e2cb3SGerrit Uitslag *                             Available flags:
130*4f1e2cb3SGerrit Uitslag *                             - (none, so far)
13199c8d7f2Smichael */
13299c8d7f2Smichaelfunction addMediaLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){
133de3eb1d7SAdrian Lang    global $conf;
134585bf44eSChristopher Smith    /** @var Input $INPUT */
135585bf44eSChristopher Smith    global $INPUT;
13699c8d7f2Smichael
13799c8d7f2Smichael    $id = cleanid($id);
13899c8d7f2Smichael
13999c8d7f2Smichael    if(!$date) $date = time(); //use current time if none supplied
1402f9daf16SAndreas Gohr    $remote = clientIP(true);
141585bf44eSChristopher Smith    $user   = $INPUT->server->str('REMOTE_USER');
14299c8d7f2Smichael
14399c8d7f2Smichael    $strip = array("\t", "\n");
14499c8d7f2Smichael    $logline = array(
14599c8d7f2Smichael            'date'  => $date,
14699c8d7f2Smichael            'ip'    => $remote,
14799c8d7f2Smichael            'type'  => str_replace($strip, '', $type),
14899c8d7f2Smichael            'id'    => $id,
14999c8d7f2Smichael            'user'  => $user,
1507fa35bb1SAndreas Gohr            'sum'   => utf8_substr(str_replace($strip, '', $summary),0,255),
15199c8d7f2Smichael            'extra' => str_replace($strip, '', $extra)
15299c8d7f2Smichael            );
15399c8d7f2Smichael
15499c8d7f2Smichael    // add changelog lines
15599c8d7f2Smichael    $logline = implode("\t", $logline)."\n";
15699c8d7f2Smichael    io_saveFile($conf['media_changelog'],$logline,true); //global media changelog cache
157e4f389efSKate Arzamastseva    io_saveFile(mediaMetaFN($id,'.changes'),$logline,true); //media file's changelog
15899c8d7f2Smichael}
15999c8d7f2Smichael
16099c8d7f2Smichael/**
1617d559c7fSBen Coburn * returns an array of recently changed files using the
1627d559c7fSBen Coburn * changelog
1637d559c7fSBen Coburn *
1647d559c7fSBen Coburn * The following constants can be used to control which changes are
1657d559c7fSBen Coburn * included. Add them together as needed.
1667d559c7fSBen Coburn *
1677d559c7fSBen Coburn * RECENTS_SKIP_DELETED   - don't include deleted pages
1687d559c7fSBen Coburn * RECENTS_SKIP_MINORS    - don't include minor changes
1697d559c7fSBen Coburn * RECENTS_SKIP_SUBSPACES - don't include subspaces
1700b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES  - return media changes instead of page changes
1710b926329SKate Arzamastseva * RECENTS_MEDIA_PAGES_MIXED  - return both media changes and page changes
1727d559c7fSBen Coburn *
1737d559c7fSBen Coburn * @param int    $first   number of first entry returned (for paginating
1747d559c7fSBen Coburn * @param int    $num     return $num entries
1757d559c7fSBen Coburn * @param string $ns      restrict to given namespace
17659f20ea3SMichael Hamann * @param int    $flags   see above
17759f20ea3SMichael Hamann * @return array recently changed files
1787d559c7fSBen Coburn *
1797d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
18029778747SKate Arzamastseva * @author Kate Arzamastseva <pshns@ukr.net>
1817d559c7fSBen Coburn */
1827d559c7fSBen Coburnfunction getRecents($first,$num,$ns='',$flags=0){
1837d559c7fSBen Coburn    global $conf;
1847d559c7fSBen Coburn    $recent = array();
1857d559c7fSBen Coburn    $count  = 0;
1867d559c7fSBen Coburn
1877d559c7fSBen Coburn    if(!$num)
1887d559c7fSBen Coburn        return $recent;
1897d559c7fSBen Coburn
1907d559c7fSBen Coburn    // read all recent changes. (kept short)
1910b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_CHANGES) {
19299c8d7f2Smichael        $lines = @file($conf['media_changelog']);
19399c8d7f2Smichael    } else {
19476d47b34SDavid Lorentsen        $lines = @file($conf['changelog']);
19599c8d7f2Smichael    }
19629778747SKate Arzamastseva    $lines_position = count($lines)-1;
19759f20ea3SMichael Hamann    $media_lines_position = 0;
19859f20ea3SMichael Hamann    $media_lines = array();
19929778747SKate Arzamastseva
2000b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_PAGES_MIXED) {
20129778747SKate Arzamastseva        $media_lines = @file($conf['media_changelog']);
20229778747SKate Arzamastseva        $media_lines_position = count($media_lines)-1;
20329778747SKate Arzamastseva    }
20429778747SKate Arzamastseva
20529778747SKate Arzamastseva    $seen = array(); // caches seen lines, _handleRecent() skips them
2067d559c7fSBen Coburn
2077d559c7fSBen Coburn    // handle lines
2080b926329SKate Arzamastseva    while ($lines_position >= 0 || (($flags & RECENTS_MEDIA_PAGES_MIXED) && $media_lines_position >=0)) {
20929778747SKate Arzamastseva        if (empty($rec) && $lines_position >= 0) {
2101d901ab2SAndreas Gohr            $rec = _handleRecent(@$lines[$lines_position], $ns, $flags, $seen);
21129778747SKate Arzamastseva            if (!$rec) {
21229778747SKate Arzamastseva                $lines_position --;
21329778747SKate Arzamastseva                continue;
21429778747SKate Arzamastseva            }
21529778747SKate Arzamastseva        }
2160b926329SKate Arzamastseva        if (($flags & RECENTS_MEDIA_PAGES_MIXED) && empty($media_rec) && $media_lines_position >= 0) {
21742025dfdSMichael Hamann            $media_rec = _handleRecent(@$media_lines[$media_lines_position], $ns, $flags | RECENTS_MEDIA_CHANGES, $seen);
21829778747SKate Arzamastseva            if (!$media_rec) {
21929778747SKate Arzamastseva                $media_lines_position --;
22029778747SKate Arzamastseva                continue;
22129778747SKate Arzamastseva            }
22229778747SKate Arzamastseva        }
2230b926329SKate Arzamastseva        if (($flags & RECENTS_MEDIA_PAGES_MIXED) && @$media_rec['date'] >= @$rec['date']) {
22429778747SKate Arzamastseva            $media_lines_position--;
22529778747SKate Arzamastseva            $x = $media_rec;
226b5941dfaSKate Arzamastseva            $x['media'] = true;
22729778747SKate Arzamastseva            $media_rec = false;
22829778747SKate Arzamastseva        } else {
22929778747SKate Arzamastseva            $lines_position--;
23029778747SKate Arzamastseva            $x = $rec;
231421ec38eSKate Arzamastseva            if ($flags & RECENTS_MEDIA_CHANGES) $x['media'] = true;
23229778747SKate Arzamastseva            $rec = false;
23329778747SKate Arzamastseva        }
2347d559c7fSBen Coburn        if(--$first >= 0) continue; // skip first entries
23529778747SKate Arzamastseva        $recent[] = $x;
2367d559c7fSBen Coburn        $count++;
2377d559c7fSBen Coburn        // break when we have enough entries
2387d559c7fSBen Coburn        if($count >= $num){ break; }
2397d559c7fSBen Coburn    }
2407d559c7fSBen Coburn    return $recent;
2417d559c7fSBen Coburn}
2427d559c7fSBen Coburn
2437d559c7fSBen Coburn/**
24499c8d7f2Smichael * returns an array of files changed since a given time using the
24599c8d7f2Smichael * changelog
24699c8d7f2Smichael *
24799c8d7f2Smichael * The following constants can be used to control which changes are
24899c8d7f2Smichael * included. Add them together as needed.
24999c8d7f2Smichael *
25099c8d7f2Smichael * RECENTS_SKIP_DELETED   - don't include deleted pages
25199c8d7f2Smichael * RECENTS_SKIP_MINORS    - don't include minor changes
25299c8d7f2Smichael * RECENTS_SKIP_SUBSPACES - don't include subspaces
2530b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES  - return media changes instead of page changes
25499c8d7f2Smichael *
25599c8d7f2Smichael * @param int    $from    date of the oldest entry to return
25699c8d7f2Smichael * @param int    $to      date of the newest entry to return (for pagination, optional)
25799c8d7f2Smichael * @param string $ns      restrict to given namespace (optional)
25859f20ea3SMichael Hamann * @param int    $flags   see above (optional)
25959f20ea3SMichael Hamann * @return array of files
26099c8d7f2Smichael *
26199c8d7f2Smichael * @author Michael Hamann <michael@content-space.de>
26299c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net>
26399c8d7f2Smichael */
26499c8d7f2Smichaelfunction getRecentsSince($from,$to=null,$ns='',$flags=0){
26599c8d7f2Smichael    global $conf;
26699c8d7f2Smichael    $recent = array();
26799c8d7f2Smichael
26899c8d7f2Smichael    if($to && $to < $from)
26999c8d7f2Smichael        return $recent;
27099c8d7f2Smichael
27199c8d7f2Smichael    // read all recent changes. (kept short)
2720b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_CHANGES) {
27399c8d7f2Smichael        $lines = @file($conf['media_changelog']);
27499c8d7f2Smichael    } else {
27599c8d7f2Smichael        $lines = @file($conf['changelog']);
27699c8d7f2Smichael    }
277e920a0a1SAndreas Gohr    if(!$lines) return $recent;
27899c8d7f2Smichael
27999c8d7f2Smichael    // we start searching at the end of the list
28099c8d7f2Smichael    $lines = array_reverse($lines);
28199c8d7f2Smichael
28299c8d7f2Smichael    // handle lines
28399c8d7f2Smichael    $seen = array(); // caches seen lines, _handleRecent() skips them
28499c8d7f2Smichael
28599c8d7f2Smichael    foreach($lines as $line){
28699c8d7f2Smichael        $rec = _handleRecent($line, $ns, $flags, $seen);
28799c8d7f2Smichael        if($rec !== false) {
28899c8d7f2Smichael            if ($rec['date'] >= $from) {
28999c8d7f2Smichael                if (!$to || $rec['date'] <= $to) {
29099c8d7f2Smichael                    $recent[] = $rec;
29199c8d7f2Smichael                }
29299c8d7f2Smichael            } else {
29399c8d7f2Smichael                break;
29499c8d7f2Smichael            }
29599c8d7f2Smichael        }
29699c8d7f2Smichael    }
29799c8d7f2Smichael
29899c8d7f2Smichael    return array_reverse($recent);
29999c8d7f2Smichael}
30099c8d7f2Smichael
30199c8d7f2Smichael/**
3027d559c7fSBen Coburn * Internal function used by getRecents
3037d559c7fSBen Coburn *
3047d559c7fSBen Coburn * don't call directly
3057d559c7fSBen Coburn *
3067d559c7fSBen Coburn * @see getRecents()
3077d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org>
3087d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
309*4f1e2cb3SGerrit Uitslag *
310*4f1e2cb3SGerrit Uitslag * @param string $line   changelog line
311*4f1e2cb3SGerrit Uitslag * @param string $ns     restrict to given namespace
312*4f1e2cb3SGerrit Uitslag * @param int    $flags  flags to control which changes are included
313*4f1e2cb3SGerrit Uitslag * @param array  $seen   listing of seen pages
314*4f1e2cb3SGerrit Uitslag * @return array|bool    false or array with info about a change
3157d559c7fSBen Coburn */
31699c8d7f2Smichaelfunction _handleRecent($line,$ns,$flags,&$seen){
3177d559c7fSBen Coburn    if(empty($line)) return false;   //skip empty lines
3187d559c7fSBen Coburn
3197d559c7fSBen Coburn    // split the line into parts
3207d559c7fSBen Coburn    $recent = parseChangelogLine($line);
3217d559c7fSBen Coburn    if ($recent===false) { return false; }
3227d559c7fSBen Coburn
3237d559c7fSBen Coburn    // skip seen ones
3247d559c7fSBen Coburn    if(isset($seen[$recent['id']])) return false;
3257d559c7fSBen Coburn
3267d559c7fSBen Coburn    // skip minors
327ebf1501fSBen Coburn    if($recent['type']===DOKU_CHANGE_TYPE_MINOR_EDIT && ($flags & RECENTS_SKIP_MINORS)) return false;
3287d559c7fSBen Coburn
3297d559c7fSBen Coburn    // remember in seen to skip additional sights
3307d559c7fSBen Coburn    $seen[$recent['id']] = 1;
3317d559c7fSBen Coburn
3327d559c7fSBen Coburn    // check if it's a hidden page
3337d559c7fSBen Coburn    if(isHiddenPage($recent['id'])) return false;
3347d559c7fSBen Coburn
3357d559c7fSBen Coburn    // filter namespace
3367d559c7fSBen Coburn    if (($ns) && (strpos($recent['id'],$ns.':') !== 0)) return false;
3377d559c7fSBen Coburn
3387d559c7fSBen Coburn    // exclude subnamespaces
3397d559c7fSBen Coburn    if (($flags & RECENTS_SKIP_SUBSPACES) && (getNS($recent['id']) != $ns)) return false;
3407d559c7fSBen Coburn
3417d559c7fSBen Coburn    // check ACL
34242025dfdSMichael Hamann    if ($flags & RECENTS_MEDIA_CHANGES) {
34342025dfdSMichael Hamann        $recent['perms'] = auth_quickaclcheck(getNS($recent['id']).':*');
34442025dfdSMichael Hamann    } else {
34599c8d7f2Smichael        $recent['perms'] = auth_quickaclcheck($recent['id']);
34642025dfdSMichael Hamann    }
34799c8d7f2Smichael    if ($recent['perms'] < AUTH_READ) return false;
3487d559c7fSBen Coburn
3497d559c7fSBen Coburn    // check existance
3501d901ab2SAndreas Gohr    if($flags & RECENTS_SKIP_DELETED){
35142025dfdSMichael Hamann        $fn = (($flags & RECENTS_MEDIA_CHANGES) ? mediaFN($recent['id']) : wikiFN($recent['id']));
3521d901ab2SAndreas Gohr        if(!@file_exists($fn)) return false;
3531d901ab2SAndreas Gohr    }
3547d559c7fSBen Coburn
3557d559c7fSBen Coburn    return $recent;
3567d559c7fSBen Coburn}
3577d559c7fSBen Coburn
3587d559c7fSBen Coburn/**
359047bad06SGerrit Uitslag * Class ChangeLog
360047bad06SGerrit Uitslag * methods for handling of changelog of pages or media files
3618eccf945SGerrit Uitslag */
362047bad06SGerrit Uitslagabstract class ChangeLog {
3638eccf945SGerrit Uitslag
3648eccf945SGerrit Uitslag    /** @var string */
365047bad06SGerrit Uitslag    protected $id;
3668eccf945SGerrit Uitslag    /** @var int */
367047bad06SGerrit Uitslag    protected $chunk_size;
3688eccf945SGerrit Uitslag    /** @var array */
369047bad06SGerrit Uitslag    protected $cache;
3708eccf945SGerrit Uitslag
3718eccf945SGerrit Uitslag    /**
3728eccf945SGerrit Uitslag     * Constructor
3738eccf945SGerrit Uitslag     *
3748eccf945SGerrit Uitslag     * @param string $id         page id
3758eccf945SGerrit Uitslag     * @param int $chunk_size maximum block size read from file
3768eccf945SGerrit Uitslag     */
3778eccf945SGerrit Uitslag    public function __construct($id, $chunk_size = 8192) {
3788eccf945SGerrit Uitslag        global $cache_revinfo;
3798eccf945SGerrit Uitslag
3808eccf945SGerrit Uitslag        $this->cache =& $cache_revinfo;
3818eccf945SGerrit Uitslag        if(!isset($this->cache[$id])) {
3828eccf945SGerrit Uitslag            $this->cache[$id] = array();
3838eccf945SGerrit Uitslag        }
3848eccf945SGerrit Uitslag
3858eccf945SGerrit Uitslag        $this->id = $id;
3868eccf945SGerrit Uitslag        $this->setChunkSize($chunk_size);
3878eccf945SGerrit Uitslag
3888eccf945SGerrit Uitslag    }
3898eccf945SGerrit Uitslag
3908eccf945SGerrit Uitslag    /**
3918eccf945SGerrit Uitslag     * Set chunk size for file reading
392047bad06SGerrit Uitslag     * Chunk size zero let read whole file at once
3938eccf945SGerrit Uitslag     *
3948eccf945SGerrit Uitslag     * @param int $chunk_size maximum block size read from file
3958eccf945SGerrit Uitslag     */
3968eccf945SGerrit Uitslag    public function setChunkSize($chunk_size) {
3978eccf945SGerrit Uitslag        if(!is_numeric($chunk_size)) $chunk_size = 0;
3988eccf945SGerrit Uitslag
3998eccf945SGerrit Uitslag        $this->chunk_size = (int) max($chunk_size, 0);
4008eccf945SGerrit Uitslag    }
4018eccf945SGerrit Uitslag
4028eccf945SGerrit Uitslag    /**
403047bad06SGerrit Uitslag     * Returns path to changelog
404047bad06SGerrit Uitslag     *
405047bad06SGerrit Uitslag     * @return string path to file
406047bad06SGerrit Uitslag     */
407047bad06SGerrit Uitslag    abstract protected function getChangelogFilename();
408047bad06SGerrit Uitslag
409047bad06SGerrit Uitslag    /**
410047bad06SGerrit Uitslag     * Returns path to current page/media
411047bad06SGerrit Uitslag     *
412047bad06SGerrit Uitslag     * @return string path to file
413047bad06SGerrit Uitslag     */
414047bad06SGerrit Uitslag    abstract protected function getFilename();
415047bad06SGerrit Uitslag
416047bad06SGerrit Uitslag    /**
4178eccf945SGerrit Uitslag     * Get the changelog information for a specific page id and revision (timestamp)
4188eccf945SGerrit Uitslag     *
4198eccf945SGerrit Uitslag     * Adjacent changelog lines are optimistically parsed and cached to speed up
4208eccf945SGerrit Uitslag     * consecutive calls to getRevisionInfo. For large changelog files, only the chunk
4218eccf945SGerrit Uitslag     * containing the requested changelog line is read.
4228eccf945SGerrit Uitslag     *
4238eccf945SGerrit Uitslag     * @param int $rev        revision timestamp
4248eccf945SGerrit Uitslag     * @return bool|array false or array with entries:
4258eccf945SGerrit Uitslag     *      - date:  unix timestamp
4268eccf945SGerrit Uitslag     *      - ip:    IPv4 address (127.0.0.1)
4278eccf945SGerrit Uitslag     *      - type:  log line type
4288eccf945SGerrit Uitslag     *      - id:    page id
4298eccf945SGerrit Uitslag     *      - user:  user name
4308eccf945SGerrit Uitslag     *      - sum:   edit summary (or action reason)
4318eccf945SGerrit Uitslag     *      - extra: extra data (varies by line type)
4327d559c7fSBen Coburn     *
4337d559c7fSBen Coburn     * @author Ben Coburn <btcoburn@silicodon.net>
43429778747SKate Arzamastseva     * @author Kate Arzamastseva <pshns@ukr.net>
4357d559c7fSBen Coburn     */
436047bad06SGerrit Uitslag    public function getRevisionInfo($rev) {
4377d559c7fSBen Coburn        $rev = max($rev, 0);
4387d559c7fSBen Coburn
4397d559c7fSBen Coburn        // check if it's already in the memory cache
4408eccf945SGerrit Uitslag        if(isset($this->cache[$this->id]) && isset($this->cache[$this->id][$rev])) {
4418eccf945SGerrit Uitslag            return $this->cache[$this->id][$rev];
442e4f389efSKate Arzamastseva        }
4437d559c7fSBen Coburn
444040f0e13SKlap-in        //read lines from changelog
445047bad06SGerrit Uitslag        list($fp, $lines) = $this->readloglines($rev);
446040f0e13SKlap-in        if($fp) {
4477d559c7fSBen Coburn            fclose($fp);
4487d559c7fSBen Coburn        }
449040f0e13SKlap-in        if(empty($lines)) return false;
4507d559c7fSBen Coburn
4517d559c7fSBen Coburn        // parse and cache changelog lines
4527d559c7fSBen Coburn        foreach($lines as $value) {
4537d559c7fSBen Coburn            $tmp = parseChangelogLine($value);
4547d559c7fSBen Coburn            if($tmp !== false) {
4558eccf945SGerrit Uitslag                $this->cache[$this->id][$tmp['date']] = $tmp;
4567d559c7fSBen Coburn            }
4577d559c7fSBen Coburn        }
4588eccf945SGerrit Uitslag        if(!isset($this->cache[$this->id][$rev])) {
4598eccf945SGerrit Uitslag            return false;
4608eccf945SGerrit Uitslag        }
4618eccf945SGerrit Uitslag        return $this->cache[$this->id][$rev];
4627d559c7fSBen Coburn    }
4637d559c7fSBen Coburn
4647d559c7fSBen Coburn    /**
4657d559c7fSBen Coburn     * Return a list of page revisions numbers
4668eccf945SGerrit Uitslag     *
4677d559c7fSBen Coburn     * Does not guarantee that the revision exists in the attic,
4687d559c7fSBen Coburn     * only that a line with the date exists in the changelog.
4697d559c7fSBen Coburn     * By default the current revision is skipped.
4707d559c7fSBen Coburn     *
4717d559c7fSBen Coburn     * The current revision is automatically skipped when the page exists.
4727d559c7fSBen Coburn     * See $INFO['meta']['last_change'] for the current revision.
4738eccf945SGerrit Uitslag     * A negative $first let read the current revision too.
4747d559c7fSBen Coburn     *
4757d559c7fSBen Coburn     * For efficiency, the log lines are parsed and cached for later
4767d559c7fSBen Coburn     * calls to getRevisionInfo. Large changelog files are read
477c66972f2SAdrian Lang     * backwards in chunks until the requested number of changelog
4787d559c7fSBen Coburn     * lines are recieved.
4797d559c7fSBen Coburn     *
4808eccf945SGerrit Uitslag     * @param int $first      skip the first n changelog lines
4818eccf945SGerrit Uitslag     * @param int $num        number of revisions to return
4828eccf945SGerrit Uitslag     * @return array with the revision timestamps
4838eccf945SGerrit Uitslag     *
4847d559c7fSBen Coburn     * @author Ben Coburn <btcoburn@silicodon.net>
48529778747SKate Arzamastseva     * @author Kate Arzamastseva <pshns@ukr.net>
4867d559c7fSBen Coburn     */
487047bad06SGerrit Uitslag    public function getRevisions($first, $num) {
4887d559c7fSBen Coburn        $revs = array();
4897d559c7fSBen Coburn        $lines = array();
4907d559c7fSBen Coburn        $count = 0;
491047bad06SGerrit Uitslag
4927d559c7fSBen Coburn        $num = max($num, 0);
4937d1e323eSGerrit Uitslag        if($num == 0) {
4947d1e323eSGerrit Uitslag            return $revs;
4957d1e323eSGerrit Uitslag        }
496092b7683SKlap-in
497b824abd4SAndreas Gohr        if($first < 0) {
498b824abd4SAndreas Gohr            $first = 0;
499047bad06SGerrit Uitslag        } else if(@file_exists($this->getFilename())) {
5007d559c7fSBen Coburn            // skip current revision if the page exists
5017d559c7fSBen Coburn            $first = max($first + 1, 0);
5027d559c7fSBen Coburn        }
5037d559c7fSBen Coburn
504047bad06SGerrit Uitslag        $file = $this->getChangelogFilename();
505047bad06SGerrit Uitslag
5067d1e323eSGerrit Uitslag        if(!@file_exists($file)) {
5077d1e323eSGerrit Uitslag            return $revs;
5087d1e323eSGerrit Uitslag        }
5098eccf945SGerrit Uitslag        if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) {
5107d559c7fSBen Coburn            // read whole file
5117d559c7fSBen Coburn            $lines = file($file);
5127d1e323eSGerrit Uitslag            if($lines === false) {
5137d1e323eSGerrit Uitslag                return $revs;
5147d1e323eSGerrit Uitslag            }
5157d559c7fSBen Coburn        } else {
5167d559c7fSBen Coburn            // read chunks backwards
5177d559c7fSBen Coburn            $fp = fopen($file, 'rb'); // "file pointer"
5187d1e323eSGerrit Uitslag            if($fp === false) {
5197d1e323eSGerrit Uitslag                return $revs;
5207d1e323eSGerrit Uitslag            }
5217d559c7fSBen Coburn            fseek($fp, 0, SEEK_END);
5227d559c7fSBen Coburn            $tail = ftell($fp);
5237d559c7fSBen Coburn
5247d559c7fSBen Coburn            // chunk backwards
5258eccf945SGerrit Uitslag            $finger = max($tail - $this->chunk_size, 0);
5267d559c7fSBen Coburn            while($count < $num + $first) {
5277d1e323eSGerrit Uitslag                $nl = $this->getNewlinepointer($fp, $finger);
528b824abd4SAndreas Gohr
529b824abd4SAndreas Gohr                // was the chunk big enough? if not, take another bite
530b824abd4SAndreas Gohr                if($nl > 0 && $tail <= $nl) {
5318eccf945SGerrit Uitslag                    $finger = max($finger - $this->chunk_size, 0);
532b824abd4SAndreas Gohr                    continue;
533b824abd4SAndreas Gohr                } else {
534b824abd4SAndreas Gohr                    $finger = $nl;
5357d559c7fSBen Coburn                }
5367d559c7fSBen Coburn
5377d559c7fSBen Coburn                // read chunk
5387d559c7fSBen Coburn                $chunk = '';
5397d559c7fSBen Coburn                $read_size = max($tail - $finger, 0); // found chunk size
5407d559c7fSBen Coburn                $got = 0;
5417d559c7fSBen Coburn                while($got < $read_size && !feof($fp)) {
54280e97297SGerrit Uitslag                    $tmp = @fread($fp, max(min($this->chunk_size, $read_size - $got), 0));
5437d1e323eSGerrit Uitslag                    if($tmp === false) {
5447d1e323eSGerrit Uitslag                        break;
5457d1e323eSGerrit Uitslag                    } //error state
5467d559c7fSBen Coburn                    $got += strlen($tmp);
5477d559c7fSBen Coburn                    $chunk .= $tmp;
5487d559c7fSBen Coburn                }
5497d559c7fSBen Coburn                $tmp = explode("\n", $chunk);
5507d559c7fSBen Coburn                array_pop($tmp); // remove trailing newline
5517d559c7fSBen Coburn
5527d559c7fSBen Coburn                // combine with previous chunk
5537d559c7fSBen Coburn                $count += count($tmp);
5547d559c7fSBen Coburn                $lines = array_merge($tmp, $lines);
5557d559c7fSBen Coburn
5567d559c7fSBen Coburn                // next chunk
5577d1e323eSGerrit Uitslag                if($finger == 0) {
5587d1e323eSGerrit Uitslag                    break;
5597d1e323eSGerrit Uitslag                } // already read all the lines
5607d559c7fSBen Coburn                else {
5617d559c7fSBen Coburn                    $tail = $finger;
5628eccf945SGerrit Uitslag                    $finger = max($tail - $this->chunk_size, 0);
5637d559c7fSBen Coburn                }
5647d559c7fSBen Coburn            }
5657d559c7fSBen Coburn            fclose($fp);
5667d559c7fSBen Coburn        }
5677d559c7fSBen Coburn
5687d559c7fSBen Coburn        // skip parsing extra lines
5697d559c7fSBen Coburn        $num = max(min(count($lines) - $first, $num), 0);
5707d559c7fSBen Coburn        if     ($first > 0 && $num > 0)  { $lines = array_slice($lines, max(count($lines) - $first - $num, 0), $num); }
5717d559c7fSBen Coburn        else if($first > 0 && $num == 0) { $lines = array_slice($lines, 0, max(count($lines) - $first, 0)); }
5727d559c7fSBen Coburn        else if($first == 0 && $num > 0) { $lines = array_slice($lines, max(count($lines) - $num, 0)); }
5737d559c7fSBen Coburn
5747d559c7fSBen Coburn        // handle lines in reverse order
5757d559c7fSBen Coburn        for($i = count($lines) - 1; $i >= 0; $i--) {
5767d559c7fSBen Coburn            $tmp = parseChangelogLine($lines[$i]);
5777d559c7fSBen Coburn            if($tmp !== false) {
5788eccf945SGerrit Uitslag                $this->cache[$this->id][$tmp['date']] = $tmp;
5797d559c7fSBen Coburn                $revs[] = $tmp['date'];
5807d559c7fSBen Coburn            }
5817d559c7fSBen Coburn        }
5827d559c7fSBen Coburn
5837d559c7fSBen Coburn        return $revs;
5847d559c7fSBen Coburn    }
5857d559c7fSBen Coburn
586f9528c0cSKlap-in    /**
5878eccf945SGerrit Uitslag     * Get the nth revision left or right handside  for a specific page id and revision (timestamp)
5888eccf945SGerrit Uitslag     *
5898eccf945SGerrit Uitslag     * For large changelog files, only the chunk containing the
590f9528c0cSKlap-in     * reference revision $rev is read and sometimes a next chunck.
591f9528c0cSKlap-in     *
592f9528c0cSKlap-in     * Adjacent changelog lines are optimistically parsed and cached to speed up
593f9528c0cSKlap-in     * consecutive calls to getRevisionInfo.
594f9528c0cSKlap-in     *
595f9528c0cSKlap-in     * @param int $rev        revision timestamp used as startdate (doesn't need to be revisionnumber)
596f9528c0cSKlap-in     * @param int $direction  give position of returned revision with respect to $rev; positive=next, negative=prev
5978eccf945SGerrit Uitslag     * @return bool|int
5988eccf945SGerrit Uitslag     *      timestamp of the requested revision
5998eccf945SGerrit Uitslag     *      otherwise false
600f9528c0cSKlap-in     */
601047bad06SGerrit Uitslag    public function getRelativeRevision($rev, $direction) {
602f9528c0cSKlap-in        $rev = max($rev, 0);
603040f0e13SKlap-in        $direction = (int) $direction;
6047d559c7fSBen Coburn
605f9528c0cSKlap-in        //no direction given or last rev, so no follow-up
606ee33e0c5SGerrit Uitslag        if(!$direction || ($direction > 0 && $this->isCurrentRevision($rev))) {
607f9528c0cSKlap-in            return false;
608f9528c0cSKlap-in        }
609f9528c0cSKlap-in
610040f0e13SKlap-in        //get lines from changelog
611047bad06SGerrit Uitslag        list($fp, $lines, $head, $tail, $eof) = $this->readloglines($rev);
612040f0e13SKlap-in        if(empty($lines)) return false;
613040f0e13SKlap-in
614040f0e13SKlap-in        // look for revisions later/earlier then $rev, when founded count till the wanted revision is reached
615040f0e13SKlap-in        // also parse and cache changelog lines for getRevisionInfo().
616040f0e13SKlap-in        $revcounter = 0;
617040f0e13SKlap-in        $relativerev = false;
618040f0e13SKlap-in        $checkotherchunck = true; //always runs once
619040f0e13SKlap-in        while(!$relativerev && $checkotherchunck) {
620040f0e13SKlap-in            $tmp = array();
621040f0e13SKlap-in            //parse in normal or reverse order
622040f0e13SKlap-in            $count = count($lines);
623040f0e13SKlap-in            if($direction > 0) {
624040f0e13SKlap-in                $start = 0;
625040f0e13SKlap-in                $step = 1;
626040f0e13SKlap-in            } else {
627040f0e13SKlap-in                $start = $count - 1;
628040f0e13SKlap-in                $step = -1;
629040f0e13SKlap-in            }
630040f0e13SKlap-in            for($i = $start; $i >= 0 && $i < $count; $i = $i + $step) {
631040f0e13SKlap-in                $tmp = parseChangelogLine($lines[$i]);
632040f0e13SKlap-in                if($tmp !== false) {
6338eccf945SGerrit Uitslag                    $this->cache[$this->id][$tmp['date']] = $tmp;
634040f0e13SKlap-in                    //look for revs older/earlier then reference $rev and select $direction-th one
635040f0e13SKlap-in                    if(($direction > 0 && $tmp['date'] > $rev) || ($direction < 0 && $tmp['date'] < $rev)) {
636040f0e13SKlap-in                        $revcounter++;
637040f0e13SKlap-in                        if($revcounter == abs($direction)) {
638040f0e13SKlap-in                            $relativerev = $tmp['date'];
639040f0e13SKlap-in                        }
640040f0e13SKlap-in                    }
641040f0e13SKlap-in                }
642040f0e13SKlap-in            }
643040f0e13SKlap-in
644040f0e13SKlap-in            //true when $rev is found, but not the wanted follow-up.
645040f0e13SKlap-in            $checkotherchunck = $fp
646040f0e13SKlap-in                && ($tmp['date'] == $rev || ($revcounter > 0 && !$relativerev))
647040f0e13SKlap-in                && !(($tail == $eof && $direction > 0) || ($head == 0 && $direction < 0));
648040f0e13SKlap-in
649040f0e13SKlap-in            if($checkotherchunck) {
6501da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, $direction);
651040f0e13SKlap-in
652040f0e13SKlap-in                if(empty($lines)) break;
653040f0e13SKlap-in            }
654040f0e13SKlap-in        }
655040f0e13SKlap-in        if($fp) {
656040f0e13SKlap-in            fclose($fp);
657040f0e13SKlap-in        }
658040f0e13SKlap-in
659040f0e13SKlap-in        return $relativerev;
660040f0e13SKlap-in    }
661040f0e13SKlap-in
662040f0e13SKlap-in    /**
6631da8dc97SGerrit Uitslag     * Returns revisions around rev1 and rev2
6641da8dc97SGerrit Uitslag     * When available it returns $max entries for each revision
6651da8dc97SGerrit Uitslag     *
6661da8dc97SGerrit Uitslag     * @param int $rev1 oldest revision timestamp
667621bbd2aSGerrit Uitslag     * @param int $rev2 newest revision timestamp (0 looks up last revision)
6681da8dc97SGerrit Uitslag     * @param int $max maximum number of revisions returned
6691da8dc97SGerrit Uitslag     * @return array with two arrays with revisions surrounding rev1 respectively rev2
6701da8dc97SGerrit Uitslag     */
6711da8dc97SGerrit Uitslag    public function getRevisionsAround($rev1, $rev2, $max = 50) {
6721da8dc97SGerrit Uitslag        $max = floor(abs($max) / 2)*2 + 1;
6731da8dc97SGerrit Uitslag        $rev1 = max($rev1, 0);
6741da8dc97SGerrit Uitslag        $rev2 = max($rev2, 0);
6751da8dc97SGerrit Uitslag
676621bbd2aSGerrit Uitslag        if($rev2) {
6771da8dc97SGerrit Uitslag            if($rev2 < $rev1) {
6781da8dc97SGerrit Uitslag                $rev = $rev2;
6791da8dc97SGerrit Uitslag                $rev2 = $rev1;
6801da8dc97SGerrit Uitslag                $rev1 = $rev;
6811da8dc97SGerrit Uitslag            }
682621bbd2aSGerrit Uitslag        } else {
683621bbd2aSGerrit Uitslag            //empty right side means a removed page. Look up last revision.
684621bbd2aSGerrit Uitslag            $revs = $this->getRevisions(-1, 1);
685621bbd2aSGerrit Uitslag            $rev2 = $revs[0];
686621bbd2aSGerrit Uitslag        }
6871da8dc97SGerrit Uitslag        //collect revisions around rev2
6881da8dc97SGerrit Uitslag        list($revs2, $allrevs, $fp, $lines, $head, $tail) = $this->retrieveRevisionsAround($rev2, $max);
6891da8dc97SGerrit Uitslag
6901da8dc97SGerrit Uitslag        if(empty($revs2)) return array(array(), array());
6911da8dc97SGerrit Uitslag
6921da8dc97SGerrit Uitslag        //collect revisions around rev1
6931da8dc97SGerrit Uitslag        $index = array_search($rev1, $allrevs);
6941da8dc97SGerrit Uitslag        if($index === false) {
6951da8dc97SGerrit Uitslag            //no overlapping revisions
6961da8dc97SGerrit Uitslag            list($revs1,,,,,) = $this->retrieveRevisionsAround($rev1, $max);
6971da8dc97SGerrit Uitslag            if(empty($revs1)) $revs1 = array();
6981da8dc97SGerrit Uitslag        } else {
6991da8dc97SGerrit Uitslag            //revisions overlaps, reuse revisions around rev2
7001da8dc97SGerrit Uitslag            $revs1 = $allrevs;
7011da8dc97SGerrit Uitslag            while($head > 0) {
7021da8dc97SGerrit Uitslag                for($i = count($lines) - 1; $i >= 0; $i--) {
7031da8dc97SGerrit Uitslag                    $tmp = parseChangelogLine($lines[$i]);
7041da8dc97SGerrit Uitslag                    if($tmp !== false) {
7051da8dc97SGerrit Uitslag                        $this->cache[$this->id][$tmp['date']] = $tmp;
7061da8dc97SGerrit Uitslag                        $revs1[] = $tmp['date'];
7071da8dc97SGerrit Uitslag                        $index++;
7081da8dc97SGerrit Uitslag
7091da8dc97SGerrit Uitslag                        if($index > floor($max / 2)) break 2;
7101da8dc97SGerrit Uitslag                    }
7111da8dc97SGerrit Uitslag                }
7121da8dc97SGerrit Uitslag
7131da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1);
7141da8dc97SGerrit Uitslag            }
7151da8dc97SGerrit Uitslag            sort($revs1);
7161da8dc97SGerrit Uitslag            //return wanted selection
7171da8dc97SGerrit Uitslag            $revs1 = array_slice($revs1, max($index - floor($max/2), 0), $max);
7181da8dc97SGerrit Uitslag        }
7191da8dc97SGerrit Uitslag
7202e608c52SGerrit Uitslag        return array(array_reverse($revs1), array_reverse($revs2));
7211da8dc97SGerrit Uitslag    }
7221da8dc97SGerrit Uitslag
7231da8dc97SGerrit Uitslag    /**
7248eccf945SGerrit Uitslag     * Returns lines from changelog.
725040f0e13SKlap-in     * If file larger than $chuncksize, only chunck is read that could contain $rev.
726040f0e13SKlap-in     *
727040f0e13SKlap-in     * @param int $rev   revision timestamp
728040f0e13SKlap-in     * @return array(fp, array(changeloglines), $head, $tail, $eof)|bool
729040f0e13SKlap-in     *     returns false when not succeed. fp only defined for chuck reading, needs closing.
730040f0e13SKlap-in     */
731047bad06SGerrit Uitslag    protected function readloglines($rev) {
732047bad06SGerrit Uitslag        $file = $this->getChangelogFilename();
7338eccf945SGerrit Uitslag
734f9528c0cSKlap-in        if(!@file_exists($file)) {
735f9528c0cSKlap-in            return false;
736f9528c0cSKlap-in        }
737f9528c0cSKlap-in
738f9528c0cSKlap-in        $fp = null;
739f9528c0cSKlap-in        $head = 0;
740040f0e13SKlap-in        $tail = 0;
741f9528c0cSKlap-in        $eof = 0;
7428eccf945SGerrit Uitslag
7438eccf945SGerrit Uitslag        if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) {
744f9528c0cSKlap-in            // read whole file
745f9528c0cSKlap-in            $lines = file($file);
746f9528c0cSKlap-in            if($lines === false) {
747f9528c0cSKlap-in                return false;
748f9528c0cSKlap-in            }
749f9528c0cSKlap-in        } else {
750f9528c0cSKlap-in            // read by chunk
751f9528c0cSKlap-in            $fp = fopen($file, 'rb'); // "file pointer"
752f9528c0cSKlap-in            if($fp === false) {
753f9528c0cSKlap-in                return false;
754040f0e13SKlap-in            }
755f9528c0cSKlap-in            $head = 0;
756040f0e13SKlap-in            fseek($fp, 0, SEEK_END);
757040f0e13SKlap-in            $eof = ftell($fp);
758040f0e13SKlap-in            $tail = $eof;
759f9528c0cSKlap-in
760f9528c0cSKlap-in            // find chunk
7618eccf945SGerrit Uitslag            while($tail - $head > $this->chunk_size) {
762f9528c0cSKlap-in                $finger = $head + floor(($tail - $head) / 2.0);
7638eccf945SGerrit Uitslag                $finger = $this->getNewlinepointer($fp, $finger);
764040f0e13SKlap-in                $tmp = fgets($fp);
765f9528c0cSKlap-in                if($finger == $head || $finger == $tail) {
766f9528c0cSKlap-in                    break;
767f9528c0cSKlap-in                }
76859cce2d9SGerrit Uitslag                $tmp = parseChangelogLine($tmp);
76959cce2d9SGerrit Uitslag                $finger_rev = $tmp['date'];
77059cce2d9SGerrit Uitslag
771f9528c0cSKlap-in                if($finger_rev > $rev) {
772f9528c0cSKlap-in                    $tail = $finger;
773f9528c0cSKlap-in                } else {
774f9528c0cSKlap-in                    $head = $finger;
775f9528c0cSKlap-in                }
776f9528c0cSKlap-in            }
777f9528c0cSKlap-in
778f9528c0cSKlap-in            if($tail - $head < 1) {
779f9528c0cSKlap-in                // cound not find chunk, assume requested rev is missing
780f9528c0cSKlap-in                fclose($fp);
781f9528c0cSKlap-in                return false;
782f9528c0cSKlap-in            }
783f9528c0cSKlap-in
7848eccf945SGerrit Uitslag            $lines = $this->readChunk($fp, $head, $tail);
785f9528c0cSKlap-in        }
786040f0e13SKlap-in        return array(
787040f0e13SKlap-in            $fp,
788040f0e13SKlap-in            $lines,
789040f0e13SKlap-in            $head,
790040f0e13SKlap-in            $tail,
791040f0e13SKlap-in            $eof
792040f0e13SKlap-in        );
793f9528c0cSKlap-in    }
794f9528c0cSKlap-in
795f9528c0cSKlap-in    /**
796f9528c0cSKlap-in     * Read chunk and return array with lines of given chunck.
797f9528c0cSKlap-in     * Has no check if $head and $tail are really at a new line
798f9528c0cSKlap-in     *
799*4f1e2cb3SGerrit Uitslag     * @param resource $fp    resource filepointer
800*4f1e2cb3SGerrit Uitslag     * @param int      $head  start point chunck
801*4f1e2cb3SGerrit Uitslag     * @param int      $tail  end point chunck
802f9528c0cSKlap-in     * @return array lines read from chunck
803f9528c0cSKlap-in     */
8048eccf945SGerrit Uitslag    protected function readChunk($fp, $head, $tail) {
805f9528c0cSKlap-in        $chunk = '';
806f9528c0cSKlap-in        $chunk_size = max($tail - $head, 0); // found chunk size
807f9528c0cSKlap-in        $got = 0;
808f9528c0cSKlap-in        fseek($fp, $head);
809f9528c0cSKlap-in        while($got < $chunk_size && !feof($fp)) {
81059cce2d9SGerrit Uitslag            $tmp = @fread($fp, max(min($this->chunk_size, $chunk_size - $got), 0));
811040f0e13SKlap-in            if($tmp === false) { //error state
812f9528c0cSKlap-in                break;
813040f0e13SKlap-in            }
814f9528c0cSKlap-in            $got += strlen($tmp);
815f9528c0cSKlap-in            $chunk .= $tmp;
816f9528c0cSKlap-in        }
817f9528c0cSKlap-in        $lines = explode("\n", $chunk);
818f9528c0cSKlap-in        array_pop($lines); // remove trailing newline
819f9528c0cSKlap-in        return $lines;
820f9528c0cSKlap-in    }
821f9528c0cSKlap-in
822f9528c0cSKlap-in    /**
823f9528c0cSKlap-in     * Set pointer to first new line after $finger and return its position
824f9528c0cSKlap-in     *
8251da8dc97SGerrit Uitslag     * @param resource $fp      filepointer
826*4f1e2cb3SGerrit Uitslag     * @param int      $finger  a pointer
827f9528c0cSKlap-in     * @return int pointer
828f9528c0cSKlap-in     */
8298eccf945SGerrit Uitslag    protected function getNewlinepointer($fp, $finger) {
830f9528c0cSKlap-in        fseek($fp, $finger);
83159cce2d9SGerrit Uitslag        $nl = $finger;
83259cce2d9SGerrit Uitslag        if($finger > 0) {
833f9528c0cSKlap-in            fgets($fp); // slip the finger forward to a new line
83459cce2d9SGerrit Uitslag            $nl = ftell($fp);
83559cce2d9SGerrit Uitslag        }
83659cce2d9SGerrit Uitslag        return $nl;
837f9528c0cSKlap-in    }
8388eccf945SGerrit Uitslag
8398eccf945SGerrit Uitslag    /**
8408eccf945SGerrit Uitslag     * Check whether given revision is the current page
8418eccf945SGerrit Uitslag     *
8428eccf945SGerrit Uitslag     * @param int $rev   timestamp of current page
8438eccf945SGerrit Uitslag     * @return bool true if $rev is current revision, otherwise false
8448eccf945SGerrit Uitslag     */
845047bad06SGerrit Uitslag    public function isCurrentRevision($rev) {
846047bad06SGerrit Uitslag        return $rev == @filemtime($this->getFilename());
8478eccf945SGerrit Uitslag    }
8481da8dc97SGerrit Uitslag
8491da8dc97SGerrit Uitslag    /**
8501da8dc97SGerrit Uitslag     * Returns the next lines of the changelog  of the chunck before head or after tail
8511da8dc97SGerrit Uitslag     *
8521da8dc97SGerrit Uitslag     * @param resource $fp filepointer
8531da8dc97SGerrit Uitslag     * @param int $head position head of last chunk
8541da8dc97SGerrit Uitslag     * @param int $tail position tail of last chunk
8551da8dc97SGerrit Uitslag     * @param int $direction positive forward, negative backward
8561da8dc97SGerrit Uitslag     * @return array with entries:
8571da8dc97SGerrit Uitslag     *    - $lines: changelog lines of readed chunk
8581da8dc97SGerrit Uitslag     *    - $head: head of chunk
8591da8dc97SGerrit Uitslag     *    - $tail: tail of chunk
8601da8dc97SGerrit Uitslag     */
8611da8dc97SGerrit Uitslag    protected function readAdjacentChunk($fp, $head, $tail, $direction) {
8621da8dc97SGerrit Uitslag        if(!$fp) return array(array(), $head, $tail);
8631da8dc97SGerrit Uitslag
8641da8dc97SGerrit Uitslag        if($direction > 0) {
8651da8dc97SGerrit Uitslag            //read forward
8661da8dc97SGerrit Uitslag            $head = $tail;
8671da8dc97SGerrit Uitslag            $tail = $head + floor($this->chunk_size * (2 / 3));
8681da8dc97SGerrit Uitslag            $tail = $this->getNewlinepointer($fp, $tail);
8691da8dc97SGerrit Uitslag        } else {
8701da8dc97SGerrit Uitslag            //read backward
8711da8dc97SGerrit Uitslag            $tail = $head;
8721da8dc97SGerrit Uitslag            $head = max($tail - $this->chunk_size, 0);
8731da8dc97SGerrit Uitslag            while(true) {
8741da8dc97SGerrit Uitslag                $nl = $this->getNewlinepointer($fp, $head);
8751da8dc97SGerrit Uitslag                // was the chunk big enough? if not, take another bite
8761da8dc97SGerrit Uitslag                if($nl > 0 && $tail <= $nl) {
8771da8dc97SGerrit Uitslag                    $head = max($head - $this->chunk_size, 0);
8781da8dc97SGerrit Uitslag                } else {
8791da8dc97SGerrit Uitslag                    $head = $nl;
8801da8dc97SGerrit Uitslag                    break;
8811da8dc97SGerrit Uitslag                }
8821da8dc97SGerrit Uitslag            }
8838eccf945SGerrit Uitslag        }
8848eccf945SGerrit Uitslag
8851da8dc97SGerrit Uitslag        //load next chunck
8861da8dc97SGerrit Uitslag        $lines = $this->readChunk($fp, $head, $tail);
8871da8dc97SGerrit Uitslag        return array($lines, $head, $tail);
8881da8dc97SGerrit Uitslag    }
8891da8dc97SGerrit Uitslag
8901da8dc97SGerrit Uitslag    /**
8911da8dc97SGerrit Uitslag     * Collect the $max revisions near to the timestamp $rev
8921da8dc97SGerrit Uitslag     *
8931da8dc97SGerrit Uitslag     * @param int $rev revision timestamp
8941da8dc97SGerrit Uitslag     * @param int $max maximum number of revisions to be returned
8951da8dc97SGerrit Uitslag     * @return bool|array
8961da8dc97SGerrit Uitslag     *     return array with entries:
8971da8dc97SGerrit Uitslag     *       - $requestedrevs: array of with $max revision timestamps
8981da8dc97SGerrit Uitslag     *       - $revs: all parsed revision timestamps
8991da8dc97SGerrit Uitslag     *       - $fp: filepointer only defined for chuck reading, needs closing.
9001da8dc97SGerrit Uitslag     *       - $lines: non-parsed changelog lines before the parsed revisions
9011da8dc97SGerrit Uitslag     *       - $head: position of first readed changelogline
9021da8dc97SGerrit Uitslag     *       - $lasttail: position of end of last readed changelogline
9031da8dc97SGerrit Uitslag     *     otherwise false
9041da8dc97SGerrit Uitslag     */
9051da8dc97SGerrit Uitslag    protected function retrieveRevisionsAround($rev, $max) {
9061da8dc97SGerrit Uitslag        //get lines from changelog
907*4f1e2cb3SGerrit Uitslag        list($fp, $lines, $starthead, $starttail, /* $eof */) = $this->readloglines($rev);
9081da8dc97SGerrit Uitslag        if(empty($lines)) return false;
9091da8dc97SGerrit Uitslag
9101da8dc97SGerrit Uitslag        //parse chunk containing $rev, and read forward more chunks until $max/2 is reached
9111da8dc97SGerrit Uitslag        $head = $starthead;
9121da8dc97SGerrit Uitslag        $tail = $starttail;
9131da8dc97SGerrit Uitslag        $revs = array();
9141da8dc97SGerrit Uitslag        $aftercount = $beforecount = 0;
9151da8dc97SGerrit Uitslag        while(count($lines) > 0) {
9161da8dc97SGerrit Uitslag            foreach($lines as $line) {
9171da8dc97SGerrit Uitslag                $tmp = parseChangelogLine($line);
9181da8dc97SGerrit Uitslag                if($tmp !== false) {
9191da8dc97SGerrit Uitslag                    $this->cache[$this->id][$tmp['date']] = $tmp;
9201da8dc97SGerrit Uitslag                    $revs[] = $tmp['date'];
9211da8dc97SGerrit Uitslag                    if($tmp['date'] >= $rev) {
9221da8dc97SGerrit Uitslag                        //count revs after reference $rev
9231da8dc97SGerrit Uitslag                        $aftercount++;
9241da8dc97SGerrit Uitslag                        if($aftercount == 1) $beforecount = count($revs);
9251da8dc97SGerrit Uitslag                    }
9261da8dc97SGerrit Uitslag                    //enough revs after reference $rev?
9271da8dc97SGerrit Uitslag                    if($aftercount > floor($max / 2)) break 2;
9281da8dc97SGerrit Uitslag                }
9291da8dc97SGerrit Uitslag            }
9301da8dc97SGerrit Uitslag            //retrieve next chunk
9311da8dc97SGerrit Uitslag            list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, 1);
9321da8dc97SGerrit Uitslag        }
9331da8dc97SGerrit Uitslag        if($aftercount == 0) return false;
9341da8dc97SGerrit Uitslag
9351da8dc97SGerrit Uitslag        $lasttail = $tail;
9361da8dc97SGerrit Uitslag
9371da8dc97SGerrit Uitslag        //read additional chuncks backward until $max/2 is reached and total number of revs is equal to $max
9381da8dc97SGerrit Uitslag        $lines = array();
9391da8dc97SGerrit Uitslag        $i = 0;
9401da8dc97SGerrit Uitslag        if($aftercount > 0) {
9411da8dc97SGerrit Uitslag            $head = $starthead;
9421da8dc97SGerrit Uitslag            $tail = $starttail;
9431da8dc97SGerrit Uitslag            while($head > 0) {
9441da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1);
9451da8dc97SGerrit Uitslag
9461da8dc97SGerrit Uitslag                for($i = count($lines) - 1; $i >= 0; $i--) {
9471da8dc97SGerrit Uitslag                    $tmp = parseChangelogLine($lines[$i]);
9481da8dc97SGerrit Uitslag                    if($tmp !== false) {
9491da8dc97SGerrit Uitslag                        $this->cache[$this->id][$tmp['date']] = $tmp;
9501da8dc97SGerrit Uitslag                        $revs[] = $tmp['date'];
9511da8dc97SGerrit Uitslag                        $beforecount++;
9521da8dc97SGerrit Uitslag                        //enough revs before reference $rev?
9531da8dc97SGerrit Uitslag                        if($beforecount > max(floor($max / 2), $max - $aftercount)) break 2;
9541da8dc97SGerrit Uitslag                    }
9551da8dc97SGerrit Uitslag                }
9561da8dc97SGerrit Uitslag            }
9571da8dc97SGerrit Uitslag        }
9581da8dc97SGerrit Uitslag        sort($revs);
9591da8dc97SGerrit Uitslag
9601da8dc97SGerrit Uitslag        //keep only non-parsed lines
9611da8dc97SGerrit Uitslag        $lines = array_slice($lines, 0, $i);
9621da8dc97SGerrit Uitslag        //trunk desired selection
9631da8dc97SGerrit Uitslag        $requestedrevs = array_slice($revs, -$max, $max);
9641da8dc97SGerrit Uitslag
9651da8dc97SGerrit Uitslag        return array($requestedrevs, $revs, $fp, $lines, $head, $lasttail);
9661da8dc97SGerrit Uitslag    }
9671da8dc97SGerrit Uitslag}
9681da8dc97SGerrit Uitslag
9691da8dc97SGerrit Uitslag/**
9701da8dc97SGerrit Uitslag * Class PageChangelog handles changelog of a wiki page
9711da8dc97SGerrit Uitslag */
972047bad06SGerrit Uitslagclass PageChangelog extends ChangeLog {
973047bad06SGerrit Uitslag
974047bad06SGerrit Uitslag    /**
975047bad06SGerrit Uitslag     * Returns path to changelog
976047bad06SGerrit Uitslag     *
977047bad06SGerrit Uitslag     * @return string path to file
978047bad06SGerrit Uitslag     */
979047bad06SGerrit Uitslag    protected function getChangelogFilename() {
980047bad06SGerrit Uitslag        return metaFN($this->id, '.changes');
981047bad06SGerrit Uitslag    }
982047bad06SGerrit Uitslag
983047bad06SGerrit Uitslag    /**
984047bad06SGerrit Uitslag     * Returns path to current page/media
985047bad06SGerrit Uitslag     *
986047bad06SGerrit Uitslag     * @return string path to file
987047bad06SGerrit Uitslag     */
988047bad06SGerrit Uitslag    protected function getFilename() {
989047bad06SGerrit Uitslag        return wikiFN($this->id);
990047bad06SGerrit Uitslag    }
991047bad06SGerrit Uitslag}
992047bad06SGerrit Uitslag
9931da8dc97SGerrit Uitslag/**
9941da8dc97SGerrit Uitslag * Class MediaChangelog handles changelog of a media file
9951da8dc97SGerrit Uitslag */
996047bad06SGerrit Uitslagclass MediaChangelog extends ChangeLog {
997047bad06SGerrit Uitslag
998047bad06SGerrit Uitslag    /**
999047bad06SGerrit Uitslag     * Returns path to changelog
1000047bad06SGerrit Uitslag     *
1001047bad06SGerrit Uitslag     * @return string path to file
1002047bad06SGerrit Uitslag     */
1003047bad06SGerrit Uitslag    protected function getChangelogFilename() {
1004047bad06SGerrit Uitslag        return mediaMetaFN($this->id, '.changes');
1005047bad06SGerrit Uitslag    }
1006047bad06SGerrit Uitslag
1007047bad06SGerrit Uitslag    /**
1008047bad06SGerrit Uitslag     * Returns path to current page/media
1009047bad06SGerrit Uitslag     *
1010047bad06SGerrit Uitslag     * @return string path to file
1011047bad06SGerrit Uitslag     */
1012047bad06SGerrit Uitslag    protected function getFilename() {
1013047bad06SGerrit Uitslag        return mediaFN($this->id);
1014047bad06SGerrit Uitslag    }
1015047bad06SGerrit Uitslag}
1016047bad06SGerrit Uitslag
10178eccf945SGerrit Uitslag/**
10188eccf945SGerrit Uitslag * Get the changelog information for a specific page id
10198eccf945SGerrit Uitslag * and revision (timestamp). Adjacent changelog lines
10208eccf945SGerrit Uitslag * are optimistically parsed and cached to speed up
10218eccf945SGerrit Uitslag * consecutive calls to getRevisionInfo. For large
10228eccf945SGerrit Uitslag * changelog files, only the chunk containing the
10238eccf945SGerrit Uitslag * requested changelog line is read.
10248eccf945SGerrit Uitslag *
10251419a485SAndreas Gohr * @deprecated 2013-11-20
10268eccf945SGerrit Uitslag *
10278eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net>
10288eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net>
10298eccf945SGerrit Uitslag */
10308eccf945SGerrit Uitslagfunction getRevisionInfo($id, $rev, $chunk_size = 8192, $media = false) {
1031*4f1e2cb3SGerrit Uitslag    dbg_deprecated('class PageChangeLog or class MediaChangelog');
1032047bad06SGerrit Uitslag    if($media) {
1033047bad06SGerrit Uitslag        $changelog = new MediaChangeLog($id, $chunk_size);
1034047bad06SGerrit Uitslag    } else {
1035047bad06SGerrit Uitslag        $changelog = new PageChangeLog($id, $chunk_size);
1036047bad06SGerrit Uitslag    }
1037047bad06SGerrit Uitslag    return $changelog->getRevisionInfo($rev);
10388eccf945SGerrit Uitslag}
10398eccf945SGerrit Uitslag
10408eccf945SGerrit Uitslag/**
10418eccf945SGerrit Uitslag * Return a list of page revisions numbers
10428eccf945SGerrit Uitslag * Does not guarantee that the revision exists in the attic,
10438eccf945SGerrit Uitslag * only that a line with the date exists in the changelog.
10448eccf945SGerrit Uitslag * By default the current revision is skipped.
10458eccf945SGerrit Uitslag *
10468eccf945SGerrit Uitslag * The current revision is automatically skipped when the page exists.
10478eccf945SGerrit Uitslag * See $INFO['meta']['last_change'] for the current revision.
10488eccf945SGerrit Uitslag *
10498eccf945SGerrit Uitslag * For efficiency, the log lines are parsed and cached for later
10508eccf945SGerrit Uitslag * calls to getRevisionInfo. Large changelog files are read
10518eccf945SGerrit Uitslag * backwards in chunks until the requested number of changelog
10528eccf945SGerrit Uitslag * lines are recieved.
10538eccf945SGerrit Uitslag *
10541419a485SAndreas Gohr * @deprecated 2013-11-20
10558eccf945SGerrit Uitslag *
10568eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net>
10578eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net>
1058*4f1e2cb3SGerrit Uitslag *
1059*4f1e2cb3SGerrit Uitslag * @param string $id          the page of interest
1060*4f1e2cb3SGerrit Uitslag * @param int    $first       skip the first n changelog lines
1061*4f1e2cb3SGerrit Uitslag * @param int    $num         number of revisions to return
1062*4f1e2cb3SGerrit Uitslag * @param int    $chunk_size
1063*4f1e2cb3SGerrit Uitslag * @param bool   $media
1064*4f1e2cb3SGerrit Uitslag * @return array
10658eccf945SGerrit Uitslag */
10668eccf945SGerrit Uitslagfunction getRevisions($id, $first, $num, $chunk_size = 8192, $media = false) {
1067*4f1e2cb3SGerrit Uitslag    dbg_deprecated('class PageChangeLog or class MediaChangelog');
1068047bad06SGerrit Uitslag    if($media) {
1069047bad06SGerrit Uitslag        $changelog = new MediaChangeLog($id, $chunk_size);
1070047bad06SGerrit Uitslag    } else {
1071047bad06SGerrit Uitslag        $changelog = new PageChangeLog($id, $chunk_size);
1072047bad06SGerrit Uitslag    }
1073047bad06SGerrit Uitslag    return $changelog->getRevisions($first, $num);
10748eccf945SGerrit Uitslag}
1075