xref: /dokuwiki/inc/changelog.php (revision 1419a485e3ac0c507ef073f0b816bd41f7e4a5cd)
17d559c7fSBen Coburn<?php
27d559c7fSBen Coburn/**
37d559c7fSBen Coburn * Changelog handling functions
47d559c7fSBen Coburn *
57d559c7fSBen Coburn * @license    GPL 2 (http://www.gnu.org/licenses/gpl.html)
67d559c7fSBen Coburn * @author     Andreas Gohr <andi@splitbrain.org>
77d559c7fSBen Coburn */
87d559c7fSBen Coburn
9ebf1501fSBen Coburn// Constants for known core changelog line types.
10ebf1501fSBen Coburn// Use these in place of string literals for more readable code.
11ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_CREATE',       'C');
12ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_EDIT',         'E');
13ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_MINOR_EDIT',   'e');
14ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_DELETE',       'D');
15ebf1501fSBen Coburndefine('DOKU_CHANGE_TYPE_REVERT',       'R');
16ebf1501fSBen Coburn
177d559c7fSBen Coburn/**
187d559c7fSBen Coburn * parses a changelog line into it's components
197d559c7fSBen Coburn *
207d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
217d559c7fSBen Coburn */
227d559c7fSBen Coburnfunction parseChangelogLine($line) {
237d559c7fSBen Coburn    $tmp = explode("\t", $line);
247d559c7fSBen Coburn    if ($tmp!==false && count($tmp)>1) {
257d559c7fSBen Coburn        $info = array();
26e16d739eSBen Coburn        $info['date']  = (int)$tmp[0]; // unix timestamp
277d559c7fSBen Coburn        $info['ip']    = $tmp[1]; // IPv4 address (127.0.0.1)
287d559c7fSBen Coburn        $info['type']  = $tmp[2]; // log line type
297d559c7fSBen Coburn        $info['id']    = $tmp[3]; // page id
307d559c7fSBen Coburn        $info['user']  = $tmp[4]; // user name
317d559c7fSBen Coburn        $info['sum']   = $tmp[5]; // edit summary (or action reason)
327d559c7fSBen Coburn        $info['extra'] = rtrim($tmp[6], "\n"); // extra data (varies by line type)
337d559c7fSBen Coburn        return $info;
347d559c7fSBen Coburn    } else { return false; }
357d559c7fSBen Coburn}
367d559c7fSBen Coburn
377d559c7fSBen Coburn/**
387d559c7fSBen Coburn * Add's an entry to the changelog and saves the metadata for the page
397d559c7fSBen Coburn *
40a365baeeSDominik Eckelmann * @param int    $date      Timestamp of the change
41a365baeeSDominik Eckelmann * @param String $id        Name of the affected page
42a365baeeSDominik Eckelmann * @param String $type      Type of the change see DOKU_CHANGE_TYPE_*
43a365baeeSDominik Eckelmann * @param String $summary   Summary of the change
44a365baeeSDominik Eckelmann * @param mixed  $extra     In case of a revert the revision (timestmp) of the reverted page
45a365baeeSDominik Eckelmann * @param array  $flags     Additional flags in a key value array.
46a365baeeSDominik Eckelmann *                             Availible flags:
47a365baeeSDominik Eckelmann *                             - ExternalEdit - mark as an external edit.
48a365baeeSDominik Eckelmann *
497d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org>
507d559c7fSBen Coburn * @author Esther Brunner <wikidesign@gmail.com>
517d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
527d559c7fSBen Coburn */
53ebf1501fSBen Coburnfunction addLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){
547d559c7fSBen Coburn    global $conf, $INFO;
55585bf44eSChristopher Smith    /** @var Input $INPUT */
56585bf44eSChristopher Smith    global $INPUT;
577d559c7fSBen Coburn
585aa52fafSBen Coburn    // check for special flags as keys
595aa52fafSBen Coburn    if (!is_array($flags)) { $flags = array(); }
605aa52fafSBen Coburn    $flagExternalEdit = isset($flags['ExternalEdit']);
615aa52fafSBen Coburn
627d559c7fSBen Coburn    $id = cleanid($id);
637d559c7fSBen Coburn    $file = wikiFN($id);
647d559c7fSBen Coburn    $created = @filectime($file);
65ebf1501fSBen Coburn    $minor = ($type===DOKU_CHANGE_TYPE_MINOR_EDIT);
66ebf1501fSBen Coburn    $wasRemoved = ($type===DOKU_CHANGE_TYPE_DELETE);
677d559c7fSBen Coburn
687d559c7fSBen Coburn    if(!$date) $date = time(); //use current time if none supplied
692f9daf16SAndreas Gohr    $remote = (!$flagExternalEdit)?clientIP(true):'127.0.0.1';
70585bf44eSChristopher Smith    $user   = (!$flagExternalEdit)?$INPUT->server->str('REMOTE_USER'):'';
717d559c7fSBen Coburn
727d559c7fSBen Coburn    $strip = array("\t", "\n");
737d559c7fSBen Coburn    $logline = array(
747d559c7fSBen Coburn            'date'  => $date,
757d559c7fSBen Coburn            'ip'    => $remote,
767d559c7fSBen Coburn            'type'  => str_replace($strip, '', $type),
777d559c7fSBen Coburn            'id'    => $id,
787d559c7fSBen Coburn            'user'  => $user,
797fa35bb1SAndreas Gohr            'sum'   => utf8_substr(str_replace($strip, '', $summary),0,255),
807d559c7fSBen Coburn            'extra' => str_replace($strip, '', $extra)
817d559c7fSBen Coburn            );
827d559c7fSBen Coburn
837d559c7fSBen Coburn    // update metadata
847d559c7fSBen Coburn    if (!$wasRemoved) {
853d1f9ec3SMichael Klier        $oldmeta = p_read_metadata($id);
867d559c7fSBen Coburn        $meta    = array();
873d1f9ec3SMichael Klier        if (!$INFO['exists'] && empty($oldmeta['persistent']['date']['created'])){ // newly created
887d559c7fSBen Coburn            $meta['date']['created'] = $created;
89a8e72133SAndreas Gohr            if ($user){
90a8e72133SAndreas Gohr                $meta['creator'] = $INFO['userinfo']['name'];
91a8e72133SAndreas Gohr                $meta['user']    = $user;
92a8e72133SAndreas Gohr            }
933d1f9ec3SMichael Klier        } elseif (!$INFO['exists'] && !empty($oldmeta['persistent']['date']['created'])) { // re-created / restored
943d1f9ec3SMichael Klier            $meta['date']['created']  = $oldmeta['persistent']['date']['created'];
953d1f9ec3SMichael Klier            $meta['date']['modified'] = $created; // use the files ctime here
963d1f9ec3SMichael Klier            $meta['creator'] = $oldmeta['persistent']['creator'];
973d1f9ec3SMichael Klier            if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name'];
987d559c7fSBen Coburn        } elseif (!$minor) {   // non-minor modification
997d559c7fSBen Coburn            $meta['date']['modified'] = $date;
1007d559c7fSBen Coburn            if ($user) $meta['contributor'][$user] = $INFO['userinfo']['name'];
1017d559c7fSBen Coburn        }
1027d559c7fSBen Coburn        $meta['last_change'] = $logline;
103ee4d22e0SChristopher Smith        p_set_metadata($id, $meta);
1047d559c7fSBen Coburn    }
1057d559c7fSBen Coburn
1067d559c7fSBen Coburn    // add changelog lines
1077d559c7fSBen Coburn    $logline = implode("\t", $logline)."\n";
1087d559c7fSBen Coburn    io_saveFile(metaFN($id,'.changes'),$logline,true); //page changelog
1097d559c7fSBen Coburn    io_saveFile($conf['changelog'],$logline,true); //global changelog cache
1107d559c7fSBen Coburn}
1117d559c7fSBen Coburn
1127d559c7fSBen Coburn/**
11399c8d7f2Smichael * Add's an entry to the media changelog
11499c8d7f2Smichael *
11599c8d7f2Smichael * @author Michael Hamann <michael@content-space.de>
11699c8d7f2Smichael * @author Andreas Gohr <andi@splitbrain.org>
11799c8d7f2Smichael * @author Esther Brunner <wikidesign@gmail.com>
11899c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net>
11999c8d7f2Smichael */
12099c8d7f2Smichaelfunction addMediaLogEntry($date, $id, $type=DOKU_CHANGE_TYPE_EDIT, $summary='', $extra='', $flags=null){
121de3eb1d7SAdrian Lang    global $conf;
122585bf44eSChristopher Smith    /** @var Input $INPUT */
123585bf44eSChristopher Smith    global $INPUT;
12499c8d7f2Smichael
12599c8d7f2Smichael    $id = cleanid($id);
12699c8d7f2Smichael
12799c8d7f2Smichael    if(!$date) $date = time(); //use current time if none supplied
1282f9daf16SAndreas Gohr    $remote = clientIP(true);
129585bf44eSChristopher Smith    $user   = $INPUT->server->str('REMOTE_USER');
13099c8d7f2Smichael
13199c8d7f2Smichael    $strip = array("\t", "\n");
13299c8d7f2Smichael    $logline = array(
13399c8d7f2Smichael            'date'  => $date,
13499c8d7f2Smichael            'ip'    => $remote,
13599c8d7f2Smichael            'type'  => str_replace($strip, '', $type),
13699c8d7f2Smichael            'id'    => $id,
13799c8d7f2Smichael            'user'  => $user,
1387fa35bb1SAndreas Gohr            'sum'   => utf8_substr(str_replace($strip, '', $summary),0,255),
13999c8d7f2Smichael            'extra' => str_replace($strip, '', $extra)
14099c8d7f2Smichael            );
14199c8d7f2Smichael
14299c8d7f2Smichael    // add changelog lines
14399c8d7f2Smichael    $logline = implode("\t", $logline)."\n";
14499c8d7f2Smichael    io_saveFile($conf['media_changelog'],$logline,true); //global media changelog cache
145e4f389efSKate Arzamastseva    io_saveFile(mediaMetaFN($id,'.changes'),$logline,true); //media file's changelog
14699c8d7f2Smichael}
14799c8d7f2Smichael
14899c8d7f2Smichael/**
1497d559c7fSBen Coburn * returns an array of recently changed files using the
1507d559c7fSBen Coburn * changelog
1517d559c7fSBen Coburn *
1527d559c7fSBen Coburn * The following constants can be used to control which changes are
1537d559c7fSBen Coburn * included. Add them together as needed.
1547d559c7fSBen Coburn *
1557d559c7fSBen Coburn * RECENTS_SKIP_DELETED   - don't include deleted pages
1567d559c7fSBen Coburn * RECENTS_SKIP_MINORS    - don't include minor changes
1577d559c7fSBen Coburn * RECENTS_SKIP_SUBSPACES - don't include subspaces
1580b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES  - return media changes instead of page changes
1590b926329SKate Arzamastseva * RECENTS_MEDIA_PAGES_MIXED  - return both media changes and page changes
1607d559c7fSBen Coburn *
1617d559c7fSBen Coburn * @param int    $first   number of first entry returned (for paginating
1627d559c7fSBen Coburn * @param int    $num     return $num entries
1637d559c7fSBen Coburn * @param string $ns      restrict to given namespace
16459f20ea3SMichael Hamann * @param int    $flags   see above
16559f20ea3SMichael Hamann * @return array recently changed files
1667d559c7fSBen Coburn *
1677d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
16829778747SKate Arzamastseva * @author Kate Arzamastseva <pshns@ukr.net>
1697d559c7fSBen Coburn */
1707d559c7fSBen Coburnfunction getRecents($first,$num,$ns='',$flags=0){
1717d559c7fSBen Coburn    global $conf;
1727d559c7fSBen Coburn    $recent = array();
1737d559c7fSBen Coburn    $count  = 0;
1747d559c7fSBen Coburn
1757d559c7fSBen Coburn    if(!$num)
1767d559c7fSBen Coburn        return $recent;
1777d559c7fSBen Coburn
1787d559c7fSBen Coburn    // read all recent changes. (kept short)
1790b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_CHANGES) {
18099c8d7f2Smichael        $lines = @file($conf['media_changelog']);
18199c8d7f2Smichael    } else {
18276d47b34SDavid Lorentsen        $lines = @file($conf['changelog']);
18399c8d7f2Smichael    }
18429778747SKate Arzamastseva    $lines_position = count($lines)-1;
18559f20ea3SMichael Hamann    $media_lines_position = 0;
18659f20ea3SMichael Hamann    $media_lines = array();
18729778747SKate Arzamastseva
1880b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_PAGES_MIXED) {
18929778747SKate Arzamastseva        $media_lines = @file($conf['media_changelog']);
19029778747SKate Arzamastseva        $media_lines_position = count($media_lines)-1;
19129778747SKate Arzamastseva    }
19229778747SKate Arzamastseva
19329778747SKate Arzamastseva    $seen = array(); // caches seen lines, _handleRecent() skips them
1947d559c7fSBen Coburn
1957d559c7fSBen Coburn    // handle lines
1960b926329SKate Arzamastseva    while ($lines_position >= 0 || (($flags & RECENTS_MEDIA_PAGES_MIXED) && $media_lines_position >=0)) {
19729778747SKate Arzamastseva        if (empty($rec) && $lines_position >= 0) {
1981d901ab2SAndreas Gohr            $rec = _handleRecent(@$lines[$lines_position], $ns, $flags, $seen);
19929778747SKate Arzamastseva            if (!$rec) {
20029778747SKate Arzamastseva                $lines_position --;
20129778747SKate Arzamastseva                continue;
20229778747SKate Arzamastseva            }
20329778747SKate Arzamastseva        }
2040b926329SKate Arzamastseva        if (($flags & RECENTS_MEDIA_PAGES_MIXED) && empty($media_rec) && $media_lines_position >= 0) {
20542025dfdSMichael Hamann            $media_rec = _handleRecent(@$media_lines[$media_lines_position], $ns, $flags | RECENTS_MEDIA_CHANGES, $seen);
20629778747SKate Arzamastseva            if (!$media_rec) {
20729778747SKate Arzamastseva                $media_lines_position --;
20829778747SKate Arzamastseva                continue;
20929778747SKate Arzamastseva            }
21029778747SKate Arzamastseva        }
2110b926329SKate Arzamastseva        if (($flags & RECENTS_MEDIA_PAGES_MIXED) && @$media_rec['date'] >= @$rec['date']) {
21229778747SKate Arzamastseva            $media_lines_position--;
21329778747SKate Arzamastseva            $x = $media_rec;
214b5941dfaSKate Arzamastseva            $x['media'] = true;
21529778747SKate Arzamastseva            $media_rec = false;
21629778747SKate Arzamastseva        } else {
21729778747SKate Arzamastseva            $lines_position--;
21829778747SKate Arzamastseva            $x = $rec;
219421ec38eSKate Arzamastseva            if ($flags & RECENTS_MEDIA_CHANGES) $x['media'] = true;
22029778747SKate Arzamastseva            $rec = false;
22129778747SKate Arzamastseva        }
2227d559c7fSBen Coburn        if(--$first >= 0) continue; // skip first entries
22329778747SKate Arzamastseva        $recent[] = $x;
2247d559c7fSBen Coburn        $count++;
2257d559c7fSBen Coburn        // break when we have enough entries
2267d559c7fSBen Coburn        if($count >= $num){ break; }
2277d559c7fSBen Coburn    }
2287d559c7fSBen Coburn    return $recent;
2297d559c7fSBen Coburn}
2307d559c7fSBen Coburn
2317d559c7fSBen Coburn/**
23299c8d7f2Smichael * returns an array of files changed since a given time using the
23399c8d7f2Smichael * changelog
23499c8d7f2Smichael *
23599c8d7f2Smichael * The following constants can be used to control which changes are
23699c8d7f2Smichael * included. Add them together as needed.
23799c8d7f2Smichael *
23899c8d7f2Smichael * RECENTS_SKIP_DELETED   - don't include deleted pages
23999c8d7f2Smichael * RECENTS_SKIP_MINORS    - don't include minor changes
24099c8d7f2Smichael * RECENTS_SKIP_SUBSPACES - don't include subspaces
2410b926329SKate Arzamastseva * RECENTS_MEDIA_CHANGES  - return media changes instead of page changes
24299c8d7f2Smichael *
24399c8d7f2Smichael * @param int    $from    date of the oldest entry to return
24499c8d7f2Smichael * @param int    $to      date of the newest entry to return (for pagination, optional)
24599c8d7f2Smichael * @param string $ns      restrict to given namespace (optional)
24659f20ea3SMichael Hamann * @param int    $flags   see above (optional)
24759f20ea3SMichael Hamann * @return array of files
24899c8d7f2Smichael *
24999c8d7f2Smichael * @author Michael Hamann <michael@content-space.de>
25099c8d7f2Smichael * @author Ben Coburn <btcoburn@silicodon.net>
25199c8d7f2Smichael */
25299c8d7f2Smichaelfunction getRecentsSince($from,$to=null,$ns='',$flags=0){
25399c8d7f2Smichael    global $conf;
25499c8d7f2Smichael    $recent = array();
25599c8d7f2Smichael
25699c8d7f2Smichael    if($to && $to < $from)
25799c8d7f2Smichael        return $recent;
25899c8d7f2Smichael
25999c8d7f2Smichael    // read all recent changes. (kept short)
2600b926329SKate Arzamastseva    if ($flags & RECENTS_MEDIA_CHANGES) {
26199c8d7f2Smichael        $lines = @file($conf['media_changelog']);
26299c8d7f2Smichael    } else {
26399c8d7f2Smichael        $lines = @file($conf['changelog']);
26499c8d7f2Smichael    }
265e920a0a1SAndreas Gohr    if(!$lines) return $recent;
26699c8d7f2Smichael
26799c8d7f2Smichael    // we start searching at the end of the list
26899c8d7f2Smichael    $lines = array_reverse($lines);
26999c8d7f2Smichael
27099c8d7f2Smichael    // handle lines
27199c8d7f2Smichael    $seen = array(); // caches seen lines, _handleRecent() skips them
27299c8d7f2Smichael
27399c8d7f2Smichael    foreach($lines as $line){
27499c8d7f2Smichael        $rec = _handleRecent($line, $ns, $flags, $seen);
27599c8d7f2Smichael        if($rec !== false) {
27699c8d7f2Smichael            if ($rec['date'] >= $from) {
27799c8d7f2Smichael                if (!$to || $rec['date'] <= $to) {
27899c8d7f2Smichael                    $recent[] = $rec;
27999c8d7f2Smichael                }
28099c8d7f2Smichael            } else {
28199c8d7f2Smichael                break;
28299c8d7f2Smichael            }
28399c8d7f2Smichael        }
28499c8d7f2Smichael    }
28599c8d7f2Smichael
28699c8d7f2Smichael    return array_reverse($recent);
28799c8d7f2Smichael}
28899c8d7f2Smichael
28999c8d7f2Smichael/**
2907d559c7fSBen Coburn * Internal function used by getRecents
2917d559c7fSBen Coburn *
2927d559c7fSBen Coburn * don't call directly
2937d559c7fSBen Coburn *
2947d559c7fSBen Coburn * @see getRecents()
2957d559c7fSBen Coburn * @author Andreas Gohr <andi@splitbrain.org>
2967d559c7fSBen Coburn * @author Ben Coburn <btcoburn@silicodon.net>
2977d559c7fSBen Coburn */
29899c8d7f2Smichaelfunction _handleRecent($line,$ns,$flags,&$seen){
2997d559c7fSBen Coburn    if(empty($line)) return false;   //skip empty lines
3007d559c7fSBen Coburn
3017d559c7fSBen Coburn    // split the line into parts
3027d559c7fSBen Coburn    $recent = parseChangelogLine($line);
3037d559c7fSBen Coburn    if ($recent===false) { return false; }
3047d559c7fSBen Coburn
3057d559c7fSBen Coburn    // skip seen ones
3067d559c7fSBen Coburn    if(isset($seen[$recent['id']])) return false;
3077d559c7fSBen Coburn
3087d559c7fSBen Coburn    // skip minors
309ebf1501fSBen Coburn    if($recent['type']===DOKU_CHANGE_TYPE_MINOR_EDIT && ($flags & RECENTS_SKIP_MINORS)) return false;
3107d559c7fSBen Coburn
3117d559c7fSBen Coburn    // remember in seen to skip additional sights
3127d559c7fSBen Coburn    $seen[$recent['id']] = 1;
3137d559c7fSBen Coburn
3147d559c7fSBen Coburn    // check if it's a hidden page
3157d559c7fSBen Coburn    if(isHiddenPage($recent['id'])) return false;
3167d559c7fSBen Coburn
3177d559c7fSBen Coburn    // filter namespace
3187d559c7fSBen Coburn    if (($ns) && (strpos($recent['id'],$ns.':') !== 0)) return false;
3197d559c7fSBen Coburn
3207d559c7fSBen Coburn    // exclude subnamespaces
3217d559c7fSBen Coburn    if (($flags & RECENTS_SKIP_SUBSPACES) && (getNS($recent['id']) != $ns)) return false;
3227d559c7fSBen Coburn
3237d559c7fSBen Coburn    // check ACL
32442025dfdSMichael Hamann    if ($flags & RECENTS_MEDIA_CHANGES) {
32542025dfdSMichael Hamann        $recent['perms'] = auth_quickaclcheck(getNS($recent['id']).':*');
32642025dfdSMichael Hamann    } else {
32799c8d7f2Smichael        $recent['perms'] = auth_quickaclcheck($recent['id']);
32842025dfdSMichael Hamann    }
32999c8d7f2Smichael    if ($recent['perms'] < AUTH_READ) return false;
3307d559c7fSBen Coburn
3317d559c7fSBen Coburn    // check existance
3321d901ab2SAndreas Gohr    if($flags & RECENTS_SKIP_DELETED){
33342025dfdSMichael Hamann        $fn = (($flags & RECENTS_MEDIA_CHANGES) ? mediaFN($recent['id']) : wikiFN($recent['id']));
3341d901ab2SAndreas Gohr        if(!@file_exists($fn)) return false;
3351d901ab2SAndreas Gohr    }
3367d559c7fSBen Coburn
3377d559c7fSBen Coburn    return $recent;
3387d559c7fSBen Coburn}
3397d559c7fSBen Coburn
3407d559c7fSBen Coburn/**
341047bad06SGerrit Uitslag * Class ChangeLog
342047bad06SGerrit Uitslag * methods for handling of changelog of pages or media files
3438eccf945SGerrit Uitslag */
344047bad06SGerrit Uitslagabstract class ChangeLog {
3458eccf945SGerrit Uitslag
3468eccf945SGerrit Uitslag    /** @var string */
347047bad06SGerrit Uitslag    protected $id;
3488eccf945SGerrit Uitslag    /** @var int */
349047bad06SGerrit Uitslag    protected $chunk_size;
3508eccf945SGerrit Uitslag    /** @var array */
351047bad06SGerrit Uitslag    protected $cache;
3528eccf945SGerrit Uitslag
3538eccf945SGerrit Uitslag    /**
3548eccf945SGerrit Uitslag     * Constructor
3558eccf945SGerrit Uitslag     *
3568eccf945SGerrit Uitslag     * @param string $id         page id
3578eccf945SGerrit Uitslag     * @param int $chunk_size maximum block size read from file
3588eccf945SGerrit Uitslag     */
3598eccf945SGerrit Uitslag    public function __construct($id, $chunk_size = 8192) {
3608eccf945SGerrit Uitslag        global $cache_revinfo;
3618eccf945SGerrit Uitslag
3628eccf945SGerrit Uitslag        $this->cache =& $cache_revinfo;
3638eccf945SGerrit Uitslag        if(!isset($this->cache[$id])) {
3648eccf945SGerrit Uitslag            $this->cache[$id] = array();
3658eccf945SGerrit Uitslag        }
3668eccf945SGerrit Uitslag
3678eccf945SGerrit Uitslag        $this->id = $id;
3688eccf945SGerrit Uitslag        $this->setChunkSize($chunk_size);
3698eccf945SGerrit Uitslag
3708eccf945SGerrit Uitslag    }
3718eccf945SGerrit Uitslag
3728eccf945SGerrit Uitslag    /**
3738eccf945SGerrit Uitslag     * Set chunk size for file reading
374047bad06SGerrit Uitslag     * Chunk size zero let read whole file at once
3758eccf945SGerrit Uitslag     *
3768eccf945SGerrit Uitslag     * @param int $chunk_size maximum block size read from file
3778eccf945SGerrit Uitslag     */
3788eccf945SGerrit Uitslag    public function setChunkSize($chunk_size) {
3798eccf945SGerrit Uitslag        if(!is_numeric($chunk_size)) $chunk_size = 0;
3808eccf945SGerrit Uitslag
3818eccf945SGerrit Uitslag        $this->chunk_size = (int) max($chunk_size, 0);
3828eccf945SGerrit Uitslag    }
3838eccf945SGerrit Uitslag
3848eccf945SGerrit Uitslag    /**
385047bad06SGerrit Uitslag     * Returns path to changelog
386047bad06SGerrit Uitslag     *
387047bad06SGerrit Uitslag     * @return string path to file
388047bad06SGerrit Uitslag     */
389047bad06SGerrit Uitslag    abstract protected function getChangelogFilename();
390047bad06SGerrit Uitslag
391047bad06SGerrit Uitslag    /**
392047bad06SGerrit Uitslag     * Returns path to current page/media
393047bad06SGerrit Uitslag     *
394047bad06SGerrit Uitslag     * @return string path to file
395047bad06SGerrit Uitslag     */
396047bad06SGerrit Uitslag    abstract protected function getFilename();
397047bad06SGerrit Uitslag
398047bad06SGerrit Uitslag    /**
3998eccf945SGerrit Uitslag     * Get the changelog information for a specific page id and revision (timestamp)
4008eccf945SGerrit Uitslag     *
4018eccf945SGerrit Uitslag     * Adjacent changelog lines are optimistically parsed and cached to speed up
4028eccf945SGerrit Uitslag     * consecutive calls to getRevisionInfo. For large changelog files, only the chunk
4038eccf945SGerrit Uitslag     * containing the requested changelog line is read.
4048eccf945SGerrit Uitslag     *
4058eccf945SGerrit Uitslag     * @param int $rev        revision timestamp
4068eccf945SGerrit Uitslag     * @return bool|array false or array with entries:
4078eccf945SGerrit Uitslag     *      - date:  unix timestamp
4088eccf945SGerrit Uitslag     *      - ip:    IPv4 address (127.0.0.1)
4098eccf945SGerrit Uitslag     *      - type:  log line type
4108eccf945SGerrit Uitslag     *      - id:    page id
4118eccf945SGerrit Uitslag     *      - user:  user name
4128eccf945SGerrit Uitslag     *      - sum:   edit summary (or action reason)
4138eccf945SGerrit Uitslag     *      - extra: extra data (varies by line type)
4147d559c7fSBen Coburn     *
4157d559c7fSBen Coburn     * @author Ben Coburn <btcoburn@silicodon.net>
41629778747SKate Arzamastseva     * @author Kate Arzamastseva <pshns@ukr.net>
4177d559c7fSBen Coburn     */
418047bad06SGerrit Uitslag    public function getRevisionInfo($rev) {
4197d559c7fSBen Coburn        $rev = max($rev, 0);
4207d559c7fSBen Coburn
4217d559c7fSBen Coburn        // check if it's already in the memory cache
4228eccf945SGerrit Uitslag        if(isset($this->cache[$this->id]) && isset($this->cache[$this->id][$rev])) {
4238eccf945SGerrit Uitslag            return $this->cache[$this->id][$rev];
424e4f389efSKate Arzamastseva        }
4257d559c7fSBen Coburn
426040f0e13SKlap-in        //read lines from changelog
427047bad06SGerrit Uitslag        list($fp, $lines) = $this->readloglines($rev);
428040f0e13SKlap-in        if($fp) {
4297d559c7fSBen Coburn            fclose($fp);
4307d559c7fSBen Coburn        }
431040f0e13SKlap-in        if(empty($lines)) return false;
4327d559c7fSBen Coburn
4337d559c7fSBen Coburn        // parse and cache changelog lines
4347d559c7fSBen Coburn        foreach($lines as $value) {
4357d559c7fSBen Coburn            $tmp = parseChangelogLine($value);
4367d559c7fSBen Coburn            if($tmp !== false) {
4378eccf945SGerrit Uitslag                $this->cache[$this->id][$tmp['date']] = $tmp;
4387d559c7fSBen Coburn            }
4397d559c7fSBen Coburn        }
4408eccf945SGerrit Uitslag        if(!isset($this->cache[$this->id][$rev])) {
4418eccf945SGerrit Uitslag            return false;
4428eccf945SGerrit Uitslag        }
4438eccf945SGerrit Uitslag        return $this->cache[$this->id][$rev];
4447d559c7fSBen Coburn    }
4457d559c7fSBen Coburn
4467d559c7fSBen Coburn    /**
4477d559c7fSBen Coburn     * Return a list of page revisions numbers
4488eccf945SGerrit Uitslag     *
4497d559c7fSBen Coburn     * Does not guarantee that the revision exists in the attic,
4507d559c7fSBen Coburn     * only that a line with the date exists in the changelog.
4517d559c7fSBen Coburn     * By default the current revision is skipped.
4527d559c7fSBen Coburn     *
4537d559c7fSBen Coburn     * The current revision is automatically skipped when the page exists.
4547d559c7fSBen Coburn     * See $INFO['meta']['last_change'] for the current revision.
4558eccf945SGerrit Uitslag     * A negative $first let read the current revision too.
4567d559c7fSBen Coburn     *
4577d559c7fSBen Coburn     * For efficiency, the log lines are parsed and cached for later
4587d559c7fSBen Coburn     * calls to getRevisionInfo. Large changelog files are read
459c66972f2SAdrian Lang     * backwards in chunks until the requested number of changelog
4607d559c7fSBen Coburn     * lines are recieved.
4617d559c7fSBen Coburn     *
4628eccf945SGerrit Uitslag     * @param int $first      skip the first n changelog lines
4638eccf945SGerrit Uitslag     * @param int $num        number of revisions to return
4648eccf945SGerrit Uitslag     * @return array with the revision timestamps
4658eccf945SGerrit Uitslag     *
4667d559c7fSBen Coburn     * @author Ben Coburn <btcoburn@silicodon.net>
46729778747SKate Arzamastseva     * @author Kate Arzamastseva <pshns@ukr.net>
4687d559c7fSBen Coburn     */
469047bad06SGerrit Uitslag    public function getRevisions($first, $num) {
4707d559c7fSBen Coburn        $revs = array();
4717d559c7fSBen Coburn        $lines = array();
4727d559c7fSBen Coburn        $count = 0;
473047bad06SGerrit Uitslag
4747d559c7fSBen Coburn        $num = max($num, 0);
4757d1e323eSGerrit Uitslag        if($num == 0) {
4767d1e323eSGerrit Uitslag            return $revs;
4777d1e323eSGerrit Uitslag        }
478092b7683SKlap-in
479b824abd4SAndreas Gohr        if($first < 0) {
480b824abd4SAndreas Gohr            $first = 0;
481047bad06SGerrit Uitslag        } else if(@file_exists($this->getFilename())) {
4827d559c7fSBen Coburn            // skip current revision if the page exists
4837d559c7fSBen Coburn            $first = max($first + 1, 0);
4847d559c7fSBen Coburn        }
4857d559c7fSBen Coburn
486047bad06SGerrit Uitslag        $file = $this->getChangelogFilename();
487047bad06SGerrit Uitslag
4887d1e323eSGerrit Uitslag        if(!@file_exists($file)) {
4897d1e323eSGerrit Uitslag            return $revs;
4907d1e323eSGerrit Uitslag        }
4918eccf945SGerrit Uitslag        if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) {
4927d559c7fSBen Coburn            // read whole file
4937d559c7fSBen Coburn            $lines = file($file);
4947d1e323eSGerrit Uitslag            if($lines === false) {
4957d1e323eSGerrit Uitslag                return $revs;
4967d1e323eSGerrit Uitslag            }
4977d559c7fSBen Coburn        } else {
4987d559c7fSBen Coburn            // read chunks backwards
4997d559c7fSBen Coburn            $fp = fopen($file, 'rb'); // "file pointer"
5007d1e323eSGerrit Uitslag            if($fp === false) {
5017d1e323eSGerrit Uitslag                return $revs;
5027d1e323eSGerrit Uitslag            }
5037d559c7fSBen Coburn            fseek($fp, 0, SEEK_END);
5047d559c7fSBen Coburn            $tail = ftell($fp);
5057d559c7fSBen Coburn
5067d559c7fSBen Coburn            // chunk backwards
5078eccf945SGerrit Uitslag            $finger = max($tail - $this->chunk_size, 0);
5087d559c7fSBen Coburn            while($count < $num + $first) {
5097d1e323eSGerrit Uitslag                $nl = $this->getNewlinepointer($fp, $finger);
510b824abd4SAndreas Gohr
511b824abd4SAndreas Gohr                // was the chunk big enough? if not, take another bite
512b824abd4SAndreas Gohr                if($nl > 0 && $tail <= $nl) {
5138eccf945SGerrit Uitslag                    $finger = max($finger - $this->chunk_size, 0);
514b824abd4SAndreas Gohr                    continue;
515b824abd4SAndreas Gohr                } else {
516b824abd4SAndreas Gohr                    $finger = $nl;
5177d559c7fSBen Coburn                }
5187d559c7fSBen Coburn
5197d559c7fSBen Coburn                // read chunk
5207d559c7fSBen Coburn                $chunk = '';
5217d559c7fSBen Coburn                $read_size = max($tail - $finger, 0); // found chunk size
5227d559c7fSBen Coburn                $got = 0;
5237d559c7fSBen Coburn                while($got < $read_size && !feof($fp)) {
52480e97297SGerrit Uitslag                    $tmp = @fread($fp, max(min($this->chunk_size, $read_size - $got), 0));
5257d1e323eSGerrit Uitslag                    if($tmp === false) {
5267d1e323eSGerrit Uitslag                        break;
5277d1e323eSGerrit Uitslag                    } //error state
5287d559c7fSBen Coburn                    $got += strlen($tmp);
5297d559c7fSBen Coburn                    $chunk .= $tmp;
5307d559c7fSBen Coburn                }
5317d559c7fSBen Coburn                $tmp = explode("\n", $chunk);
5327d559c7fSBen Coburn                array_pop($tmp); // remove trailing newline
5337d559c7fSBen Coburn
5347d559c7fSBen Coburn                // combine with previous chunk
5357d559c7fSBen Coburn                $count += count($tmp);
5367d559c7fSBen Coburn                $lines = array_merge($tmp, $lines);
5377d559c7fSBen Coburn
5387d559c7fSBen Coburn                // next chunk
5397d1e323eSGerrit Uitslag                if($finger == 0) {
5407d1e323eSGerrit Uitslag                    break;
5417d1e323eSGerrit Uitslag                } // already read all the lines
5427d559c7fSBen Coburn                else {
5437d559c7fSBen Coburn                    $tail = $finger;
5448eccf945SGerrit Uitslag                    $finger = max($tail - $this->chunk_size, 0);
5457d559c7fSBen Coburn                }
5467d559c7fSBen Coburn            }
5477d559c7fSBen Coburn            fclose($fp);
5487d559c7fSBen Coburn        }
5497d559c7fSBen Coburn
5507d559c7fSBen Coburn        // skip parsing extra lines
5517d559c7fSBen Coburn        $num = max(min(count($lines) - $first, $num), 0);
5527d559c7fSBen Coburn        if     ($first > 0 && $num > 0)  { $lines = array_slice($lines, max(count($lines) - $first - $num, 0), $num); }
5537d559c7fSBen Coburn        else if($first > 0 && $num == 0) { $lines = array_slice($lines, 0, max(count($lines) - $first, 0)); }
5547d559c7fSBen Coburn        else if($first == 0 && $num > 0) { $lines = array_slice($lines, max(count($lines) - $num, 0)); }
5557d559c7fSBen Coburn
5567d559c7fSBen Coburn        // handle lines in reverse order
5577d559c7fSBen Coburn        for($i = count($lines) - 1; $i >= 0; $i--) {
5587d559c7fSBen Coburn            $tmp = parseChangelogLine($lines[$i]);
5597d559c7fSBen Coburn            if($tmp !== false) {
5608eccf945SGerrit Uitslag                $this->cache[$this->id][$tmp['date']] = $tmp;
5617d559c7fSBen Coburn                $revs[] = $tmp['date'];
5627d559c7fSBen Coburn            }
5637d559c7fSBen Coburn        }
5647d559c7fSBen Coburn
5657d559c7fSBen Coburn        return $revs;
5667d559c7fSBen Coburn    }
5677d559c7fSBen Coburn
568f9528c0cSKlap-in    /**
5698eccf945SGerrit Uitslag     * Get the nth revision left or right handside  for a specific page id and revision (timestamp)
5708eccf945SGerrit Uitslag     *
5718eccf945SGerrit Uitslag     * For large changelog files, only the chunk containing the
572f9528c0cSKlap-in     * reference revision $rev is read and sometimes a next chunck.
573f9528c0cSKlap-in     *
574f9528c0cSKlap-in     * Adjacent changelog lines are optimistically parsed and cached to speed up
575f9528c0cSKlap-in     * consecutive calls to getRevisionInfo.
576f9528c0cSKlap-in     *
577f9528c0cSKlap-in     * @param int $rev        revision timestamp used as startdate (doesn't need to be revisionnumber)
578f9528c0cSKlap-in     * @param int $direction  give position of returned revision with respect to $rev; positive=next, negative=prev
5798eccf945SGerrit Uitslag     * @return bool|int
5808eccf945SGerrit Uitslag     *      timestamp of the requested revision
5818eccf945SGerrit Uitslag     *      otherwise false
582f9528c0cSKlap-in     */
583047bad06SGerrit Uitslag    public function getRelativeRevision($rev, $direction) {
584f9528c0cSKlap-in        $rev = max($rev, 0);
585040f0e13SKlap-in        $direction = (int) $direction;
5867d559c7fSBen Coburn
587f9528c0cSKlap-in        //no direction given or last rev, so no follow-up
588ee33e0c5SGerrit Uitslag        if(!$direction || ($direction > 0 && $this->isCurrentRevision($rev))) {
589f9528c0cSKlap-in            return false;
590f9528c0cSKlap-in        }
591f9528c0cSKlap-in
592040f0e13SKlap-in        //get lines from changelog
593047bad06SGerrit Uitslag        list($fp, $lines, $head, $tail, $eof) = $this->readloglines($rev);
594040f0e13SKlap-in        if(empty($lines)) return false;
595040f0e13SKlap-in
596040f0e13SKlap-in        // look for revisions later/earlier then $rev, when founded count till the wanted revision is reached
597040f0e13SKlap-in        // also parse and cache changelog lines for getRevisionInfo().
598040f0e13SKlap-in        $revcounter = 0;
599040f0e13SKlap-in        $relativerev = false;
600040f0e13SKlap-in        $checkotherchunck = true; //always runs once
601040f0e13SKlap-in        while(!$relativerev && $checkotherchunck) {
602040f0e13SKlap-in            $tmp = array();
603040f0e13SKlap-in            //parse in normal or reverse order
604040f0e13SKlap-in            $count = count($lines);
605040f0e13SKlap-in            if($direction > 0) {
606040f0e13SKlap-in                $start = 0;
607040f0e13SKlap-in                $step = 1;
608040f0e13SKlap-in            } else {
609040f0e13SKlap-in                $start = $count - 1;
610040f0e13SKlap-in                $step = -1;
611040f0e13SKlap-in            }
612040f0e13SKlap-in            for($i = $start; $i >= 0 && $i < $count; $i = $i + $step) {
613040f0e13SKlap-in                $tmp = parseChangelogLine($lines[$i]);
614040f0e13SKlap-in                if($tmp !== false) {
6158eccf945SGerrit Uitslag                    $this->cache[$this->id][$tmp['date']] = $tmp;
616040f0e13SKlap-in                    //look for revs older/earlier then reference $rev and select $direction-th one
617040f0e13SKlap-in                    if(($direction > 0 && $tmp['date'] > $rev) || ($direction < 0 && $tmp['date'] < $rev)) {
618040f0e13SKlap-in                        $revcounter++;
619040f0e13SKlap-in                        if($revcounter == abs($direction)) {
620040f0e13SKlap-in                            $relativerev = $tmp['date'];
621040f0e13SKlap-in                        }
622040f0e13SKlap-in                    }
623040f0e13SKlap-in                }
624040f0e13SKlap-in            }
625040f0e13SKlap-in
626040f0e13SKlap-in            //true when $rev is found, but not the wanted follow-up.
627040f0e13SKlap-in            $checkotherchunck = $fp
628040f0e13SKlap-in                && ($tmp['date'] == $rev || ($revcounter > 0 && !$relativerev))
629040f0e13SKlap-in                && !(($tail == $eof && $direction > 0) || ($head == 0 && $direction < 0));
630040f0e13SKlap-in
631040f0e13SKlap-in            if($checkotherchunck) {
6321da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, $direction);
633040f0e13SKlap-in
634040f0e13SKlap-in                if(empty($lines)) break;
635040f0e13SKlap-in            }
636040f0e13SKlap-in        }
637040f0e13SKlap-in        if($fp) {
638040f0e13SKlap-in            fclose($fp);
639040f0e13SKlap-in        }
640040f0e13SKlap-in
641040f0e13SKlap-in        return $relativerev;
642040f0e13SKlap-in    }
643040f0e13SKlap-in
644040f0e13SKlap-in    /**
6451da8dc97SGerrit Uitslag     * Returns revisions around rev1 and rev2
6461da8dc97SGerrit Uitslag     * When available it returns $max entries for each revision
6471da8dc97SGerrit Uitslag     *
6481da8dc97SGerrit Uitslag     * @param int $rev1 oldest revision timestamp
649621bbd2aSGerrit Uitslag     * @param int $rev2 newest revision timestamp (0 looks up last revision)
6501da8dc97SGerrit Uitslag     * @param int $max maximum number of revisions returned
6511da8dc97SGerrit Uitslag     * @return array with two arrays with revisions surrounding rev1 respectively rev2
6521da8dc97SGerrit Uitslag     */
6531da8dc97SGerrit Uitslag    public function getRevisionsAround($rev1, $rev2, $max = 50) {
6541da8dc97SGerrit Uitslag        $max = floor(abs($max) / 2)*2 + 1;
6551da8dc97SGerrit Uitslag        $rev1 = max($rev1, 0);
6561da8dc97SGerrit Uitslag        $rev2 = max($rev2, 0);
6571da8dc97SGerrit Uitslag
658621bbd2aSGerrit Uitslag        if($rev2) {
6591da8dc97SGerrit Uitslag            if($rev2 < $rev1) {
6601da8dc97SGerrit Uitslag                $rev = $rev2;
6611da8dc97SGerrit Uitslag                $rev2 = $rev1;
6621da8dc97SGerrit Uitslag                $rev1 = $rev;
6631da8dc97SGerrit Uitslag            }
664621bbd2aSGerrit Uitslag        } else {
665621bbd2aSGerrit Uitslag            //empty right side means a removed page. Look up last revision.
666621bbd2aSGerrit Uitslag            $revs = $this->getRevisions(-1, 1);
667621bbd2aSGerrit Uitslag            $rev2 = $revs[0];
668621bbd2aSGerrit Uitslag        }
6691da8dc97SGerrit Uitslag        //collect revisions around rev2
6701da8dc97SGerrit Uitslag        list($revs2, $allrevs, $fp, $lines, $head, $tail) = $this->retrieveRevisionsAround($rev2, $max);
6711da8dc97SGerrit Uitslag
6721da8dc97SGerrit Uitslag        if(empty($revs2)) return array(array(), array());
6731da8dc97SGerrit Uitslag
6741da8dc97SGerrit Uitslag        //collect revisions around rev1
6751da8dc97SGerrit Uitslag        $index = array_search($rev1, $allrevs);
6761da8dc97SGerrit Uitslag        if($index === false) {
6771da8dc97SGerrit Uitslag            //no overlapping revisions
6781da8dc97SGerrit Uitslag            list($revs1,,,,,) = $this->retrieveRevisionsAround($rev1, $max);
6791da8dc97SGerrit Uitslag            if(empty($revs1)) $revs1 = array();
6801da8dc97SGerrit Uitslag        } else {
6811da8dc97SGerrit Uitslag            //revisions overlaps, reuse revisions around rev2
6821da8dc97SGerrit Uitslag            $revs1 = $allrevs;
6831da8dc97SGerrit Uitslag            while($head > 0) {
6841da8dc97SGerrit Uitslag                for($i = count($lines) - 1; $i >= 0; $i--) {
6851da8dc97SGerrit Uitslag                    $tmp = parseChangelogLine($lines[$i]);
6861da8dc97SGerrit Uitslag                    if($tmp !== false) {
6871da8dc97SGerrit Uitslag                        $this->cache[$this->id][$tmp['date']] = $tmp;
6881da8dc97SGerrit Uitslag                        $revs1[] = $tmp['date'];
6891da8dc97SGerrit Uitslag                        $index++;
6901da8dc97SGerrit Uitslag
6911da8dc97SGerrit Uitslag                        if($index > floor($max / 2)) break 2;
6921da8dc97SGerrit Uitslag                    }
6931da8dc97SGerrit Uitslag                }
6941da8dc97SGerrit Uitslag
6951da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1);
6961da8dc97SGerrit Uitslag            }
6971da8dc97SGerrit Uitslag            sort($revs1);
6981da8dc97SGerrit Uitslag            //return wanted selection
6991da8dc97SGerrit Uitslag            $revs1 = array_slice($revs1, max($index - floor($max/2), 0), $max);
7001da8dc97SGerrit Uitslag        }
7011da8dc97SGerrit Uitslag
7022e608c52SGerrit Uitslag        return array(array_reverse($revs1), array_reverse($revs2));
7031da8dc97SGerrit Uitslag    }
7041da8dc97SGerrit Uitslag
7051da8dc97SGerrit Uitslag    /**
7068eccf945SGerrit Uitslag     * Returns lines from changelog.
707040f0e13SKlap-in     * If file larger than $chuncksize, only chunck is read that could contain $rev.
708040f0e13SKlap-in     *
709040f0e13SKlap-in     * @param int $rev   revision timestamp
710040f0e13SKlap-in     * @return array(fp, array(changeloglines), $head, $tail, $eof)|bool
711040f0e13SKlap-in     *     returns false when not succeed. fp only defined for chuck reading, needs closing.
712040f0e13SKlap-in     */
713047bad06SGerrit Uitslag    protected function readloglines($rev) {
714047bad06SGerrit Uitslag        $file = $this->getChangelogFilename();
7158eccf945SGerrit Uitslag
716f9528c0cSKlap-in        if(!@file_exists($file)) {
717f9528c0cSKlap-in            return false;
718f9528c0cSKlap-in        }
719f9528c0cSKlap-in
720f9528c0cSKlap-in        $fp = null;
721f9528c0cSKlap-in        $head = 0;
722040f0e13SKlap-in        $tail = 0;
723f9528c0cSKlap-in        $eof = 0;
7248eccf945SGerrit Uitslag
7258eccf945SGerrit Uitslag        if(filesize($file) < $this->chunk_size || $this->chunk_size == 0) {
726f9528c0cSKlap-in            // read whole file
727f9528c0cSKlap-in            $lines = file($file);
728f9528c0cSKlap-in            if($lines === false) {
729f9528c0cSKlap-in                return false;
730f9528c0cSKlap-in            }
731f9528c0cSKlap-in        } else {
732f9528c0cSKlap-in            // read by chunk
733f9528c0cSKlap-in            $fp = fopen($file, 'rb'); // "file pointer"
734f9528c0cSKlap-in            if($fp === false) {
735f9528c0cSKlap-in                return false;
736040f0e13SKlap-in            }
737f9528c0cSKlap-in            $head = 0;
738040f0e13SKlap-in            fseek($fp, 0, SEEK_END);
739040f0e13SKlap-in            $eof = ftell($fp);
740040f0e13SKlap-in            $tail = $eof;
741f9528c0cSKlap-in
742f9528c0cSKlap-in            // find chunk
7438eccf945SGerrit Uitslag            while($tail - $head > $this->chunk_size) {
744f9528c0cSKlap-in                $finger = $head + floor(($tail - $head) / 2.0);
7458eccf945SGerrit Uitslag                $finger = $this->getNewlinepointer($fp, $finger);
746040f0e13SKlap-in                $tmp = fgets($fp);
747f9528c0cSKlap-in                if($finger == $head || $finger == $tail) {
748f9528c0cSKlap-in                    break;
749f9528c0cSKlap-in                }
75059cce2d9SGerrit Uitslag                $tmp = parseChangelogLine($tmp);
75159cce2d9SGerrit Uitslag                $finger_rev = $tmp['date'];
75259cce2d9SGerrit Uitslag
753f9528c0cSKlap-in                if($finger_rev > $rev) {
754f9528c0cSKlap-in                    $tail = $finger;
755f9528c0cSKlap-in                } else {
756f9528c0cSKlap-in                    $head = $finger;
757f9528c0cSKlap-in                }
758f9528c0cSKlap-in            }
759f9528c0cSKlap-in
760f9528c0cSKlap-in            if($tail - $head < 1) {
761f9528c0cSKlap-in                // cound not find chunk, assume requested rev is missing
762f9528c0cSKlap-in                fclose($fp);
763f9528c0cSKlap-in                return false;
764f9528c0cSKlap-in            }
765f9528c0cSKlap-in
7668eccf945SGerrit Uitslag            $lines = $this->readChunk($fp, $head, $tail);
767f9528c0cSKlap-in        }
768040f0e13SKlap-in        return array(
769040f0e13SKlap-in            $fp,
770040f0e13SKlap-in            $lines,
771040f0e13SKlap-in            $head,
772040f0e13SKlap-in            $tail,
773040f0e13SKlap-in            $eof
774040f0e13SKlap-in        );
775f9528c0cSKlap-in    }
776f9528c0cSKlap-in
777f9528c0cSKlap-in    /**
778f9528c0cSKlap-in     * Read chunk and return array with lines of given chunck.
779f9528c0cSKlap-in     * Has no check if $head and $tail are really at a new line
780f9528c0cSKlap-in     *
781f9528c0cSKlap-in     * @param $fp resource filepointer
782f9528c0cSKlap-in     * @param $head int start point chunck
783f9528c0cSKlap-in     * @param $tail int end point chunck
784f9528c0cSKlap-in     * @return array lines read from chunck
785f9528c0cSKlap-in     */
7868eccf945SGerrit Uitslag    protected function readChunk($fp, $head, $tail) {
787f9528c0cSKlap-in        $chunk = '';
788f9528c0cSKlap-in        $chunk_size = max($tail - $head, 0); // found chunk size
789f9528c0cSKlap-in        $got = 0;
790f9528c0cSKlap-in        fseek($fp, $head);
791f9528c0cSKlap-in        while($got < $chunk_size && !feof($fp)) {
79259cce2d9SGerrit Uitslag            $tmp = @fread($fp, max(min($this->chunk_size, $chunk_size - $got), 0));
793040f0e13SKlap-in            if($tmp === false) { //error state
794f9528c0cSKlap-in                break;
795040f0e13SKlap-in            }
796f9528c0cSKlap-in            $got += strlen($tmp);
797f9528c0cSKlap-in            $chunk .= $tmp;
798f9528c0cSKlap-in        }
799f9528c0cSKlap-in        $lines = explode("\n", $chunk);
800f9528c0cSKlap-in        array_pop($lines); // remove trailing newline
801f9528c0cSKlap-in        return $lines;
802f9528c0cSKlap-in    }
803f9528c0cSKlap-in
804f9528c0cSKlap-in    /**
805f9528c0cSKlap-in     * Set pointer to first new line after $finger and return its position
806f9528c0cSKlap-in     *
8071da8dc97SGerrit Uitslag     * @param resource $fp filepointer
808f9528c0cSKlap-in     * @param $finger int a pointer
809f9528c0cSKlap-in     * @return int pointer
810f9528c0cSKlap-in     */
8118eccf945SGerrit Uitslag    protected function getNewlinepointer($fp, $finger) {
812f9528c0cSKlap-in        fseek($fp, $finger);
81359cce2d9SGerrit Uitslag        $nl = $finger;
81459cce2d9SGerrit Uitslag        if($finger > 0) {
815f9528c0cSKlap-in            fgets($fp); // slip the finger forward to a new line
81659cce2d9SGerrit Uitslag            $nl = ftell($fp);
81759cce2d9SGerrit Uitslag        }
81859cce2d9SGerrit Uitslag        return $nl;
819f9528c0cSKlap-in    }
8208eccf945SGerrit Uitslag
8218eccf945SGerrit Uitslag    /**
8228eccf945SGerrit Uitslag     * Check whether given revision is the current page
8238eccf945SGerrit Uitslag     *
8248eccf945SGerrit Uitslag     * @param int $rev   timestamp of current page
8258eccf945SGerrit Uitslag     * @return bool true if $rev is current revision, otherwise false
8268eccf945SGerrit Uitslag     */
827047bad06SGerrit Uitslag    public function isCurrentRevision($rev) {
828047bad06SGerrit Uitslag        return $rev == @filemtime($this->getFilename());
8298eccf945SGerrit Uitslag    }
8301da8dc97SGerrit Uitslag
8311da8dc97SGerrit Uitslag    /**
8321da8dc97SGerrit Uitslag     * Returns the next lines of the changelog  of the chunck before head or after tail
8331da8dc97SGerrit Uitslag     *
8341da8dc97SGerrit Uitslag     * @param resource $fp filepointer
8351da8dc97SGerrit Uitslag     * @param int $head position head of last chunk
8361da8dc97SGerrit Uitslag     * @param int $tail position tail of last chunk
8371da8dc97SGerrit Uitslag     * @param int $direction positive forward, negative backward
8381da8dc97SGerrit Uitslag     * @return array with entries:
8391da8dc97SGerrit Uitslag     *    - $lines: changelog lines of readed chunk
8401da8dc97SGerrit Uitslag     *    - $head: head of chunk
8411da8dc97SGerrit Uitslag     *    - $tail: tail of chunk
8421da8dc97SGerrit Uitslag     */
8431da8dc97SGerrit Uitslag    protected function readAdjacentChunk($fp, $head, $tail, $direction) {
8441da8dc97SGerrit Uitslag        if(!$fp) return array(array(), $head, $tail);
8451da8dc97SGerrit Uitslag
8461da8dc97SGerrit Uitslag        if($direction > 0) {
8471da8dc97SGerrit Uitslag            //read forward
8481da8dc97SGerrit Uitslag            $head = $tail;
8491da8dc97SGerrit Uitslag            $tail = $head + floor($this->chunk_size * (2 / 3));
8501da8dc97SGerrit Uitslag            $tail = $this->getNewlinepointer($fp, $tail);
8511da8dc97SGerrit Uitslag        } else {
8521da8dc97SGerrit Uitslag            //read backward
8531da8dc97SGerrit Uitslag            $tail = $head;
8541da8dc97SGerrit Uitslag            $head = max($tail - $this->chunk_size, 0);
8551da8dc97SGerrit Uitslag            while(true) {
8561da8dc97SGerrit Uitslag                $nl = $this->getNewlinepointer($fp, $head);
8571da8dc97SGerrit Uitslag                // was the chunk big enough? if not, take another bite
8581da8dc97SGerrit Uitslag                if($nl > 0 && $tail <= $nl) {
8591da8dc97SGerrit Uitslag                    $head = max($head - $this->chunk_size, 0);
8601da8dc97SGerrit Uitslag                } else {
8611da8dc97SGerrit Uitslag                    $head = $nl;
8621da8dc97SGerrit Uitslag                    break;
8631da8dc97SGerrit Uitslag                }
8641da8dc97SGerrit Uitslag            }
8658eccf945SGerrit Uitslag        }
8668eccf945SGerrit Uitslag
8671da8dc97SGerrit Uitslag        //load next chunck
8681da8dc97SGerrit Uitslag        $lines = $this->readChunk($fp, $head, $tail);
8691da8dc97SGerrit Uitslag        return array($lines, $head, $tail);
8701da8dc97SGerrit Uitslag    }
8711da8dc97SGerrit Uitslag
8721da8dc97SGerrit Uitslag    /**
8731da8dc97SGerrit Uitslag     * Collect the $max revisions near to the timestamp $rev
8741da8dc97SGerrit Uitslag     *
8751da8dc97SGerrit Uitslag     * @param int $rev revision timestamp
8761da8dc97SGerrit Uitslag     * @param int $max maximum number of revisions to be returned
8771da8dc97SGerrit Uitslag     * @return bool|array
8781da8dc97SGerrit Uitslag     *     return array with entries:
8791da8dc97SGerrit Uitslag     *       - $requestedrevs: array of with $max revision timestamps
8801da8dc97SGerrit Uitslag     *       - $revs: all parsed revision timestamps
8811da8dc97SGerrit Uitslag     *       - $fp: filepointer only defined for chuck reading, needs closing.
8821da8dc97SGerrit Uitslag     *       - $lines: non-parsed changelog lines before the parsed revisions
8831da8dc97SGerrit Uitslag     *       - $head: position of first readed changelogline
8841da8dc97SGerrit Uitslag     *       - $lasttail: position of end of last readed changelogline
8851da8dc97SGerrit Uitslag     *     otherwise false
8861da8dc97SGerrit Uitslag     */
8871da8dc97SGerrit Uitslag    protected function retrieveRevisionsAround($rev, $max) {
8881da8dc97SGerrit Uitslag        //get lines from changelog
8891da8dc97SGerrit Uitslag        list($fp, $lines, $starthead, $starttail, $eof) = $this->readloglines($rev);
8901da8dc97SGerrit Uitslag        if(empty($lines)) return false;
8911da8dc97SGerrit Uitslag
8921da8dc97SGerrit Uitslag        //parse chunk containing $rev, and read forward more chunks until $max/2 is reached
8931da8dc97SGerrit Uitslag        $head = $starthead;
8941da8dc97SGerrit Uitslag        $tail = $starttail;
8951da8dc97SGerrit Uitslag        $revs = array();
8961da8dc97SGerrit Uitslag        $aftercount = $beforecount = 0;
8971da8dc97SGerrit Uitslag        while(count($lines) > 0) {
8981da8dc97SGerrit Uitslag            foreach($lines as $line) {
8991da8dc97SGerrit Uitslag                $tmp = parseChangelogLine($line);
9001da8dc97SGerrit Uitslag                if($tmp !== false) {
9011da8dc97SGerrit Uitslag                    $this->cache[$this->id][$tmp['date']] = $tmp;
9021da8dc97SGerrit Uitslag                    $revs[] = $tmp['date'];
9031da8dc97SGerrit Uitslag                    if($tmp['date'] >= $rev) {
9041da8dc97SGerrit Uitslag                        //count revs after reference $rev
9051da8dc97SGerrit Uitslag                        $aftercount++;
9061da8dc97SGerrit Uitslag                        if($aftercount == 1) $beforecount = count($revs);
9071da8dc97SGerrit Uitslag                    }
9081da8dc97SGerrit Uitslag                    //enough revs after reference $rev?
9091da8dc97SGerrit Uitslag                    if($aftercount > floor($max / 2)) break 2;
9101da8dc97SGerrit Uitslag                }
9111da8dc97SGerrit Uitslag            }
9121da8dc97SGerrit Uitslag            //retrieve next chunk
9131da8dc97SGerrit Uitslag            list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, 1);
9141da8dc97SGerrit Uitslag        }
9151da8dc97SGerrit Uitslag        if($aftercount == 0) return false;
9161da8dc97SGerrit Uitslag
9171da8dc97SGerrit Uitslag        $lasttail = $tail;
9181da8dc97SGerrit Uitslag
9191da8dc97SGerrit Uitslag        //read additional chuncks backward until $max/2 is reached and total number of revs is equal to $max
9201da8dc97SGerrit Uitslag        $lines = array();
9211da8dc97SGerrit Uitslag        $i = 0;
9221da8dc97SGerrit Uitslag        if($aftercount > 0) {
9231da8dc97SGerrit Uitslag            $head = $starthead;
9241da8dc97SGerrit Uitslag            $tail = $starttail;
9251da8dc97SGerrit Uitslag            while($head > 0) {
9261da8dc97SGerrit Uitslag                list($lines, $head, $tail) = $this->readAdjacentChunk($fp, $head, $tail, -1);
9271da8dc97SGerrit Uitslag
9281da8dc97SGerrit Uitslag                for($i = count($lines) - 1; $i >= 0; $i--) {
9291da8dc97SGerrit Uitslag                    $tmp = parseChangelogLine($lines[$i]);
9301da8dc97SGerrit Uitslag                    if($tmp !== false) {
9311da8dc97SGerrit Uitslag                        $this->cache[$this->id][$tmp['date']] = $tmp;
9321da8dc97SGerrit Uitslag                        $revs[] = $tmp['date'];
9331da8dc97SGerrit Uitslag                        $beforecount++;
9341da8dc97SGerrit Uitslag                        //enough revs before reference $rev?
9351da8dc97SGerrit Uitslag                        if($beforecount > max(floor($max / 2), $max - $aftercount)) break 2;
9361da8dc97SGerrit Uitslag                    }
9371da8dc97SGerrit Uitslag                }
9381da8dc97SGerrit Uitslag            }
9391da8dc97SGerrit Uitslag        }
9401da8dc97SGerrit Uitslag        sort($revs);
9411da8dc97SGerrit Uitslag
9421da8dc97SGerrit Uitslag        //keep only non-parsed lines
9431da8dc97SGerrit Uitslag        $lines = array_slice($lines, 0, $i);
9441da8dc97SGerrit Uitslag        //trunk desired selection
9451da8dc97SGerrit Uitslag        $requestedrevs = array_slice($revs, -$max, $max);
9461da8dc97SGerrit Uitslag
9471da8dc97SGerrit Uitslag        return array($requestedrevs, $revs, $fp, $lines, $head, $lasttail);
9481da8dc97SGerrit Uitslag    }
9491da8dc97SGerrit Uitslag}
9501da8dc97SGerrit Uitslag
9511da8dc97SGerrit Uitslag/**
9521da8dc97SGerrit Uitslag * Class PageChangelog handles changelog of a wiki page
9531da8dc97SGerrit Uitslag */
954047bad06SGerrit Uitslagclass PageChangelog extends ChangeLog {
955047bad06SGerrit Uitslag
956047bad06SGerrit Uitslag    /**
957047bad06SGerrit Uitslag     * Returns path to changelog
958047bad06SGerrit Uitslag     *
959047bad06SGerrit Uitslag     * @return string path to file
960047bad06SGerrit Uitslag     */
961047bad06SGerrit Uitslag    protected function getChangelogFilename() {
962047bad06SGerrit Uitslag        return metaFN($this->id, '.changes');
963047bad06SGerrit Uitslag    }
964047bad06SGerrit Uitslag
965047bad06SGerrit Uitslag    /**
966047bad06SGerrit Uitslag     * Returns path to current page/media
967047bad06SGerrit Uitslag     *
968047bad06SGerrit Uitslag     * @return string path to file
969047bad06SGerrit Uitslag     */
970047bad06SGerrit Uitslag    protected function getFilename() {
971047bad06SGerrit Uitslag        return wikiFN($this->id);
972047bad06SGerrit Uitslag    }
973047bad06SGerrit Uitslag}
974047bad06SGerrit Uitslag
9751da8dc97SGerrit Uitslag/**
9761da8dc97SGerrit Uitslag * Class MediaChangelog handles changelog of a media file
9771da8dc97SGerrit Uitslag */
978047bad06SGerrit Uitslagclass MediaChangelog extends ChangeLog {
979047bad06SGerrit Uitslag
980047bad06SGerrit Uitslag    /**
981047bad06SGerrit Uitslag     * Returns path to changelog
982047bad06SGerrit Uitslag     *
983047bad06SGerrit Uitslag     * @return string path to file
984047bad06SGerrit Uitslag     */
985047bad06SGerrit Uitslag    protected function getChangelogFilename() {
986047bad06SGerrit Uitslag        return mediaMetaFN($this->id, '.changes');
987047bad06SGerrit Uitslag    }
988047bad06SGerrit Uitslag
989047bad06SGerrit Uitslag    /**
990047bad06SGerrit Uitslag     * Returns path to current page/media
991047bad06SGerrit Uitslag     *
992047bad06SGerrit Uitslag     * @return string path to file
993047bad06SGerrit Uitslag     */
994047bad06SGerrit Uitslag    protected function getFilename() {
995047bad06SGerrit Uitslag        return mediaFN($this->id);
996047bad06SGerrit Uitslag    }
997047bad06SGerrit Uitslag}
998047bad06SGerrit Uitslag
9998eccf945SGerrit Uitslag/**
10008eccf945SGerrit Uitslag * Get the changelog information for a specific page id
10018eccf945SGerrit Uitslag * and revision (timestamp). Adjacent changelog lines
10028eccf945SGerrit Uitslag * are optimistically parsed and cached to speed up
10038eccf945SGerrit Uitslag * consecutive calls to getRevisionInfo. For large
10048eccf945SGerrit Uitslag * changelog files, only the chunk containing the
10058eccf945SGerrit Uitslag * requested changelog line is read.
10068eccf945SGerrit Uitslag *
1007*1419a485SAndreas Gohr * @deprecated 2013-11-20
10088eccf945SGerrit Uitslag *
10098eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net>
10108eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net>
10118eccf945SGerrit Uitslag */
10128eccf945SGerrit Uitslagfunction getRevisionInfo($id, $rev, $chunk_size = 8192, $media = false) {
1013*1419a485SAndreas Gohr    dbg_deprecated('class PageChangeLog or class MediaChanglog');
1014047bad06SGerrit Uitslag    if($media) {
1015047bad06SGerrit Uitslag        $changelog = new MediaChangeLog($id, $chunk_size);
1016047bad06SGerrit Uitslag    } else {
1017047bad06SGerrit Uitslag        $changelog = new PageChangeLog($id, $chunk_size);
1018047bad06SGerrit Uitslag    }
1019047bad06SGerrit Uitslag    return $changelog->getRevisionInfo($rev);
10208eccf945SGerrit Uitslag}
10218eccf945SGerrit Uitslag
10228eccf945SGerrit Uitslag/**
10238eccf945SGerrit Uitslag * Return a list of page revisions numbers
10248eccf945SGerrit Uitslag * Does not guarantee that the revision exists in the attic,
10258eccf945SGerrit Uitslag * only that a line with the date exists in the changelog.
10268eccf945SGerrit Uitslag * By default the current revision is skipped.
10278eccf945SGerrit Uitslag *
10288eccf945SGerrit Uitslag * id:    the page of interest
10298eccf945SGerrit Uitslag * first: skip the first n changelog lines
10308eccf945SGerrit Uitslag * num:   number of revisions to return
10318eccf945SGerrit Uitslag *
10328eccf945SGerrit Uitslag * The current revision is automatically skipped when the page exists.
10338eccf945SGerrit Uitslag * See $INFO['meta']['last_change'] for the current revision.
10348eccf945SGerrit Uitslag *
10358eccf945SGerrit Uitslag * For efficiency, the log lines are parsed and cached for later
10368eccf945SGerrit Uitslag * calls to getRevisionInfo. Large changelog files are read
10378eccf945SGerrit Uitslag * backwards in chunks until the requested number of changelog
10388eccf945SGerrit Uitslag * lines are recieved.
10398eccf945SGerrit Uitslag *
1040*1419a485SAndreas Gohr * @deprecated 2013-11-20
10418eccf945SGerrit Uitslag *
10428eccf945SGerrit Uitslag * @author Ben Coburn <btcoburn@silicodon.net>
10438eccf945SGerrit Uitslag * @author Kate Arzamastseva <pshns@ukr.net>
10448eccf945SGerrit Uitslag */
10458eccf945SGerrit Uitslagfunction getRevisions($id, $first, $num, $chunk_size = 8192, $media = false) {
1046*1419a485SAndreas Gohr    dbg_deprecated('class PageChangeLog or class MediaChanglog');
1047047bad06SGerrit Uitslag    if($media) {
1048047bad06SGerrit Uitslag        $changelog = new MediaChangeLog($id, $chunk_size);
1049047bad06SGerrit Uitslag    } else {
1050047bad06SGerrit Uitslag        $changelog = new PageChangeLog($id, $chunk_size);
1051047bad06SGerrit Uitslag    }
1052047bad06SGerrit Uitslag    return $changelog->getRevisions($first, $num);
10538eccf945SGerrit Uitslag}
1054