xref: /dokuwiki/inc/Ui/Search.php (revision cbcc2fa56554cf45313ade4c9c8a07391ca4dc3d)
121fcef82SMichael Große<?php
221fcef82SMichael Große
321fcef82SMichael Großenamespace dokuwiki\Ui;
421fcef82SMichael Große
5427ed988SMichael Großeuse \dokuwiki\Form\Form;
6427ed988SMichael Große
721fcef82SMichael Großeclass Search extends Ui
821fcef82SMichael Große{
921fcef82SMichael Große    protected $query;
104c924eb8SMichael Große    protected $parsedQuery;
1121fcef82SMichael Große    protected $pageLookupResults = array();
1221fcef82SMichael Große    protected $fullTextResults = array();
1321fcef82SMichael Große    protected $highlight = array();
1421fcef82SMichael Große
1521fcef82SMichael Große    /**
1621fcef82SMichael Große     * Search constructor.
1721fcef82SMichael Große     *
1821fcef82SMichael Große     * @param string $query the search query
1921fcef82SMichael Große     */
2021fcef82SMichael Große    public function __construct($query)
2121fcef82SMichael Große    {
2221fcef82SMichael Große        $this->query = $query;
234c924eb8SMichael Große        $Indexer = idx_get_indexer();
244c924eb8SMichael Große        $this->parsedQuery = ft_queryParser($Indexer, $query);
2521fcef82SMichael Große    }
2621fcef82SMichael Große
2721fcef82SMichael Große    /**
2821fcef82SMichael Große     * run the search
2921fcef82SMichael Große     */
3021fcef82SMichael Große    public function execute()
3121fcef82SMichael Große    {
3221fcef82SMichael Große        $this->pageLookupResults = ft_pageLookup($this->query, true, useHeading('navigation'));
3321fcef82SMichael Große        $this->fullTextResults = ft_pageSearch($this->query, $highlight);
3421fcef82SMichael Große        $this->highlight = $highlight;
3521fcef82SMichael Große    }
3621fcef82SMichael Große
3721fcef82SMichael Große    /**
3821fcef82SMichael Große     * display the search result
3921fcef82SMichael Große     *
4021fcef82SMichael Große     * @return void
4121fcef82SMichael Große     */
4221fcef82SMichael Große    public function show()
4321fcef82SMichael Große    {
4421fcef82SMichael Große        $searchHTML = '';
4521fcef82SMichael Große
46427ed988SMichael Große        $searchHTML .= $this->getSearchFormHTML($this->query);
47427ed988SMichael Große
4821fcef82SMichael Große        $searchHTML .= $this->getSearchIntroHTML($this->query);
4921fcef82SMichael Große
5021fcef82SMichael Große        $searchHTML .= $this->getPageLookupHTML($this->pageLookupResults);
5121fcef82SMichael Große
5221fcef82SMichael Große        $searchHTML .= $this->getFulltextResultsHTML($this->fullTextResults, $this->highlight);
5321fcef82SMichael Große
5421fcef82SMichael Große        echo $searchHTML;
5521fcef82SMichael Große    }
5621fcef82SMichael Große
5721fcef82SMichael Große    /**
58427ed988SMichael Große     * Get a form which can be used to adjust/refine the search
59427ed988SMichael Große     *
60427ed988SMichael Große     * @param string $query
61427ed988SMichael Große     *
62427ed988SMichael Große     * @return string
63427ed988SMichael Große     */
64427ed988SMichael Große    protected function getSearchFormHTML($query)
65427ed988SMichael Große    {
66*cbcc2fa5SMichael Große        global $lang, $ID;
67427ed988SMichael Große
68bb8ef867SMichael Große        $searchForm = (new Form())->attrs(['method' => 'get'])->addClass('search-results-form');
69bb8ef867SMichael Große        $searchForm->setHiddenField('do', 'search');
70*cbcc2fa5SMichael Große        $searchForm->setHiddenField('from', $ID);
71bb8ef867SMichael Große        $searchForm->addFieldsetOpen()->addClass('search-results-form__fieldset');
72bb8ef867SMichael Große        $searchForm->addTextInput('id')->val($query);
73427ed988SMichael Große        $searchForm->addButton('', $lang['btn_search'])->attr('type', 'submit');
74bb8ef867SMichael Große
754c924eb8SMichael Große        if ($this->isSearchAssistanceAvailable($this->parsedQuery)) {
764c924eb8SMichael Große            $this->addSearchAssistanceElements($searchForm, $this->parsedQuery);
77bb8ef867SMichael Große        } else {
78bb8ef867SMichael Große            $searchForm->addClass('search-results-form--no-assistance');
79bb8ef867SMichael Große            $searchForm->addTagOpen('span')->addClass('search-results-form__no-assistance-message');
80bb8ef867SMichael Große            $searchForm->addHTML('FIXME Your query is too complex. Search assistance is unavailable. See <a href="https://doku.wiki/search">doku.wiki/search</a> for more help.');
81bb8ef867SMichael Große            $searchForm->addTagClose('span');
82bb8ef867SMichael Große        }
83bb8ef867SMichael Große
84427ed988SMichael Große        $searchForm->addFieldsetClose();
85427ed988SMichael Große
8681a0edd9SMichael Große        trigger_event('SEARCH_FORM_DISPLAY', $searchForm);
8781a0edd9SMichael Große
88427ed988SMichael Große        return $searchForm->toHTML();
89427ed988SMichael Große    }
90427ed988SMichael Große
91427ed988SMichael Große    /**
92bb8ef867SMichael Große     * Decide if the given query is simple enough to provide search assistance
93bb8ef867SMichael Große     *
94bb8ef867SMichael Große     * @param array $parsedQuery
95bb8ef867SMichael Große     *
96bb8ef867SMichael Große     * @return bool
97bb8ef867SMichael Große     */
98bb8ef867SMichael Große    protected function isSearchAssistanceAvailable(array $parsedQuery)
99bb8ef867SMichael Große    {
100bb8ef867SMichael Große        if (count($parsedQuery['words']) > 1) {
101bb8ef867SMichael Große            return false;
102bb8ef867SMichael Große        }
103bb8ef867SMichael Große        if (!empty($parsedQuery['not'])) {
104bb8ef867SMichael Große            return false;
105bb8ef867SMichael Große        }
106bb8ef867SMichael Große
107bb8ef867SMichael Große        if (!empty($parsedQuery['phrases'])) {
108bb8ef867SMichael Große            return false;
109bb8ef867SMichael Große        }
110bb8ef867SMichael Große
111bb8ef867SMichael Große        if (!empty($parsedQuery['notns'])) {
112bb8ef867SMichael Große            return false;
113bb8ef867SMichael Große        }
114bb8ef867SMichael Große        if (count($parsedQuery['ns']) > 1) {
115bb8ef867SMichael Große            return false;
116bb8ef867SMichael Große        }
117bb8ef867SMichael Große
118bb8ef867SMichael Große        return true;
119bb8ef867SMichael Große    }
120bb8ef867SMichael Große
121bb8ef867SMichael Große    /**
122bb8ef867SMichael Große     * Add the elements to be used for search assistance
123bb8ef867SMichael Große     *
124bb8ef867SMichael Große     * @param Form  $searchForm
125bb8ef867SMichael Große     * @param array $parsedQuery
126bb8ef867SMichael Große     */
127bb8ef867SMichael Große    protected function addSearchAssistanceElements(Form $searchForm, array $parsedQuery)
128bb8ef867SMichael Große    {
129bb8ef867SMichael Große        $matchType = '';
130bb8ef867SMichael Große        $searchTerm = null;
131bb8ef867SMichael Große        if (count($parsedQuery['words']) === 1) {
132bb8ef867SMichael Große            $searchTerm = $parsedQuery['words'][0];
133bb8ef867SMichael Große            $firstChar = $searchTerm[0];
134bb8ef867SMichael Große            $lastChar = substr($searchTerm, -1);
135bb8ef867SMichael Große            $matchType = 'exact';
136bb8ef867SMichael Große
137bb8ef867SMichael Große            if ($firstChar === '*') {
138bb8ef867SMichael Große                $matchType = 'starts';
139bb8ef867SMichael Große            }
140bb8ef867SMichael Große            if ($lastChar === '*') {
141bb8ef867SMichael Große                $matchType = 'ends';
142bb8ef867SMichael Große            }
143bb8ef867SMichael Große            if ($firstChar === '*' && $lastChar === '*') {
144bb8ef867SMichael Große                $matchType = 'contains';
145bb8ef867SMichael Große            }
146bb8ef867SMichael Große            $searchTerm = trim($searchTerm, '*');
147bb8ef867SMichael Große        }
148bb8ef867SMichael Große
149bb8ef867SMichael Große        $searchForm->addTextInput(
150bb8ef867SMichael Große            'searchTerm',
151bb8ef867SMichael Große            '',
152bb8ef867SMichael Große            $searchForm->findPositionByAttribute('type', 'submit')
153bb8ef867SMichael Große        )
154bb8ef867SMichael Große            ->val($searchTerm)
155bb8ef867SMichael Große            ->attr('style', 'display: none;');
156bb8ef867SMichael Große        $searchForm->addButton('toggleAssistant', 'toggle search assistant')
157bb8ef867SMichael Große            ->attr('type', 'button')
158bb8ef867SMichael Große            ->id('search-results-form__show-assistance-button')
159bb8ef867SMichael Große            ->addClass('search-results-form__show-assistance-button');
160bb8ef867SMichael Große
161bb8ef867SMichael Große        $searchForm->addTagOpen('div')
162bb8ef867SMichael Große            ->addClass('js-advancedSearchOptions')
163bb8ef867SMichael Große            ->attr('style', 'display: none;');
164bb8ef867SMichael Große
165bb8ef867SMichael Große        $searchForm->addTagOpen('div')->addClass('search-results-form__subwrapper');
166bb8ef867SMichael Große        $searchForm->addRadioButton('matchType', 'exact Match FM')->val('exact')->attr('checked',
167bb8ef867SMichael Große            $matchType === 'exact' ?: null);
168bb8ef867SMichael Große        $searchForm->addRadioButton('matchType', 'starts with FM')->val('starts')->attr('checked',
169bb8ef867SMichael Große            $matchType === 'starts' ?: null);
170bb8ef867SMichael Große        $searchForm->addRadioButton('matchType', 'ends with FM')->val('ends')->attr('checked',
171bb8ef867SMichael Große            $matchType === 'ends' ?: null);
172bb8ef867SMichael Große        $searchForm->addRadioButton('matchType', 'contains FM')->val('contains')->attr('checked',
173bb8ef867SMichael Große            $matchType === 'contains' ?: null);
174bb8ef867SMichael Große        $searchForm->addTagClose('div');
175bb8ef867SMichael Große
176bb8ef867SMichael Große        $this->addNamespaceSelector($searchForm, $parsedQuery);
177bb8ef867SMichael Große
178bb8ef867SMichael Große        $searchForm->addTagClose('div');
179bb8ef867SMichael Große    }
180bb8ef867SMichael Große
181bb8ef867SMichael Große    /**
182bb8ef867SMichael Große     * Add the elements for the namespace selector
183bb8ef867SMichael Große     *
184bb8ef867SMichael Große     * @param Form  $searchForm
185bb8ef867SMichael Große     * @param array $parsedQuery
186bb8ef867SMichael Große     */
187bb8ef867SMichael Große    protected function addNamespaceSelector(Form $searchForm, array $parsedQuery)
188bb8ef867SMichael Große    {
189bb8ef867SMichael Große        $baseNS = empty($parsedQuery['ns']) ? '' : $parsedQuery['ns'][0];
190bb8ef867SMichael Große        $namespaces = [];
191bb8ef867SMichael Große        $searchForm->addTagOpen('div')->addClass('search-results-form__subwrapper');
192bb8ef867SMichael Große        if ($baseNS) {
193bb8ef867SMichael Große            $searchForm->addRadioButton('namespace', '(no namespace FIXME)')->val('');
194bb8ef867SMichael Große            $parts = [$baseNS => count($this->fullTextResults)];
195bb8ef867SMichael Große            $upperNameSpace = $baseNS;
196bb8ef867SMichael Große            while ($upperNameSpace = getNS($upperNameSpace)) {
197bb8ef867SMichael Große                $parts[$upperNameSpace] = 0;
198bb8ef867SMichael Große            }
199bb8ef867SMichael Große            $namespaces = array_reverse($parts);
200bb8ef867SMichael Große        };
201bb8ef867SMichael Große
202bb8ef867SMichael Große        $namespaces = array_merge($namespaces, $this->getAdditionalNamespacesFromResults($baseNS));
203bb8ef867SMichael Große
204bb8ef867SMichael Große        foreach ($namespaces as $extraNS => $count) {
205bb8ef867SMichael Große            $label = $extraNS . ($count ? " ($count)" : '');
206bb8ef867SMichael Große            $namespaceCB = $searchForm->addRadioButton('namespace', $label)->val($extraNS);
207bb8ef867SMichael Große            if ($extraNS === $baseNS) {
208bb8ef867SMichael Große                $namespaceCB->attr('checked', true);
209bb8ef867SMichael Große            }
210bb8ef867SMichael Große        }
211bb8ef867SMichael Große
212bb8ef867SMichael Große        $searchForm->addTagClose('div');
213bb8ef867SMichael Große    }
214bb8ef867SMichael Große
215bb8ef867SMichael Große    /**
216bb8ef867SMichael Große     * Parse the full text results for their top namespaces below the given base namespace
217bb8ef867SMichael Große     *
218bb8ef867SMichael Große     * @param string $baseNS the namespace within which was searched, empty string for root namespace
219bb8ef867SMichael Große     *
220bb8ef867SMichael Große     * @return array an associative array with namespace => #number of found pages, sorted descending
221bb8ef867SMichael Große     */
222bb8ef867SMichael Große    protected function getAdditionalNamespacesFromResults($baseNS)
223bb8ef867SMichael Große    {
224bb8ef867SMichael Große        $namespaces = [];
225bb8ef867SMichael Große        $baseNSLength = strlen($baseNS);
226bb8ef867SMichael Große        foreach ($this->fullTextResults as $page => $numberOfHits) {
227bb8ef867SMichael Große            $namespace = getNS($page);
228bb8ef867SMichael Große            if (!$namespace) {
229bb8ef867SMichael Große                continue;
230bb8ef867SMichael Große            }
231bb8ef867SMichael Große            if ($namespace === $baseNS) {
232bb8ef867SMichael Große                continue;
233bb8ef867SMichael Große            }
234bb8ef867SMichael Große            $firstColon = strpos((string)$namespace, ':', $baseNSLength + 1) ?: strlen($namespace);
235bb8ef867SMichael Große            $subtopNS = substr($namespace, 0, $firstColon);
236bb8ef867SMichael Große            if (empty($namespaces[$subtopNS])) {
237bb8ef867SMichael Große                $namespaces[$subtopNS] = 0;
238bb8ef867SMichael Große            }
239bb8ef867SMichael Große            $namespaces[$subtopNS] += 1;
240bb8ef867SMichael Große        }
241bb8ef867SMichael Große        arsort($namespaces);
242bb8ef867SMichael Große        return $namespaces;
243bb8ef867SMichael Große    }
244bb8ef867SMichael Große
245bb8ef867SMichael Große    /**
24621fcef82SMichael Große     * Build the intro text for the search page
24721fcef82SMichael Große     *
24821fcef82SMichael Große     * @param string $query the search query
24921fcef82SMichael Große     *
25021fcef82SMichael Große     * @return string
25121fcef82SMichael Große     */
25221fcef82SMichael Große    protected function getSearchIntroHTML($query)
25321fcef82SMichael Große    {
25421fcef82SMichael Große        global $ID, $lang;
25521fcef82SMichael Große
25621fcef82SMichael Große        $intro = p_locale_xhtml('searchpage');
25721fcef82SMichael Große        // allow use of placeholder in search intro
25821fcef82SMichael Große        $pagecreateinfo = (auth_quickaclcheck($ID) >= AUTH_CREATE) ? $lang['searchcreatepage'] : '';
25921fcef82SMichael Große        $intro = str_replace(
26021fcef82SMichael Große            array('@QUERY@', '@SEARCH@', '@CREATEPAGEINFO@'),
26121fcef82SMichael Große            array(hsc(rawurlencode($query)), hsc($query), $pagecreateinfo),
26221fcef82SMichael Große            $intro
26321fcef82SMichael Große        );
26421fcef82SMichael Große        return $intro;
26521fcef82SMichael Große    }
26621fcef82SMichael Große
26721fcef82SMichael Große    /**
26821fcef82SMichael Große     * Build HTML for a list of pages with matching pagenames
26921fcef82SMichael Große     *
27021fcef82SMichael Große     * @param array $data search results
27121fcef82SMichael Große     *
27221fcef82SMichael Große     * @return string
27321fcef82SMichael Große     */
27421fcef82SMichael Große    protected function getPageLookupHTML($data)
27521fcef82SMichael Große    {
27621fcef82SMichael Große        if (empty($data)) {
27721fcef82SMichael Große            return '';
27821fcef82SMichael Große        }
27921fcef82SMichael Große
28021fcef82SMichael Große        global $lang;
28121fcef82SMichael Große
28221fcef82SMichael Große        $html = '<div class="search_quickresult">';
28321fcef82SMichael Große        $html .= '<h3>' . $lang['quickhits'] . ':</h3>';
28421fcef82SMichael Große        $html .= '<ul class="search_quickhits">';
28521fcef82SMichael Große        foreach ($data as $id => $title) {
2864eab6f7cSMichael Große            $link = html_wikilink(':' . $id);
2874eab6f7cSMichael Große            $eventData = [
2884eab6f7cSMichael Große                'listItemContent' => [$link],
2894eab6f7cSMichael Große                'page' => $id,
2904eab6f7cSMichael Große            ];
2914eab6f7cSMichael Große            trigger_event('SEARCH_RESULT_PAGELOOKUP', $eventData);
2924eab6f7cSMichael Große            $html .= '<li>' . implode('', $eventData['listItemContent']) . '</li>';
29321fcef82SMichael Große        }
29421fcef82SMichael Große        $html .= '</ul> ';
29521fcef82SMichael Große        //clear float (see http://www.complexspiral.com/publications/containing-floats/)
29621fcef82SMichael Große        $html .= '<div class="clearer"></div>';
29721fcef82SMichael Große        $html .= '</div>';
29821fcef82SMichael Große
29921fcef82SMichael Große        return $html;
30021fcef82SMichael Große    }
30121fcef82SMichael Große
30221fcef82SMichael Große    /**
30321fcef82SMichael Große     * Build HTML for fulltext search results or "no results" message
30421fcef82SMichael Große     *
30521fcef82SMichael Große     * @param array $data      the results of the fulltext search
30621fcef82SMichael Große     * @param array $highlight the terms to be highlighted in the results
30721fcef82SMichael Große     *
30821fcef82SMichael Große     * @return string
30921fcef82SMichael Große     */
31021fcef82SMichael Große    protected function getFulltextResultsHTML($data, $highlight)
31121fcef82SMichael Große    {
31221fcef82SMichael Große        global $lang;
31321fcef82SMichael Große
31421fcef82SMichael Große        if (empty($data)) {
31521fcef82SMichael Große            return '<div class="nothing">' . $lang['nothingfound'] . '</div>';
31621fcef82SMichael Große        }
31721fcef82SMichael Große
31821fcef82SMichael Große        $html = '';
31921fcef82SMichael Große        $html .= '<dl class="search_results">';
32021fcef82SMichael Große        $num = 1;
3214c924eb8SMichael Große
32221fcef82SMichael Große        foreach ($data as $id => $cnt) {
3234eab6f7cSMichael Große            $resultLink = html_wikilink(':' . $id, null, $highlight);
3244c924eb8SMichael Große
3254c924eb8SMichael Große            $resultHeader = [$resultLink];
3264c924eb8SMichael Große
3274eab6f7cSMichael Große            $snippet = '';
32821fcef82SMichael Große            if ($cnt !== 0) {
3294c924eb8SMichael Große                $resultHeader[] = $cnt . ' ' . $lang['hits'];
33021fcef82SMichael Große                if ($num < FT_SNIPPET_NUMBER) { // create snippets for the first number of matches only
3314eab6f7cSMichael Große                    $snippet = '<dd>' . ft_snippet($id, $highlight) . '</dd>';
33221fcef82SMichael Große                }
33321fcef82SMichael Große                $num++;
33421fcef82SMichael Große            }
3354eab6f7cSMichael Große
3364c924eb8SMichael Große            $restrictQueryToNSLink = $this->restrictQueryToNSLink(getNS($id));
3374c924eb8SMichael Große            if ($restrictQueryToNSLink) {
3384c924eb8SMichael Große                $resultHeader[] = $restrictQueryToNSLink;
3394c924eb8SMichael Große            }
3404c924eb8SMichael Große
3414eab6f7cSMichael Große            $eventData = [
3424c924eb8SMichael Große                'resultHeader' => $resultHeader,
3434eab6f7cSMichael Große                'resultBody' => [$snippet],
3444eab6f7cSMichael Große                'page' => $id,
3454eab6f7cSMichael Große            ];
3464eab6f7cSMichael Große            trigger_event('SEARCH_RESULT_FULLPAGE', $eventData);
3474eab6f7cSMichael Große            $html .= '<div class="search_fullpage_result">';
3484eab6f7cSMichael Große            $html .= '<dt>' . implode(' ', $eventData['resultHeader']) . '</dt>';
3494eab6f7cSMichael Große            $html .= implode('', $eventData['resultBody']);
3504eab6f7cSMichael Große            $html .= '</div>';
35121fcef82SMichael Große        }
35221fcef82SMichael Große        $html .= '</dl>';
35321fcef82SMichael Große
35421fcef82SMichael Große        return $html;
35521fcef82SMichael Große    }
3564c924eb8SMichael Große
3574c924eb8SMichael Große    /**
3584c924eb8SMichael Große     * create a link to restrict the current query to a namespace
3594c924eb8SMichael Große     *
3604c924eb8SMichael Große     * @param bool|string $ns the namespace to which to restrict the query
3614c924eb8SMichael Große     *
3624c924eb8SMichael Große     * @return bool|string
3634c924eb8SMichael Große     */
3644c924eb8SMichael Große    protected function restrictQueryToNSLink($ns)
3654c924eb8SMichael Große    {
3664c924eb8SMichael Große        if (!$ns) {
3674c924eb8SMichael Große            return false;
3684c924eb8SMichael Große        }
3694c924eb8SMichael Große        if (!$this->isSearchAssistanceAvailable($this->parsedQuery)) {
3704c924eb8SMichael Große            return false;
3714c924eb8SMichael Große        }
3724c924eb8SMichael Große        if (!empty($this->parsedQuery['ns']) && $this->parsedQuery['ns'][0] === $ns) {
3734c924eb8SMichael Große            return false;
3744c924eb8SMichael Große        }
3754c924eb8SMichael Große
3764c924eb8SMichael Große        $newQuery = ft_queryUnparser_simple(
3774c924eb8SMichael Große            $this->parsedQuery['and'],
3784c924eb8SMichael Große            [],
3794c924eb8SMichael Große            [],
3804c924eb8SMichael Große            [$ns],
3814c924eb8SMichael Große            []
3824c924eb8SMichael Große        );
3834c924eb8SMichael Große        $href = wl($newQuery, ['do' => 'search']);
3844c924eb8SMichael Große        $attributes = buildAttributes([
3854c924eb8SMichael Große            'rel' => 'nofollow',
3864c924eb8SMichael Große            'class' => 'search_namespace_link',
3874c924eb8SMichael Große        ]);
3884c924eb8SMichael Große        $name = '@' . $ns;
3894c924eb8SMichael Große        return "<a href=\"$href\" $attributes>$name</a>";
3904c924eb8SMichael Große    }
39121fcef82SMichael Große}
392