xref: /dokuwiki/inc/Ui/Search.php (revision d09b5b6441fa2464fba24f84eff22348b879676c)
121fcef82SMichael Große<?php
221fcef82SMichael Große
321fcef82SMichael Großenamespace dokuwiki\Ui;
421fcef82SMichael Große
5427ed988SMichael Großeuse \dokuwiki\Form\Form;
6427ed988SMichael Große
721fcef82SMichael Großeclass Search extends Ui
821fcef82SMichael Große{
921fcef82SMichael Große    protected $query;
104c924eb8SMichael Große    protected $parsedQuery;
1121fcef82SMichael Große    protected $pageLookupResults = array();
1221fcef82SMichael Große    protected $fullTextResults = array();
1321fcef82SMichael Große    protected $highlight = array();
1421fcef82SMichael Große
1521fcef82SMichael Große    /**
1621fcef82SMichael Große     * Search constructor.
1721fcef82SMichael Große     *
1821fcef82SMichael Große     * @param string $query the search query
1921fcef82SMichael Große     */
20*d09b5b64SMichael Große    public function __construct()
2121fcef82SMichael Große    {
22*d09b5b64SMichael Große        global $QUERY;
23*d09b5b64SMichael Große
244c924eb8SMichael Große        $Indexer = idx_get_indexer();
25*d09b5b64SMichael Große        $parsedQuery = ft_queryParser($Indexer, $QUERY);
26*d09b5b64SMichael Große
27*d09b5b64SMichael Große        $this->query = $QUERY;
28*d09b5b64SMichael Große        $this->parsedQuery = $parsedQuery;
2921fcef82SMichael Große    }
3021fcef82SMichael Große
3121fcef82SMichael Große    /**
3221fcef82SMichael Große     * run the search
3321fcef82SMichael Große     */
3421fcef82SMichael Große    public function execute()
3521fcef82SMichael Große    {
3621fcef82SMichael Große        $this->pageLookupResults = ft_pageLookup($this->query, true, useHeading('navigation'));
3721fcef82SMichael Große        $this->fullTextResults = ft_pageSearch($this->query, $highlight);
3821fcef82SMichael Große        $this->highlight = $highlight;
3921fcef82SMichael Große    }
4021fcef82SMichael Große
4121fcef82SMichael Große    /**
4221fcef82SMichael Große     * display the search result
4321fcef82SMichael Große     *
4421fcef82SMichael Große     * @return void
4521fcef82SMichael Große     */
4621fcef82SMichael Große    public function show()
4721fcef82SMichael Große    {
4821fcef82SMichael Große        $searchHTML = '';
4921fcef82SMichael Große
50427ed988SMichael Große        $searchHTML .= $this->getSearchFormHTML($this->query);
51427ed988SMichael Große
5221fcef82SMichael Große        $searchHTML .= $this->getSearchIntroHTML($this->query);
5321fcef82SMichael Große
5421fcef82SMichael Große        $searchHTML .= $this->getPageLookupHTML($this->pageLookupResults);
5521fcef82SMichael Große
5621fcef82SMichael Große        $searchHTML .= $this->getFulltextResultsHTML($this->fullTextResults, $this->highlight);
5721fcef82SMichael Große
5821fcef82SMichael Große        echo $searchHTML;
5921fcef82SMichael Große    }
6021fcef82SMichael Große
6121fcef82SMichael Große    /**
62427ed988SMichael Große     * Get a form which can be used to adjust/refine the search
63427ed988SMichael Große     *
64427ed988SMichael Große     * @param string $query
65427ed988SMichael Große     *
66427ed988SMichael Große     * @return string
67427ed988SMichael Große     */
68427ed988SMichael Große    protected function getSearchFormHTML($query)
69427ed988SMichael Große    {
70cbcc2fa5SMichael Große        global $lang, $ID;
71427ed988SMichael Große
72bb8ef867SMichael Große        $searchForm = (new Form())->attrs(['method' => 'get'])->addClass('search-results-form');
73bb8ef867SMichael Große        $searchForm->setHiddenField('do', 'search');
74cbcc2fa5SMichael Große        $searchForm->setHiddenField('from', $ID);
75*d09b5b64SMichael Große        $searchForm->setHiddenField('searchPageForm', '1');
76bb8ef867SMichael Große        $searchForm->addFieldsetOpen()->addClass('search-results-form__fieldset');
77*d09b5b64SMichael Große        $searchForm->addTextInput('id')->val($query)->useInput(false);
78427ed988SMichael Große        $searchForm->addButton('', $lang['btn_search'])->attr('type', 'submit');
79bb8ef867SMichael Große
804c924eb8SMichael Große        if ($this->isSearchAssistanceAvailable($this->parsedQuery)) {
814c924eb8SMichael Große            $this->addSearchAssistanceElements($searchForm, $this->parsedQuery);
82bb8ef867SMichael Große        } else {
83bb8ef867SMichael Große            $searchForm->addClass('search-results-form--no-assistance');
84bb8ef867SMichael Große            $searchForm->addTagOpen('span')->addClass('search-results-form__no-assistance-message');
85bb8ef867SMichael Große            $searchForm->addHTML('FIXME Your query is too complex. Search assistance is unavailable. See <a href="https://doku.wiki/search">doku.wiki/search</a> for more help.');
86bb8ef867SMichael Große            $searchForm->addTagClose('span');
87bb8ef867SMichael Große        }
88bb8ef867SMichael Große
89427ed988SMichael Große        $searchForm->addFieldsetClose();
90427ed988SMichael Große
9181a0edd9SMichael Große        trigger_event('SEARCH_FORM_DISPLAY', $searchForm);
9281a0edd9SMichael Große
93427ed988SMichael Große        return $searchForm->toHTML();
94427ed988SMichael Große    }
95427ed988SMichael Große
96427ed988SMichael Große    /**
97bb8ef867SMichael Große     * Decide if the given query is simple enough to provide search assistance
98bb8ef867SMichael Große     *
99bb8ef867SMichael Große     * @param array $parsedQuery
100bb8ef867SMichael Große     *
101bb8ef867SMichael Große     * @return bool
102bb8ef867SMichael Große     */
103bb8ef867SMichael Große    protected function isSearchAssistanceAvailable(array $parsedQuery)
104bb8ef867SMichael Große    {
105bb8ef867SMichael Große        if (count($parsedQuery['words']) > 1) {
106bb8ef867SMichael Große            return false;
107bb8ef867SMichael Große        }
108bb8ef867SMichael Große        if (!empty($parsedQuery['not'])) {
109bb8ef867SMichael Große            return false;
110bb8ef867SMichael Große        }
111bb8ef867SMichael Große
112bb8ef867SMichael Große        if (!empty($parsedQuery['phrases'])) {
113bb8ef867SMichael Große            return false;
114bb8ef867SMichael Große        }
115bb8ef867SMichael Große
116bb8ef867SMichael Große        if (!empty($parsedQuery['notns'])) {
117bb8ef867SMichael Große            return false;
118bb8ef867SMichael Große        }
119bb8ef867SMichael Große        if (count($parsedQuery['ns']) > 1) {
120bb8ef867SMichael Große            return false;
121bb8ef867SMichael Große        }
122bb8ef867SMichael Große
123bb8ef867SMichael Große        return true;
124bb8ef867SMichael Große    }
125bb8ef867SMichael Große
126bb8ef867SMichael Große    /**
127bb8ef867SMichael Große     * Add the elements to be used for search assistance
128bb8ef867SMichael Große     *
129bb8ef867SMichael Große     * @param Form  $searchForm
130bb8ef867SMichael Große     * @param array $parsedQuery
131bb8ef867SMichael Große     */
132bb8ef867SMichael Große    protected function addSearchAssistanceElements(Form $searchForm, array $parsedQuery)
133bb8ef867SMichael Große    {
134bb8ef867SMichael Große        $matchType = '';
135bb8ef867SMichael Große        $searchTerm = null;
136bb8ef867SMichael Große        if (count($parsedQuery['words']) === 1) {
137bb8ef867SMichael Große            $searchTerm = $parsedQuery['words'][0];
138bb8ef867SMichael Große            $firstChar = $searchTerm[0];
139bb8ef867SMichael Große            $lastChar = substr($searchTerm, -1);
140bb8ef867SMichael Große            $matchType = 'exact';
141bb8ef867SMichael Große
142bb8ef867SMichael Große            if ($firstChar === '*') {
143bb8ef867SMichael Große                $matchType = 'starts';
144bb8ef867SMichael Große            }
145bb8ef867SMichael Große            if ($lastChar === '*') {
146bb8ef867SMichael Große                $matchType = 'ends';
147bb8ef867SMichael Große            }
148bb8ef867SMichael Große            if ($firstChar === '*' && $lastChar === '*') {
149bb8ef867SMichael Große                $matchType = 'contains';
150bb8ef867SMichael Große            }
151bb8ef867SMichael Große            $searchTerm = trim($searchTerm, '*');
152bb8ef867SMichael Große        }
153bb8ef867SMichael Große
154bb8ef867SMichael Große        $searchForm->addTextInput(
155bb8ef867SMichael Große            'searchTerm',
156bb8ef867SMichael Große            '',
157bb8ef867SMichael Große            $searchForm->findPositionByAttribute('type', 'submit')
158bb8ef867SMichael Große        )
159bb8ef867SMichael Große            ->val($searchTerm)
160bb8ef867SMichael Große            ->attr('style', 'display: none;');
161bb8ef867SMichael Große        $searchForm->addButton('toggleAssistant', 'toggle search assistant')
162bb8ef867SMichael Große            ->attr('type', 'button')
163bb8ef867SMichael Große            ->id('search-results-form__show-assistance-button')
164bb8ef867SMichael Große            ->addClass('search-results-form__show-assistance-button');
165bb8ef867SMichael Große
166bb8ef867SMichael Große        $searchForm->addTagOpen('div')
167bb8ef867SMichael Große            ->addClass('js-advancedSearchOptions')
168bb8ef867SMichael Große            ->attr('style', 'display: none;');
169bb8ef867SMichael Große
170bb8ef867SMichael Große        $searchForm->addTagOpen('div')->addClass('search-results-form__subwrapper');
171bb8ef867SMichael Große        $searchForm->addRadioButton('matchType', 'exact Match FM')->val('exact')->attr('checked',
172bb8ef867SMichael Große            $matchType === 'exact' ?: null);
173bb8ef867SMichael Große        $searchForm->addRadioButton('matchType', 'starts with FM')->val('starts')->attr('checked',
174bb8ef867SMichael Große            $matchType === 'starts' ?: null);
175bb8ef867SMichael Große        $searchForm->addRadioButton('matchType', 'ends with FM')->val('ends')->attr('checked',
176bb8ef867SMichael Große            $matchType === 'ends' ?: null);
177bb8ef867SMichael Große        $searchForm->addRadioButton('matchType', 'contains FM')->val('contains')->attr('checked',
178bb8ef867SMichael Große            $matchType === 'contains' ?: null);
179bb8ef867SMichael Große        $searchForm->addTagClose('div');
180bb8ef867SMichael Große
181bb8ef867SMichael Große        $this->addNamespaceSelector($searchForm, $parsedQuery);
182bb8ef867SMichael Große
183bb8ef867SMichael Große        $searchForm->addTagClose('div');
184bb8ef867SMichael Große    }
185bb8ef867SMichael Große
186bb8ef867SMichael Große    /**
187bb8ef867SMichael Große     * Add the elements for the namespace selector
188bb8ef867SMichael Große     *
189bb8ef867SMichael Große     * @param Form  $searchForm
190bb8ef867SMichael Große     * @param array $parsedQuery
191bb8ef867SMichael Große     */
192bb8ef867SMichael Große    protected function addNamespaceSelector(Form $searchForm, array $parsedQuery)
193bb8ef867SMichael Große    {
194bb8ef867SMichael Große        $baseNS = empty($parsedQuery['ns']) ? '' : $parsedQuery['ns'][0];
195bb8ef867SMichael Große        $namespaces = [];
196bb8ef867SMichael Große        $searchForm->addTagOpen('div')->addClass('search-results-form__subwrapper');
197bb8ef867SMichael Große        if ($baseNS) {
198bb8ef867SMichael Große            $searchForm->addRadioButton('namespace', '(no namespace FIXME)')->val('');
199bb8ef867SMichael Große            $parts = [$baseNS => count($this->fullTextResults)];
200bb8ef867SMichael Große            $upperNameSpace = $baseNS;
201bb8ef867SMichael Große            while ($upperNameSpace = getNS($upperNameSpace)) {
202bb8ef867SMichael Große                $parts[$upperNameSpace] = 0;
203bb8ef867SMichael Große            }
204bb8ef867SMichael Große            $namespaces = array_reverse($parts);
205bb8ef867SMichael Große        };
206bb8ef867SMichael Große
207bb8ef867SMichael Große        $namespaces = array_merge($namespaces, $this->getAdditionalNamespacesFromResults($baseNS));
208bb8ef867SMichael Große
209bb8ef867SMichael Große        foreach ($namespaces as $extraNS => $count) {
210bb8ef867SMichael Große            $label = $extraNS . ($count ? " ($count)" : '');
211bb8ef867SMichael Große            $namespaceCB = $searchForm->addRadioButton('namespace', $label)->val($extraNS);
212bb8ef867SMichael Große            if ($extraNS === $baseNS) {
213bb8ef867SMichael Große                $namespaceCB->attr('checked', true);
214bb8ef867SMichael Große            }
215bb8ef867SMichael Große        }
216bb8ef867SMichael Große
217bb8ef867SMichael Große        $searchForm->addTagClose('div');
218bb8ef867SMichael Große    }
219bb8ef867SMichael Große
220bb8ef867SMichael Große    /**
221bb8ef867SMichael Große     * Parse the full text results for their top namespaces below the given base namespace
222bb8ef867SMichael Große     *
223bb8ef867SMichael Große     * @param string $baseNS the namespace within which was searched, empty string for root namespace
224bb8ef867SMichael Große     *
225bb8ef867SMichael Große     * @return array an associative array with namespace => #number of found pages, sorted descending
226bb8ef867SMichael Große     */
227bb8ef867SMichael Große    protected function getAdditionalNamespacesFromResults($baseNS)
228bb8ef867SMichael Große    {
229bb8ef867SMichael Große        $namespaces = [];
230bb8ef867SMichael Große        $baseNSLength = strlen($baseNS);
231bb8ef867SMichael Große        foreach ($this->fullTextResults as $page => $numberOfHits) {
232bb8ef867SMichael Große            $namespace = getNS($page);
233bb8ef867SMichael Große            if (!$namespace) {
234bb8ef867SMichael Große                continue;
235bb8ef867SMichael Große            }
236bb8ef867SMichael Große            if ($namespace === $baseNS) {
237bb8ef867SMichael Große                continue;
238bb8ef867SMichael Große            }
239bb8ef867SMichael Große            $firstColon = strpos((string)$namespace, ':', $baseNSLength + 1) ?: strlen($namespace);
240bb8ef867SMichael Große            $subtopNS = substr($namespace, 0, $firstColon);
241bb8ef867SMichael Große            if (empty($namespaces[$subtopNS])) {
242bb8ef867SMichael Große                $namespaces[$subtopNS] = 0;
243bb8ef867SMichael Große            }
244bb8ef867SMichael Große            $namespaces[$subtopNS] += 1;
245bb8ef867SMichael Große        }
246bb8ef867SMichael Große        arsort($namespaces);
247bb8ef867SMichael Große        return $namespaces;
248bb8ef867SMichael Große    }
249bb8ef867SMichael Große
250bb8ef867SMichael Große    /**
25121fcef82SMichael Große     * Build the intro text for the search page
25221fcef82SMichael Große     *
25321fcef82SMichael Große     * @param string $query the search query
25421fcef82SMichael Große     *
25521fcef82SMichael Große     * @return string
25621fcef82SMichael Große     */
25721fcef82SMichael Große    protected function getSearchIntroHTML($query)
25821fcef82SMichael Große    {
25921fcef82SMichael Große        global $ID, $lang;
26021fcef82SMichael Große
26121fcef82SMichael Große        $intro = p_locale_xhtml('searchpage');
26221fcef82SMichael Große        // allow use of placeholder in search intro
26321fcef82SMichael Große        $pagecreateinfo = (auth_quickaclcheck($ID) >= AUTH_CREATE) ? $lang['searchcreatepage'] : '';
26421fcef82SMichael Große        $intro = str_replace(
26521fcef82SMichael Große            array('@QUERY@', '@SEARCH@', '@CREATEPAGEINFO@'),
26621fcef82SMichael Große            array(hsc(rawurlencode($query)), hsc($query), $pagecreateinfo),
26721fcef82SMichael Große            $intro
26821fcef82SMichael Große        );
26921fcef82SMichael Große        return $intro;
27021fcef82SMichael Große    }
27121fcef82SMichael Große
27221fcef82SMichael Große    /**
27321fcef82SMichael Große     * Build HTML for a list of pages with matching pagenames
27421fcef82SMichael Große     *
27521fcef82SMichael Große     * @param array $data search results
27621fcef82SMichael Große     *
27721fcef82SMichael Große     * @return string
27821fcef82SMichael Große     */
27921fcef82SMichael Große    protected function getPageLookupHTML($data)
28021fcef82SMichael Große    {
28121fcef82SMichael Große        if (empty($data)) {
28221fcef82SMichael Große            return '';
28321fcef82SMichael Große        }
28421fcef82SMichael Große
28521fcef82SMichael Große        global $lang;
28621fcef82SMichael Große
28721fcef82SMichael Große        $html = '<div class="search_quickresult">';
28821fcef82SMichael Große        $html .= '<h3>' . $lang['quickhits'] . ':</h3>';
28921fcef82SMichael Große        $html .= '<ul class="search_quickhits">';
29021fcef82SMichael Große        foreach ($data as $id => $title) {
2914eab6f7cSMichael Große            $link = html_wikilink(':' . $id);
2924eab6f7cSMichael Große            $eventData = [
2934eab6f7cSMichael Große                'listItemContent' => [$link],
2944eab6f7cSMichael Große                'page' => $id,
2954eab6f7cSMichael Große            ];
2964eab6f7cSMichael Große            trigger_event('SEARCH_RESULT_PAGELOOKUP', $eventData);
2974eab6f7cSMichael Große            $html .= '<li>' . implode('', $eventData['listItemContent']) . '</li>';
29821fcef82SMichael Große        }
29921fcef82SMichael Große        $html .= '</ul> ';
30021fcef82SMichael Große        //clear float (see http://www.complexspiral.com/publications/containing-floats/)
30121fcef82SMichael Große        $html .= '<div class="clearer"></div>';
30221fcef82SMichael Große        $html .= '</div>';
30321fcef82SMichael Große
30421fcef82SMichael Große        return $html;
30521fcef82SMichael Große    }
30621fcef82SMichael Große
30721fcef82SMichael Große    /**
30821fcef82SMichael Große     * Build HTML for fulltext search results or "no results" message
30921fcef82SMichael Große     *
31021fcef82SMichael Große     * @param array $data      the results of the fulltext search
31121fcef82SMichael Große     * @param array $highlight the terms to be highlighted in the results
31221fcef82SMichael Große     *
31321fcef82SMichael Große     * @return string
31421fcef82SMichael Große     */
31521fcef82SMichael Große    protected function getFulltextResultsHTML($data, $highlight)
31621fcef82SMichael Große    {
31721fcef82SMichael Große        global $lang;
31821fcef82SMichael Große
31921fcef82SMichael Große        if (empty($data)) {
32021fcef82SMichael Große            return '<div class="nothing">' . $lang['nothingfound'] . '</div>';
32121fcef82SMichael Große        }
32221fcef82SMichael Große
32321fcef82SMichael Große        $html = '';
32421fcef82SMichael Große        $html .= '<dl class="search_results">';
32521fcef82SMichael Große        $num = 1;
3264c924eb8SMichael Große
32721fcef82SMichael Große        foreach ($data as $id => $cnt) {
3284eab6f7cSMichael Große            $resultLink = html_wikilink(':' . $id, null, $highlight);
3294c924eb8SMichael Große
3304c924eb8SMichael Große            $resultHeader = [$resultLink];
3314c924eb8SMichael Große
3324eab6f7cSMichael Große            $snippet = '';
33321fcef82SMichael Große            if ($cnt !== 0) {
3344c924eb8SMichael Große                $resultHeader[] = $cnt . ' ' . $lang['hits'];
33521fcef82SMichael Große                if ($num < FT_SNIPPET_NUMBER) { // create snippets for the first number of matches only
3364eab6f7cSMichael Große                    $snippet = '<dd>' . ft_snippet($id, $highlight) . '</dd>';
33721fcef82SMichael Große                }
33821fcef82SMichael Große                $num++;
33921fcef82SMichael Große            }
3404eab6f7cSMichael Große
3414c924eb8SMichael Große            $restrictQueryToNSLink = $this->restrictQueryToNSLink(getNS($id));
3424c924eb8SMichael Große            if ($restrictQueryToNSLink) {
3434c924eb8SMichael Große                $resultHeader[] = $restrictQueryToNSLink;
3444c924eb8SMichael Große            }
3454c924eb8SMichael Große
3464eab6f7cSMichael Große            $eventData = [
3474c924eb8SMichael Große                'resultHeader' => $resultHeader,
3484eab6f7cSMichael Große                'resultBody' => [$snippet],
3494eab6f7cSMichael Große                'page' => $id,
3504eab6f7cSMichael Große            ];
3514eab6f7cSMichael Große            trigger_event('SEARCH_RESULT_FULLPAGE', $eventData);
3524eab6f7cSMichael Große            $html .= '<div class="search_fullpage_result">';
3534eab6f7cSMichael Große            $html .= '<dt>' . implode(' ', $eventData['resultHeader']) . '</dt>';
3544eab6f7cSMichael Große            $html .= implode('', $eventData['resultBody']);
3554eab6f7cSMichael Große            $html .= '</div>';
35621fcef82SMichael Große        }
35721fcef82SMichael Große        $html .= '</dl>';
35821fcef82SMichael Große
35921fcef82SMichael Große        return $html;
36021fcef82SMichael Große    }
3614c924eb8SMichael Große
3624c924eb8SMichael Große    /**
3634c924eb8SMichael Große     * create a link to restrict the current query to a namespace
3644c924eb8SMichael Große     *
3654c924eb8SMichael Große     * @param bool|string $ns the namespace to which to restrict the query
3664c924eb8SMichael Große     *
3674c924eb8SMichael Große     * @return bool|string
3684c924eb8SMichael Große     */
3694c924eb8SMichael Große    protected function restrictQueryToNSLink($ns)
3704c924eb8SMichael Große    {
3714c924eb8SMichael Große        if (!$ns) {
3724c924eb8SMichael Große            return false;
3734c924eb8SMichael Große        }
3744c924eb8SMichael Große        if (!$this->isSearchAssistanceAvailable($this->parsedQuery)) {
3754c924eb8SMichael Große            return false;
3764c924eb8SMichael Große        }
3774c924eb8SMichael Große        if (!empty($this->parsedQuery['ns']) && $this->parsedQuery['ns'][0] === $ns) {
3784c924eb8SMichael Große            return false;
3794c924eb8SMichael Große        }
3804c924eb8SMichael Große
3814c924eb8SMichael Große        $newQuery = ft_queryUnparser_simple(
3824c924eb8SMichael Große            $this->parsedQuery['and'],
3834c924eb8SMichael Große            [],
3844c924eb8SMichael Große            [],
3854c924eb8SMichael Große            [$ns],
3864c924eb8SMichael Große            []
3874c924eb8SMichael Große        );
3884c924eb8SMichael Große        $href = wl($newQuery, ['do' => 'search']);
3894c924eb8SMichael Große        $attributes = buildAttributes([
3904c924eb8SMichael Große            'rel' => 'nofollow',
3914c924eb8SMichael Große            'class' => 'search_namespace_link',
3924c924eb8SMichael Große        ]);
3934c924eb8SMichael Große        $name = '@' . $ns;
3944c924eb8SMichael Große        return "<a href=\"$href\" $attributes>$name</a>";
3954c924eb8SMichael Große    }
39621fcef82SMichael Große}
397