Lucene Score resultaten

stemmen
37

In Lucene als je moest meerdere indexen die slechts één partitie elk gedekt. Waarom heeft dezelfde zoekopdracht op verschillende indexen resultaten met verschillende scores terug te keren? De resultaten van verschillende servers exact overeenkomen.

dat wil zeggen als ik gezocht naar:

  • Name - John Smith
  • DOB - 1934/11/11

Partitie 0 zou een score van 0,345 terug

Partitie 1 zou een score van 0,337 terug

Beide exact overeenkomen op de naam en DOB.

De vraag is gesteld op 02/08/2008 om 10:28
bron van user
In andere talen...                            


3 antwoorden

stemmen
19

De scoring bevat de Inverse Document Frequency (IDF). Als de term "John Smith" is in één partitie, 0, 100 keer en in partitie 1, eenmaal. De score voor het zoeken naar John Smith zou hoger zoeken in partitie 1 als de term is meer schaars.

Om deze ronde zou verdorren moet uw index die over alle partities, of dat u nodig zou hebben om de IDF overschrijven.

antwoordde op 02/08/2008 om 10:51
bron van user

stemmen
13

Omdat de score wordt bepaald aan de index als ik mij niet helemaal verkeerd.

Als u verschillende indexen (meer / minder of andere gegevens die zijn geïndexeerd), zal de score verschillen:

http://lucene.apache.org/core/3_6_0/scoring.html

(Waarschuwing: Bevat Math :-))

antwoordde op 02/08/2008 om 10:52
bron van user

stemmen
8

U bent wellicht ook geïnteresseerd in de output van de zijn explain()methode , en de daaruit voortvloeiende Explanationobject , dat u een idee van hoe de dingen worden gescoord zoals ze zijn zal geven.

antwoordde op 02/08/2008 om 21:03
bron van user

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more