Artikel:

Title:
Suchmaschinen entwickeln mit Apache Lucene
Subline:

Notice:

Pages:
180
Isbn:
3-935042-45-0
Price:
22,90
Forum:

Cover_thumb:

Cover_normal:

Text_index:

Vorwort

Auf die Plätze, fertig, los!
Das dürfen Sie erwarten
Aufbau dieses Buchs
Buchbeispiele

Schritt für Schritt zur eigenen Suchmaschine
Wer suchet,
Frameworks vermitteln „Best Practices“
Realisierung von Suchmaschinen mit Lucene
Zusammenfassung

Lucene und der Rest der Welt
Lucene und die Open-Source-Bewegung
Geschichte und Entwicklung von Lucene
Marktsondierung
Lizenzierung – ein Wort der Warnung
Zusammenfassung

Download und Installation
Download
Die Distributionen
Lucene im Eigenbau
JavaCC und der QueryParser
Plugins und die Sandbox
Weitere hilfreiche Ressourcen
Zusammenfassung

Indexierung
Indexierung mit Lucene
Aufbereitung und Abstraktion des Suchraums
Dokumente für Microsoft Excel, Microsoft Word, OpenOffice/StarOffice und PDF-Dateien
Analyzer
Indexerstellung
Format des Lucene-Index
Zusammenfassung

Anfragen erstellen und bearbeiten
Von der Eingabe zur Anfrage
Lucenes Anfragesprache und deren Syntax
Anfrageauswertung mit dem QueryParser
Konstruktion von Anfragen mit dem Lucene-API
Spezielle Query-Objekte mit dem QueryParser erzeugen
Zusammenfassung

Suchprozesse gestalten
Implementierung des Suchprozesses
Suchen in einem Index mit IndexSearcher
Gleichzeitiges Durchsuchen mehrerer Indexe mit MultiSearcher
Nachfiltern von Suchergebnissen
Trefferlisten mit HitCollector festlegen
Mengenmäßige Beschränkung der Suchergebnisse mit TopDocs
Suchmaschinen als Client/Server-System konzipieren
Zusammenfassung

Aufbereitung der Suchergebnisse
„Entscheidend ist, was hinten rauskommt“
Ergebnisauswertung
Ergebnisbewertung
Ergebnispräsentation
Zusammenfassung

Nutzungsgrenzen und Ausblick
Wortstamm (Stemming)
Phonetische Suchen (Sounds like, Soundex-Algorithmen)
Assoziative Suchen/Synonymsuche
Reguläre Ausdrücke
Zusammenfassung

Anhang A: Interview mit Doug Cutting
Anhang B: Quellen
Autoren
Index


Text_back:

Lucene ist ein in Java geschriebenes Framework zur Entwicklung von Volltext-Suchmaschinen. Nicht nur die Tatsache, dass Lucene Teil des in Java-Entwicklerkreisen hochgeschätzten Jakarta-Projekts der Apache Software Foundation ist, spricht für Qualität und Zukunftsorientierung. Und das beste daran: Lucene ist Open Source und lizenzkostenfrei. Dank seiner durchdachten, flexiblen und multifunktionalen Architektur hat sich Lucene auch gegen kommerzielle Lösungen behaupten können und wurde von diversen Softwareherstellern in deren Produkte integriert.

Kompromisslos auf den Punkt gebracht und ohne unnötigen literarischen Ballast vermittelt Ihnen das vorliegende Buch das notwendige Wissen darüber, wie selbst in Projekten mit gehobenen Ansprüchen an Skalierbarkeit und Performanz die Einbindung von Suchfunktionen für eine Vielzahl von Java-Anwendungen mithilfe von Lucene gelingt.

Anhand konkreter Beispiele zeigen Manfred Hardt und Fabian Theis, wie grundlegende Aufgaben wie Indexierung, Anfragebearbeitung, Suche und Ergebnispräsentation gelöst werden. Darüber hinaus werden auch spezielle Thematiken wie die Indexierung spezieller Dokumenttypen (PDF, Microsoft Office, StarOffice/OpenOffice.org), die Entwicklung einfacher Crawler sowie fortgeschrittene Anfrage- und Ergebnispräsentationstechniken (QueryBuilder, Scoring, Filter) behandelt.

Die Themen:

  • Framework Lucene
  • Indexierung
  • Anfragen erstellen und bearbeiten
  • Suchprozesse gestalten
  • Präsentation der Suchergebnisse

Cd_title:

Cd_text:

Source_file:
Array
Source_name:
Array
Source_title:
Array
Source_text:
Array
Published:
1
Cover_original:

Published_date:
2004-08-01
Available:
1
Author_extra:

Corrigendum:

Samplechapter:
/zonen/sus/buecher/psfile/samplechapter/75/lucene42db9e19c53b4.pdf
Cd:
0
Binding:
POCKET
Category:
JAX
Corrigendum_name:

Samplechapter_name:

Showatpage:
1
Author_id: