-
Lucene ist sehr bequem, wenig Aufwand nötig
Integration von Lucene in Hibernate: Hibernate Search, nimmt einen die Integration in die eigene Anwendung ab, macht noch weniger Arbeit als Lucene
Warum doppelte Datenhaltung bei Suche in Datenbanken? Warum nicht Fulltext-Index der DB nutzen?
Bei Oracle funktioniert es aus der Datenbank ganz gut und zuverlässig (CREATE FULLTEXT INDEX)
Features: Operatoren wie NEAR, Stemming, Flexion, etc. Datenbank ist evtl. nicht so gut
Das Lucene-.jar kann man leicht mal in der neuesten Version deployen (Ein Upgrade der DB ist wahrscheinlich haariger)
Lucene ist rasend schnell, einlesen und indizieren (angeblich 95GB/h)
Skalierbar: Keine Erfahrung, Michi verwendet synchrone Indizierungsmethode, es existiert aber auch eine asynchrone & eine near Realtime Indizierung
Joe: Den Indexer sollte man aufheben (Objekt in Java), wenn man ihn „loslässt“ und schließt, macht er ein fsync auf die Dateien → slow.
Lucene ist sehr klein (kleines jar)
Lucene gibt es für quasi alle Sprachen, Java, Pyhton, .NET, … etc.
Mit minimalem Aufwand maximales Ergebnis, spätestens mit Lucene in Action & Codebeispielen bekommt man einen riesigen Werkzeugkasten (den man i.d.R. gar nicht erst braucht)
Joe: zusammen mit Lucene gibt's ein Tool um den Index anzusehen (Luke) - visualizing lucene indexes