Sections
Document Actions

Apache-Lucene als Suchmaschine für Plone

by Lars Walther last modified 2007-02-18 23:06

Autoren und Redakteure, aber auch die Benutzer selbst (Stichwort: User Generated Content) nutzen Portale in zunehmendem Maße als Archiv für die verschiedensten Dokumente und Unterlagen. Das Auffinden der Dokumente soll ebenso einfach und schnell möglich sein. Google ist dafür der Maßstab. novareto arbeitet derzeit intensiv an der technischen Integration der Suchmaschine Apache-Lucene in das Content-Management-System Plone und konnte in der vergangenen Woche eine erste Version veröffentlichen.

Der portal_catalog bildet die Schnittstelle zwischen dem Content-Management-System Plone und der objektorientierten Datenbank des Applikationsservers Zope. Alle Inhalte werden anhand bestimmter Attribute (z.B.: Titel, Beginn-Datum) und auf verschiedene Art indiziert (z.B.: Textindex, Dateindex). Die Verweise auf die einzelnen Objekte werden im Portal-Catalog gespeichert.

In einem gemeinsamen Workshop haben Lennart Regebro (Freelancer) und Christian Klinger (novareto GmbH) eine erste Version des sogenannten lucene_catalog fertiggestellt. Dabei handelt es sich um ein Alternativprodukt zum portal_catalog. Die für die Funktion von Plone benötigten Indexes werden dabei mit Lucene -methoden und -algorithmen entwickelt.

Die erste Version des lucene_cataloges wurde in das Software-Repository der Plone-Community eingecheckt. Zielsetzung ist, weitere Entwickler der Plone-Community für die Arbeit am lucene_catalog zu gewinnen. In diesem Zusammenhang wurde über die Möglichkeit diskutiert, im Rahmen eines "Mini-Sprints" am lucene_catalog weiterzuarbeiten und gleichzeitig die Suchfunktionen im Portal an die neuen Möglichkeiten anzupassen.

Wir informieren zeitnah über weitere Entwicklungen.

Navigation
Log in