Benötige Hilfe bei Solr


#1

Hiho Ihr Lieben,

finde ich hier unter Euch einen Menschen, der fähig und bereit ist, mit mir auf einem gestellten Server eine Solr-Installation mit Einrichtung des Schemas etc… hinzubiegen, sodass ich von (dev.)fyyd.de aus die Kiste mit Daten beliefern und abfragen kann.

Ich habe - wie sich das gehört - selbst den Weg dahin gesucht, aber ich glaube, dass es an der Zeit ist, mal jemanden zu fragen, der sich damit auskennt :slight_smile:

Was ist vorhanden und muss bedient werden: (dev.)fyyd.de läuft auf php7 und einem apache2. Ich werde den aktuellen Entwicklungsserver aber vorher noch platt machen und auf einen neu einzurichtenden Testserver ziehen. Damit musst Du Dir aber die Finger nicht schmutzig machen, schätze ich.

Worum geht es mir? Die Suche unter fyyd ist aktuell stino-Fulltext auf mariadb. Das ist alles schön und gut, aber sicher geht das auch flotter. Das würde ich gerne mit solr ausprobieren.

Wohin möchte ich? Ich möchte vom Testserver aus in der Lage sein, per php Daten aus der mariadb nach solr zu schieben und dann natürlich eine Suche drüber zu fahren. Dabei geht es um die zwei Taxonomien “Podast” und “Episode”. Ersteres hat aktuell knapp 15000 Einträge, Episoden gibt’s ~2.5 Mio.

Wie es danach weitergeht, weiß ich noch nicht, das wird abzuwarten sein. Zunächst aber suche ich: DICH!

Wie es sich für geldlose Privatspaßprojekte gehört, kann ich außer Ruhm, Ehre und ein dankbares Wort wenig bieten. Sollte das unrealistisch sein, bitte ich um Entschuldigung für meine Igno- und Arroganz und werde anfangen, Geld zu sparen. Oder solr ad acta legen :-]


#2

Hey Christian,

auch wenn ich dir damit nicht direkt auf deine Frage antworte: Als jemand, der sowohl Solr als auch Elasticsearch in Projekten genutzt hat würde ich dir sehr empfehlen direkt auf Elasticsearch zu setzen. Beide basieren untendrunter auf Lucene und brauchen ähnliche Mengen was die Ressourcen angeht (viele). Elasticsearch ist imho aber einfach deutlich flexibler und einfacher zu nutzen als Solr. Großer Vorteil ist, dass du das Schema nicht vor dem Reinfahren der Daten festlegen musst, sondern erstmal mehr oder weniger roh alles reintust und wenn du willst erst bei der Query entscheidest welche Kriterien du anlegen willst was Gewichtung etc. angeht.

Wenn du dir mal https://www.elastic.co/blog/a-practical-introduction-to-elasticsearch durchschaust, siehst du das du die Daten sehr einfach per HTTP Interface reinbekommst (oder eben per API client für $programmiersprache), ohne vorher groß eine Schema definieren zu müssen. Performance bei der Suche später steht Solr trotzdem in nichts nach.

Ich kann dir zwar beim tatsächlichen Hacken wenig helfen, aber schreib mich gerne im Podlove Slack mal an wenn du Fragen hast.


#3

Tatsächlich hatte ich anfangs - warum auch immer - den Eindruck, dass es die schlechtere Wahl für mich wäre, hatte aber nebenher eine Kiste für elastic geholt. Ich scheine mich geirrt zu haben, bisher sind die Ergebnisse vielversprechend.


#4

Also, in der Tat hat sich herausgestellt, dass sich ES, zumindest für mich, einfacher installieren und ansprechen lässt.

In sofern: Topic kann geschlossen werden :slight_smile: