Navigation
21.12.2007, 03:35

+1Neues Altes

LLL,

das ist mein Weihnachtsgeschenk an Euch: Das Archiv des 1000steine-Forums bis zurück ins Jahr 2000. Damit sollten wir erstmal wieder genug zu lesen haben :-)

Gruß,
Rene


Ben® gefällt das


mijasper
21.12.2007, 05:31

Re: Neues Altes

Moin René!


Die Integration des Archivs ins *neue* 1000steine-Forum ist eine feine Sache!

Einiges scheint jedoch durcheinander geraten respektive nicht mehr so zu funktionieren,
wie es sollte:

1. Die 100 neuesten Beiträge sind nicht wirklich neu.

2. Einige Beitragsinhalte sind zur Gänze verschwunden, etwa hier.

3. Links zu Bildern - als thumbnails in Beiträge eingefügt - führen ins Nichts.
Beispiel: http://www.1000steine.de/forum2/forum_entry.php?id=137025

4. Die zeitliche Reihenfolge von Suchergebnissen ist fehlerhaft.
Beispiel: Suche nach *Schaukelstuhl*.



Lieben Gruß,
Michael


Hümpfch™
21.12.2007, 09:43

Re: Neues Altes

» Die Integration des Archivs ins *neue* 1000steine-Forum ist eine feine
» Sache!
Hi,
zumindest sind jezt erst mal alle Beiträge gerettet, sodass man sie mal nachlesen kann, wenn Parsimony demnäxt das alte Forum abschaltet.
(Buhuu.., jetzt darf ich meine ganzen Favoriten zu alten Postings neu raussuchen )

» Einiges scheint jedoch durcheinander geraten respektive nicht mehr so zu
» funktionieren,
» wie es sollte:
»
» 1. Die 100 neuesten Beiträge sind nicht wirklich neu.
Das scheint daran zu liegen, dass René die Postings des alten Forums numerisch oberhalb der Beiträge des neuen, aktuellen Forums einsortieren musste, um die Reihenfolge (und Verlinkungen) innerhalb des neuen Forums nicht durcheinander zu bringen. Sobald 100 neue Beiträge geschrieben wurden, also ca. heute nachmittag - :blink: - stimmts dann wieder.
»
» 2. Einige Beitragsinhalte sind zur Gänze verschwunden, etwa
» hier.
Das ist in der Tat merkwürzig.

» 3. Links zu Bildern - als thumbnails in Beiträge eingefügt - führen ins
» Nichts.
» Beispiel:
» http://www.1000steine.de/forum2/forum_entry.php?id=137025
Es scheint grundsätzlich nicht so einfach zu sein, bestimmte HTML-Tags umzusetzen.
Normal eingefügte Bilder werden wenigstens als Link angezeigt.
Vergleiche:
neu: http://www.1000steine.de/...um_entry.php?id=146256
alt: http://f24.parsimony.net/...76/messages/107719.htm

Was mich auch freut, ist, dass Bilder, die im alten Forum über das Feld "Bild-URL eintragen" - oder so ähnlich - eingefügt wurden, auch wenigstens als Link erhalten geblieben sind:
Alt: http://f24.parsimony.net/...76/messages/107703.htm
Neu: http://www.1000steine.de/...um_entry.php?id=146240

Es scheint alo grundsätzlich nur dort ein Problem zu geben, wo in das HTML-Tag noch weitere Tags eingefügt wurden, bzw. Links und Bilder verschachtelt waren.
Mit etwas Geschick findet man aber die tatächlichen Bild-URLs raus, um bei Deinem Beispiel zu bleiben:
http://www.brickshelf.com...kelstuhl.jpg_thumb.jpg
Wohin der (verschwundene) Link führen sollte, lässt sich aber nur raten.
Ich vermute, dass René zur Umsetzung der alten Beiträge in neue Beiträge ein Script benutzt hat, welches nach sucht, und alles zwischen den spitzen Klammern als Link umsetzt.
Die "normale" Umsetzung von alten Links in neue Links scheint auch funktioniert zu haben.
Alt: http://f24.parsimony.net/...76/messages/112315.htm
Neu: http://www.1000steine.de/...um_entry.php?id=150852
Kombinationen aus Link und Bild scheint das Script jedoch ignoriert zu haben.
»
» 4. Die zeitliche Reihenfolge von Suchergebnissen ist fehlerhaft.
» Beispiel:
» Suche
» nach *Schaukelstuhl*
.
Das war bisher auch schon etwas wirr, ich habe nie verstanden, in welcher Reihenfolge die Suche irgendwelche Beiträge angezeigt hat.

Aber ich finde, wir sollten froh sein, dass das Archiv zum großen Teil gerettet wurde. Immerhin galt es, nominell 113404 Beiträge umzusetzen. :surprised:

Tolle Arbeit René! k:

Vielleicht lässt sich noch ein wenig feintunen, oder wir schaffen eine Arbeitsgruppe, die sich Beitrag für Beitrag vornimmt und einzeln so editiert, das es 100%ig stimmt. :lookaround:

Gruß Ronald

P.S. Mir erscheint das Forum jetzt deutlich langsamer als vorher, hoffentlich bricht es nicht bei Beitrag 200.000 zusammen... :|


inof
21.12.2007, 11:07

Re: Neues Altes

Hallo Ronald, hallo René,

» P.S. Mir erscheint das Forum jetzt deutlich langsamer als vorher,
» hoffentlich bricht es nicht bei Beitrag 200.000 zusammen... :|

Das ist mir auch aufgefallen. Beispielsweise braucht die Seite mit den
letzten 100 Postings, die ich sehr häufig verwende, deutlich länger zum
Laden. Wirklich kritisch ist es noch nicht, aber wenn der Trend so
weitergeht, kann's ein Problem werden.

Was für eine pfuschige Datenbank ist das denn, dass die so schlecht
skaliert? Vielleicht hilft es ja schon, manuell einen Index für die
richtige DB-Tabelle anzulegen, um ihr ein wenig auf die Sprünge zu
helfen. Ohne Index skaliert es maximal linear, d.h. schlecht.

Viele Grüße
Oliver


mijasper
21.12.2007, 12:52

Re: Neues Altes

Hallo Ronald!


» [...] Sobald 100 neue Beiträge geschrieben
» wurden, also ca. heute nachmittag - :blink: - stimmts dann wieder.

Trotz seiner zeitlichen Begrenzung wollte ich dieses *Problemchen* dennoch nicht unerwähnt
lassen, zumal es mit Punkt 4 meines vorhergehenden Beitrags verwandt scheint.


» Wohin der (verschwundene) Link führen sollte, lässt sich aber nur raten.

Raten muss ich nicht ...

http://www.brickshelf.com...bauten/things/>>thumb/<>_thumb.jpg<<

... wohl aber einige - hier mit Pfeilen gekennzeichnet - Passagen der Adresse entfernen, um
das gewünschte Bild betrachten zu können:

http://www.brickshelf.com...ings/schaukelstuhl.jpg



» Das war bisher auch schon etwas wirr, ich habe nie verstanden, in welcher
» Reihenfolge die Suche irgendwelche Beiträge angezeigt hat.

Auf mich wirkt es eher ein wenig verwirrend; eine Ordnung ist nämlich sehr wohl gegeben.
Nun allerdings ist die zeitliche Reihenfolge insofern fehlerhaft, als dass die archivierten Beiträge
zwischen den gestrigen und den heutigen zu finden sind (vgl. etwa jene Suche nach *Schaukelstuhl*).


» P.S. Mir erscheint das Forum jetzt deutlich langsamer als vorher [...]

Das ist auch mein Eindruck.


Lieben Gruß,
Michael


Jojo
21.12.2007, 13:38

Re: Neues Altes

Hallo!


» zumindest sind jetzt erst mal alle Beiträge gerettet, sodass man sie mal
» nachlesen kann, wenn Parsimony demnäxt das alte Forum abschaltet.

Ja, das ist klasse.

» (Buhuu.., jetzt darf ich meine ganzen Favoriten zu alten Postings neu
» raussuchen )

Das ist nicht so klasse, aber hilft ja nix.


» » 2. Einige Beitragsinhalte sind zur Gänze verschwunden, etwa
» »
» hier.
» Das ist in der Tat merkwürzig.

Hm. Vielleicht hängt das damit zusammen, daß jener Mortimer aus Mijaspers Beispiel kein registrierter Forumsbenutzer ist? Sein zweiter Beitrag in dem Thread ist ja ebenfalls leer. (Und das kann ich im Gegensatz zu dem Bild im ersten Beitrag auch nicht mehr rekonstruieren.)


» Es scheint also grundsätzlich nur dort ein Problem zu geben, wo in das
» HTML-Tag noch weitere Tags eingefügt wurden, bzw. Links
» und Bilder verschachtelt waren.

Ja, damit wirst Du recht haben. Es erscheint auch logisch, weil derartige ALT- und wasweißich-Tags ja im BBC-Code (oder wie das mit den eckigen Klammern heißt) nicht vorkommen.
Das habbich getz davon. :-)


» Vielleicht lässt sich noch ein wenig feintunen, oder wir schaffen eine
» Arbeitsgruppe, die sich Beitrag für Beitrag vornimmt und einzeln so
» editiert, das es 100%ig stimmt.

Urgs, sag nicht sowas!


Tschüß
Jojo


Navigation
21.12.2007, 14:53

Re: Neues Altes

Hi,

zu den genannten Kritikpunkten: Sortierung der Suche ist neu organisiert, Neueste Beiträge sind alle wieder neu und die Performance sollte jetzt auch deutlich besser sein. Das Portieren des Archivs an sich war nötig, weil Parsimony im Laufe des Jahres 2008 alle Foren komplett vom Netz nimmt, selbst wenn ich weiter bezahlen wollte.

Was den Inhalt der Beiträge betrifft: Die alten Parsi-Foren haben keine Datenbanken verwendet, jeder Beitrag wurde als seperate, fertig generierte, statische HTML-Seite abgelegt. Aufgabe war es nun,mithilfe eines Scripts diese Dateien zu durchlaufen und anhand bestimmter Stellen im HTML-Code zu erkennen, wo Text steht, wo Namen sind, wo Links, Bilder etc.pp.

Damit dürfte vielen schon schimmern, dass da bei über 100.000 Beiträgen wohl oder übel Komplikationen auftreten. Die Probleme wurden verstärkt durch:

- unkonventionelle Bezeichnungen, z.B. Bilder, in denen im Dateinamen zweimal ".jpg" vorkommt (eine Unsitte bei BrickShelf)
- Änderungen im Format, in dem Parsi über die Zeit von 7 Jahren Dateien abgelegt hat
- generell keine standardkonforme Erzeugung der HTML-Seiten durch Parsimony
- keine Verwendung von Ankern oder Bezeichnern
u.e.m.

Ich habe in 5.000er-Schritten die alten Beiträge geprüft und immer dann das Script angepasst, wenn "hinten" generell nix gescheites mehr rausgekommen ist. Trotzdem gibt es jetzt natürlich noch viele Beiträge, in denen die Filtermechanismen nicht zu 100% gegriffen haben, ich konnte ja schlecht alle Beiträge manuell prüfen und berichtigen.

Wenn jetzt allerdings jemandem auffällt, dass bei Beiträgen innerhalb eines bestimmten Zeitfensters etwas generell falsch angezeigt wird (z.B., dass alle Beiträge zwischen 1.9.2003 und 17.10.2003 komplett ohne Text sind), dann kann ich das gerne richten.

Einzelne Beiträge werde ich nur editieren, wenn es darum geht, eMail-Adressen im Klarformat zu entfernen (aber das sollte eigentlich nicht mehr vorkommen).

Ansonsten werde ich die Originaldateien demnächst zum Download anbieten, abzurufen dann für jeden in seinem Benutzerkonto (hat das eigentlich schon jemand entdeckt?)

Gruß,
René


mijasper
21.12.2007, 15:04

Re: Neues Altes

Hallo Jojo!


» Hm. Vielleicht hängt das damit zusammen, daß jener Mortimer aus Mijaspers
» Beispiel kein registrierter Forumsbenutzer ist? Sein zweiter Beitrag in
» dem Thread ist ja ebenfalls leer.

Bedauerlicherweise ist dem nicht so, und deshalb hier ein weiteres Beispiel: Albironas Halle.


Lieben Gruß,
Michael


mijasper
21.12.2007, 15:27

Re: Neues Altes

Hallo René!


» Sortierung der Suche ist neu organisiert [...]

Eine Überpüfung zeigt jedoch, dass das ursprüngliche Ordnungsprinzip auf der zweiten
Ebene - antwortende Beiträge folgen dem Ursprungsbeitrag - gleichsam auf den Kopf
gestellt ist. Als Beispiel hier noch einmal meine Suche nach Schaukelstuhl.


» [...] und die Performance sollte jetzt auch deutlich besser sein.

Sie ist es!


Dank und lieben Gruß,
Michael


Jojo
21.12.2007, 15:41

Re: Neues Altes

Hallo!


» Bedauerlicherweise ist dem nicht so, und deshalb hier ein weiteres
» Beispiel:
» Albironas Halle.

Hm ja. Ich merke schon, meine Beiträge sind in der Sache ganz besonders betroffen. Das liegt wohl daran, daß ich gerne mit Bild-als-Links-Links arbeite, oder auch daran, daß ich viel sermoniere.
Nun habe ich ja (harhar) die Macht ( ), und wo ich es nachvollziehen kann und die Lust habe, kopiere ich die alten Texte von Parsimony rüber und editiere sie ins leere Posting bei 1000steine hinein.


Tschüß
Jojo


18 nachfolgende Beiträge sind ausgeblendet

Alle anzeigen Immer alle anzeigen

Gesamter Thread: