Navigation
21.12.2007, 03:35
LLL,
das ist mein Weihnachtsgeschenk an Euch: Das Archiv des 1000steine-Forums bis zurück ins Jahr 2000. Damit sollten wir erstmal wieder genug zu lesen haben :-)
Gruß,
Rene
Ben® gefällt das
Jojo
21.12.2007, 13:38
Hallo!
» zumindest sind jetzt erst mal alle Beiträge gerettet, sodass man sie mal
» nachlesen kann, wenn Parsimony demnäxt das alte Forum abschaltet.
Ja, das ist klasse.
» (Buhuu.., jetzt darf ich meine ganzen Favoriten zu alten Postings neu
» raussuchen )
Das ist nicht so klasse, aber hilft ja nix.
» » 2. Einige Beitragsinhalte sind zur Gänze verschwunden, etwa
» »
» hier.
» Das ist in der Tat merkwürzig.
Hm. Vielleicht hängt das damit zusammen, daß jener Mortimer aus Mijaspers Beispiel kein registrierter Forumsbenutzer ist? Sein zweiter Beitrag in dem Thread ist ja ebenfalls leer. (Und das kann ich im Gegensatz zu dem Bild im ersten Beitrag auch nicht mehr rekonstruieren.)
» Es scheint also grundsätzlich nur dort ein Problem zu geben, wo in das
» HTML-Tag noch weitere Tags eingefügt wurden, bzw. Links
» und Bilder verschachtelt waren.
Ja, damit wirst Du recht haben. Es erscheint auch logisch, weil derartige ALT- und wasweißich-Tags ja im BBC-Code (oder wie das mit den eckigen Klammern heißt) nicht vorkommen.
Das habbich getz davon. :-)
» Vielleicht lässt sich noch ein wenig feintunen, oder wir schaffen eine
» Arbeitsgruppe, die sich Beitrag für Beitrag vornimmt und einzeln so
» editiert, das es 100%ig stimmt.
Urgs, sag nicht sowas!
Tschüß
Jojo
Navigation
21.12.2007, 14:53
Hi,
zu den genannten Kritikpunkten: Sortierung der Suche ist neu organisiert, Neueste Beiträge sind alle wieder neu und die Performance sollte jetzt auch deutlich besser sein. Das Portieren des Archivs an sich war nötig, weil Parsimony im Laufe des Jahres 2008 alle Foren komplett vom Netz nimmt, selbst wenn ich weiter bezahlen wollte.
Was den Inhalt der Beiträge betrifft: Die alten Parsi-Foren haben keine Datenbanken verwendet, jeder Beitrag wurde als seperate, fertig generierte, statische HTML-Seite abgelegt. Aufgabe war es nun,mithilfe eines Scripts diese Dateien zu durchlaufen und anhand bestimmter Stellen im HTML-Code zu erkennen, wo Text steht, wo Namen sind, wo Links, Bilder etc.pp.
Damit dürfte vielen schon schimmern, dass da bei über 100.000 Beiträgen wohl oder übel Komplikationen auftreten. Die Probleme wurden verstärkt durch:
- unkonventionelle Bezeichnungen, z.B. Bilder, in denen im Dateinamen zweimal ".jpg" vorkommt (eine Unsitte bei BrickShelf)
- Änderungen im Format, in dem Parsi über die Zeit von 7 Jahren Dateien abgelegt hat
- generell keine standardkonforme Erzeugung der HTML-Seiten durch Parsimony
- keine Verwendung von Ankern oder Bezeichnern
u.e.m.
Ich habe in 5.000er-Schritten die alten Beiträge geprüft und immer dann das Script angepasst, wenn "hinten" generell nix gescheites mehr rausgekommen ist. Trotzdem gibt es jetzt natürlich noch viele Beiträge, in denen die Filtermechanismen nicht zu 100% gegriffen haben, ich konnte ja schlecht alle Beiträge manuell prüfen und berichtigen.
Wenn jetzt allerdings jemandem auffällt, dass bei Beiträgen innerhalb eines bestimmten Zeitfensters etwas generell falsch angezeigt wird (z.B., dass alle Beiträge zwischen 1.9.2003 und 17.10.2003 komplett ohne Text sind), dann kann ich das gerne richten.
Einzelne Beiträge werde ich nur editieren, wenn es darum geht, eMail-Adressen im Klarformat zu entfernen (aber das sollte eigentlich nicht mehr vorkommen).
Ansonsten werde ich die Originaldateien demnächst zum Download anbieten, abzurufen dann für jeden in seinem Benutzerkonto (hat das eigentlich schon jemand entdeckt?)
Gruß,
René
mijasper
21.12.2007, 15:04
Hallo Jojo!
» Hm. Vielleicht hängt das damit zusammen, daß jener Mortimer aus Mijaspers
» Beispiel kein registrierter Forumsbenutzer ist? Sein zweiter Beitrag in
» dem Thread ist ja ebenfalls leer.
Bedauerlicherweise ist dem nicht so, und deshalb hier ein weiteres Beispiel: Albironas Halle.
Lieben Gruß,
Michael
mijasper
21.12.2007, 15:27
Hallo René!
» Sortierung der Suche ist neu organisiert [...]
Eine Überpüfung zeigt jedoch, dass das ursprüngliche Ordnungsprinzip auf der zweiten
Ebene - antwortende Beiträge folgen dem Ursprungsbeitrag - gleichsam auf den Kopf
gestellt ist. Als Beispiel hier noch einmal meine Suche nach Schaukelstuhl.
» [...] und die Performance sollte jetzt auch deutlich besser sein.
Sie ist es!
Dank und lieben Gruß,
Michael
Jojo
21.12.2007, 15:41
Hallo!
» Bedauerlicherweise ist dem nicht so, und deshalb hier ein weiteres
» Beispiel:
» Albironas Halle.
Hm ja. Ich merke schon, meine Beiträge sind in der Sache ganz besonders betroffen. Das liegt wohl daran, daß ich gerne mit Bild-als-Links-Links arbeite, oder auch daran, daß ich viel sermoniere.
Nun habe ich ja (harhar) die Macht ( ), und wo ich es nachvollziehen kann und die Lust habe, kopiere ich die alten Texte von Parsimony rüber und editiere sie ins leere Posting bei 1000steine hinein.
Tschüß
Jojo
Hümpfch™
21.12.2007, 16:27
» ...Benutzerkonto (hat das eigentlich schon jemand entdeckt?)
Ja :cool:
inof
21.12.2007, 16:32
Hallo René,
» Neueste Beiträge sind alle wieder neu und die Performance sollte jetzt
» auch deutlich besser sein.
Ja, so ist es. Vielen Dank für alle Deine Bemühungen!
Viele Grüße
Oliver
mijasper
21.12.2007, 17:31
Hallo Jojo!
» Nun habe ich ja (harhar) die Macht ( ), und wo ich es nachvollziehen
» kann und die Lust habe, kopiere ich die alten Texte von Parsimony rüber
» und editiere sie ins leere Posting bei 1000steine hinein.
Und vermittels (Reaktivierung der) Editier-Funktion könnte ein Teil jener Macht gar
jedem Schreiberling gegeben sein ... (*zwinker*)
Lieben Gruß,
Michael
heikoloogi
21.12.2007, 17:38
in seinem Benutzerkonto (hat das eigentlich schon
» jemand entdeckt?)
Jep, und du diskriminierst einfach so Menschen ü100 :-)
Viele Grüße,
Heiko
Navigation
21.12.2007, 18:29
Hi Michael,
» Und vermittels (Reaktivierung der) Editier-Funktion könnte ein Teil jener
» Macht gar
» jedem Schreiberling gegeben sein ... (*zwinker*)
»
http://www.1000steine.de/...rum_entry.php?id=21315
Gruß,
Rene