LLL,
bei der großen Zahl an AFOLs hier, ist doch sicher ein Datenbankexperte bei, der mir mit einer Einschätzung weiterhelfen kann?
Es geht um das oft angesprochene Problem des "Ausloggens". Das Phänomen tritt sporadisch auf, mehrmals täglich. Es handelt sich nicht wirklich um ein Ausloggen der Nutzer, sondern der DB Server kann für ca. 1:30min nicht angesprochen werden, weshalb keinerlei DB Inhalte angezeigt werden (inkl. der Nutzerdaten, weshalb es dem Besucher erscheint, als wäre er ausgeloggt). Jetzt ist es aber so, dass zu diesen Zeiten und auch kurz davor keine Slow-Queries geloggt werden. Auch das allgemeine Error-Log des Webservers ist leer. Und die Maximalzahl der Verbindungen wird auch nicht erreicht, bei weitem nicht und auch nicht in einer kurzen Spitze. Es sind regelmäßig nie mehr als 20% der DB Verbindungen aktiv.
Welches Szenario könnte euch einfallen, was den DB Server veranlasst komplett dicht zu machen? Was könnte ich beobachten, welche Infos könnte ich für den Check beim Hoster anfordern?
Meine nächste Idee wäre, einzelne DB auf dem Server zu duplizieren und jeweils für eine Zeit nur das Duplikat anzusprechen, um den Übeltäter ggf zu identifizieren (im weiteren Verlauf dann entsprechend alle Tabellen der betroffenen DB mal einzeln checken). Aber ist der Aufwand gerechtfertigt, mag das sein, dass eine DB oder eine einzelne Tabelle in sich so verhunzt ist, dass sie ins stottern kommt?
LG,
-Rene
mcjw-s , Jojo , Thomas52xxx , BrickFan1 gefällt das (4 Mitglieder)
Hallo René,
das ist ein wenig stochern im Nebel... Schau dir mal die load Werte und die io Waits an.
Ansonsten wäre die Frage, ob die Ausfälle periodisch in einem nachvollziehbaren Intervall auftreten. Dann könnte man mal schauen, welche Jobs zeitgleich laufen und ggf. die DB blockieren.
Schönen Gruß
Thomas
Hi Thomas und René,
also bis jetzt ist leider keinerlei Regelmäßigkeit der Ausfälle zu erkennen, außer daß die Ausfälle in schöner Reglmäßigkeit mehrmals am Tag auftreten. Gibt es Zeitstempel, die man zur auswertung mit heranziehen könnte?
Vie leG rüße
Andreas
Wer LEGO® verfälscht oder nachmacht, oder verfälschtes oder nachgemachtes LEGO® in Umlauf bringt, wird mit MegaBloks nicht unter fünf Jahren bestraft.
BrickFan1 gefällt das
Hallo Rene,
ich kenne jetzt nicht MySQL, arbeite aber schon lange mit Oracle. Du vermutest, dass es kein Lastproblem ist, weil du weder Long-Running-Queries findest noch mehr als 20% der Verbindungen aktiv sind. Hier brauchst du aber noch mehr Werte, wie sieht es mit der CPU Auslastung bzw. den I/O Werten aus?
Ausserdem ist die DB technisch gesehen via Netzwerk an den App/WebServer angebunden - auch wenn sie auf der gleichen Maschine sind. Hier kann man meistens ein Log einschalten - bei Oracle heisst es SQLNet, bei mySQL wird es aber etwas vergleichbares geben. Zuminest der DB Treiber sollte in der Lage sein so etwas zu produzieren. Die Logfiles werden sehr gross, da jede Aktion bis ins Detail erfasst werden kann. Wenn die "Hänger" immer gleich lange ist, könnte es sich gut um einen Netzwerk-Timeout handeln.
Der dritte Ansatzpunkt ist die DB selber - wie schon mein Vorredner geschrieben hat: Gibt es irgendwelche Jobs, die die Datenbank blockieren können? Damit sind nicht "normale" SQL-Schedules gemeint, sondern eher die Richtung Index Reorganisation oder Tablespace Extension - die können komplette Tabellen sperren und Verbindungen damit blockieren.
Ich rate dir erst einmal an ein detailreicheres Log zu kommen, bevor du die DB duplizierst - du wirst es in beiden Fällen gebrauchen können.
Viel Erfolg
Lothar
BrickFan1 gefällt das
Läuft das ganze auf einer VM? Machst Du da Snapshot von? Eventuell fallen diese Events zusammen?
Gerald
My Flickr
Blog zum Trainposter V2
LDraw Teile Update 2019-01
Moinsen!
Windows oder Linux (Debian?)
Blech oder VM?
DB und Webserver auf einem Server?
Hatte damit mal viel zu tun...
Viele Grüße
Dansen
Hallo Lothar und alle anderen,
vielen Dank bis hierher für die Hinweise, ich habe nochmal alle Ausfallzeiten der letzten Tage zusammengesammelt und alle eure Stichpunkte zusammengefasst und den Technikern gesendet. Da ich die Seite hosten lasse, habe ich nicht auf alle Infos Zugriff. Ich muss jetzt einen Moment warten, was die dazu sagen. Aber den einen oder anderen Anhaltspunkt zum Nachgehen haben wir ja nun.
LG,
_Rene
Hallo René,
Du kannst mir gerne mal das Setup des Webservers, die Logs, die my.cnf, die php.ini etc. zusenden.
Außerdem solltest Du Deinen Hoster bitten, alle Prozesse zu Monitoren, möglicherweise blockiert ein anderer Prozess die Datenbank - oder auch ein Crawler.
Wenn Du Zugriff auf die Rootebene hast, kannst Du mit top oder htop auch eine Lastmessung durchführen und siehst u.U. Die hochbelasteten Prozesse.
Auch möglich ist ein Deadlock bei einer evtl. Replikation. Es könnte auch ein Recordblocking auf die Usertabelle sein, die durch ein Sessiontimeout wieder aufgelöst wird.
Aber, und da schließe ich mich den Kollegen an: Mehr Infos wären hilfreich zur Fehlereingrenzung.
LG Michael
Hallo, heute mal was Neues:
"2002 -::- Connection refused", aber nicht abgemeldet
Grüße
Werner
Lok24 hat geschrieben:
Hallo _Rene,
na dann, ich dacht ich schreib mal wenn was ungewöhliches passiert.
Bis jetzt scheint es insgesamt stabiler zu sein.
Danke für's Kümmern.
Ich muss jetzt weiter packen....
Grüße
Werner
BrickFan1 gefällt das