Projet

Général

Profil

Demande #4994

[pad.april.org] Partition mysql presque pleine

Ajouté par Christian P. Momon il y a plus de 3 ans. Mis à jour il y a plus de 2 ans.

Statut:
Fermé
Priorité:
Normale
Assigné à:
Catégorie:
-
Version cible:
Début:
04/12/2020
Echéance:
% réalisé:

0%

Temps estimé:
Difficulté:
2 Facile

Description

Sur Freenode#april-admin :

11:57 < PoluX> !list
11:57 < pascontent[14]> volume /var/lib/mysql (1): pad
12:04 < QGuLL> PoluX: /dev/mapper/vg_pad_data-mysql  7,8G  6,7G  829M  90% /var/lib/mysql
12:04 < QGuLL> pas glop
12:06 < PoluX> QGuLL: innodb qui grossi ?
12:07 < QGuLL> j'ai pas investigué encore
12:08 < PoluX> 4,5GI/var/lib/mysql/etherpad/store.ibd
12:08 < PoluX> or 225MI/var/backups/mysql/etherpad.sql.bz2
12:09 < QGuLL> c'est louche
12:10 < PoluX> beh ça me rappelle un bug connu
12:10 < PoluX> qui se résout par un dump / drop /restore
12:20 < PoluX> j'essaie un optimize table store;
12:37 < cpm_screen> PoluX: l'export SQL de la base etherpad fait 2,8 Go, donc la moitié de ce qui est occupé en base, voui, c'est louche


Fichiers

statpadaprilorgdb (4,42 ko) statpadaprilorgdb Christian P. Momon, 05/12/2020 23:00

Historique

#1

Mis à jour par Christian P. Momon il y a plus de 3 ans

  • Statut changé de Nouveau à En cours de traitement
  • Assigné à mis à François Poulain
  • Version cible changé de Backlog à Décembre 2020

Sur Freenode#april-admin :

12:38 < PoluX>     -> ;
12:38 < PoluX> +----------------+----------+----------+-------------------------------------------------------------------+
12:38 < PoluX> | Table          | Op       | Msg_type | Msg_text                                                          |
12:38 < PoluX> +----------------+----------+----------+-------------------------------------------------------------------+
12:38 < PoluX> | etherpad.store | optimize | note     | Table does not support optimize, doing recreate + analyze instead |
12:38 < PoluX> | etherpad.store | optimize | error    | The table 'store' is full                                         |
12:38 < PoluX> | etherpad.store | optimize | status   | Operation failed                                                  |
12:38 < PoluX> +----------------+----------+----------+-------------------------------------------------------------------+
12:38 < PoluX> 3 rows in set, 1 warning (15 min 43.310 sec)
12:38 < PoluX> cpm_screen: amha ça ira plus vite de couper le service et faire un dump/drop/restore
12:39 < PoluX> cf https://dba.stackexchange.com/questions/24942/how-do-i-shrink-the-innodb-file-ibdata1-without-dumping-all-databases/24963#24963
12:39 < PoluX> c'est une vielle maladie de mysql
12:39 < PoluX> on a déjà fait ça à l'april
12:42 < cpm_screen> une occasion de valider la sauvegarde ;)
12:44 -!- pascontent[15] is now known as pascontent[14]
12:45 < PoluX> beh le dump sql c'est fiable, épprouvé
12:45 < PoluX> allez ; je coupe le pad et je fais la manip le temps du repas

#2

Mis à jour par François Poulain il y a plus de 3 ans

En résumé:

systemctl stop etherpad-lite.service
mysqldump -u pad -pbling etherpad | gzip > /var/tmp/20201204_etherpad.sql.gz
mysql -u pad -pbling etherpad -e 'drop database etherpad;'
mysql -u pad -pbling -e 'create database etherpad;'
zcat /var/tmp/20201204_etherpad.sql.gz | mysql -u pad -pyuCi2aco etherpad
systemctl start etherpad-lite.service

#3

Mis à jour par François Poulain il y a plus de 3 ans

Au final la table store est quand même énorme.

Je me suis amusé à la chose suivante:

1. Trouver des timestamps dans le dump.

zgrep -bo '\\"timestamp\\":[0-9]\+' /var/tmp/20201204_etherpad.sql.gz | gzip > 20201204_etherpad_timestamps.gz

2. Un petit coup de sed

gzip -d 20201204_etherpad_timestamps.gz
sed -i -e '/:\\"timestamp\\":/,/' 20201204_etherpad_timestamps

3. Impossible de rentrer ça dans un logiciel simple de stats genre libreoffice tellement y en a

4. Simplement on va regarder les occurences période par période :

$ for ts in $(seq 130 165); do date -d @"$ts"0000000 && grep -c ",$ts" 20201204_etherpad_timestamps ; done
dim. 13 mars 2011 08:06:40 CET
0
jeu. 07 juil. 2011 02:53:20 CEST
0
dim. 30 oct. 2011 19:40:00 CET
0
jeu. 23 févr. 2012 13:26:40 CET
0
lun. 18 juin 2012 08:13:20 CEST
365
ven. 12 oct. 2012 02:00:00 CEST
132176
lun. 04 févr. 2013 18:46:40 CET
112352
ven. 31 mai 2013 13:33:20 CEST
276829
mar. 24 sept. 2013 07:20:00 CEST
243830
sam. 18 janv. 2014 00:06:40 CET
149711
mar. 13 mai 2014 18:53:20 CEST
118833
sam. 06 sept. 2014 12:40:00 CEST
131974
mer. 31 déc. 2014 05:26:40 CET
84866
dim. 26 avril 2015 00:13:20 CEST
103349
mer. 19 août 2015 18:00:00 CEST
151989
dim. 13 déc. 2015 10:46:40 CET
151046
jeu. 07 avril 2016 05:33:20 CEST
121106
dim. 31 juil. 2016 23:20:00 CEST
108158
jeu. 24 nov. 2016 16:06:40 CET
129060
lun. 20 mars 2017 09:53:20 CET
164102
ven. 14 juil. 2017 04:40:00 CEST
139785
lun. 06 nov. 2017 21:26:40 CET
123623
ven. 02 mars 2018 15:13:20 CET
188773
mar. 26 juin 2018 10:00:00 CEST
148420
sam. 20 oct. 2018 03:46:40 CEST
161310
mar. 12 févr. 2019 20:33:20 CET
165314
sam. 08 juin 2019 15:20:00 CEST
103167
mer. 02 oct. 2019 09:06:40 CEST
141548
dim. 26 janv. 2020 01:53:20 CET
3687960
mer. 20 mai 2020 20:40:00 CEST
821167
dim. 13 sept. 2020 14:26:40 CEST
356578
jeu. 07 janv. 2021 07:13:20 CET
0
lun. 03 mai 2021 02:00:00 CEST
0
jeu. 26 août 2021 19:46:40 CEST
0
lun. 20 déc. 2021 12:33:20 CET
0
ven. 15 avril 2022 07:20:00 CEST
0

Moralité : un truc chelou est arrivé en 2020.

#5

Mis à jour par François Poulain il y a plus de 3 ans

Proposition:

1. Coller dans les gros pads qui sont pas April le message suivant :

«
Bonjour,

Le service pad.april.org n'est pas destiné à accueillir du contenu qui ne concerne pas l'April.
Nous avons des soucis de performance sur ce service et donc souhaitons le délester.

Si vous avez besoin d'un pad public, vous pouvez utiliser celui de https://pad.chapril.org

Cordialement.
François Poulain, pour les administrateurs système de l'April

»

Puis dégager les pads au bout de qq semaines

2. Conserver le dump de la db puis dans qq semaines, virer de la db de prod tous les sessionstorage qui sont dans la db conservée.

#6

Mis à jour par Christian P. Momon il y a plus de 3 ans

François Poulain a écrit :

Moralité : un truc chelou est arrivé en 2020.

Le confinement ;o)

Blague à part, j'ai repris tes commandes :

grep -o '\\"timestamp\\":[0-9]\{10\}' etherpad.sql | awk -F: '{print $2}' > timestamps
sort -n timestamps > sortedtimestamps
# La commande suivante prenant plusieurs heures, en fait, j'ai splité pour paralléliser…
while read line; do date -d @"$line" +%Y-%m; done < sortedtimestamps > yearmonth
uniq -c yearmonth

cpm@ocmstar (11:57:09) ~/Téléchargement/XX 126 > uniq -c yearmonth
   6739 2019-03
  50490 2019-04
  37899 2019-05
  35076 2019-06
  19067 2019-07
  25790 2019-08
  34820 2019-09
  28131 2019-10
  33646 2019-11
  50115 2019-12
  40587 2020-01
  53133 2020-02
1472622 2020-03
1763193 2020-04
 495887 2020-05
 426726 2020-06
 155931 2020-07
  75812 2020-08
 120349 2020-09
 129666 2020-10
 147158 2020-11
  14211 2020-12

Du coup, on voit un x30 en mars et avril 2020.
Cela correspond au moment où Framasoft a réparti sur les chatons les créations de pad qui les submergeaient.
Le 21/04, j'ai fait demandé par courriel à ce que pad.april.org soit retiré de leur liste de délestage et de privilégier pad.chapril.org. Réponse de validation le jour même.

On constate qu'après, on est en x10 puis x3. Il se peut qu'une partie des utilisateurs continuent de venir d'eux-mêmes.

Suggestion d'ajouter dans texte de nouveau pad une invitation à aller sur pad.chapril.org.

#7

Mis à jour par François Poulain il y a plus de 3 ans

Le confinement ;o)

Oui, bonne analyse.

Du coup je pense :
1) qu'on devrait virer les pad à l'abandon.
2) qu'on devrait virer (ou oublier l'historique) de pads qui ont beaucoup vécu.

Je pense que notre db et notre pad ont simplement des pb de montée en charge.

Enfin pour les session storage, il y a eu plein de bug chez etherpad ouverts sur le sujet. On peut imaginer qu'on traine des zombies (plus de 1 millions de lignes en db, avec un requetage probablement pas optimal). D'où la proposition de sauver une liste de sessions et supprimer celles qui subsisteront dans qq mois.

#8

Mis à jour par Christian P. Momon il y a plus de 3 ans

François Poulain a écrit :

Autre chose. Si je prends les clés utilisées dans la table :

1 135 045 sessionstorage:

Et que je regarde les clés les plus utilisées, j'ai quelques suspects :
- des sessions qui trainent

On faisant une recherche dans le gestionnaire de tickets du projet officiel, je suis tombé sur : Et donc : En résumé :
  • ça dit que plein d'entrées sessionstorage sont créées à tort et non nettoyée ;
  • bug détecté en mars 2013 mais n'avait pas le temps de s'en occuper ("I'm not gonna have time to look at this for a bit"),
  • correction le 03 avril 2020

Le correctif est actif depuis la version 1.8.3 d'avril 2020 mais ne fait pas le nettoyage des lignes inutilement accumulées.

Conclusion : proposition de faire un gros ménage des entrées sessionstorage qui représentent 1/8 des entrées totales . Ça devrait alléger un peu la base de données :-)

#9

Mis à jour par Christian P. Momon il y a plus de 3 ans

François Poulain a écrit :

Enfin pour les session storage, il y a eu plein de bug chez etherpad ouverts sur le sujet.
On peut imaginer qu'on traine des zombies (plus de 1 millions de lignes en db, avec un requetage probablement pas optimal).
D'où la proposition de sauver une liste de sessions et supprimer celles qui subsisteront dans qq mois.

Commençons par ça.

A priori, il n'y a pas de grosse incidence suite au vidage des entrées sessionstorage.
Donc choisissons une date pour l'opération et supprimons-les toutes.

#10

Mis à jour par Christian P. Momon il y a plus de 3 ans

Pour info, 94 Mo gagnables en purgeant les sessionstorage inutiles :

MariaDB [etherpad]> select sum(length(store.value)) AS SIZE from store where store.key like 'sessionstorage:%'  ;
+----------+
| SIZE     |
+----------+
| 98751237 |
+----------+

#11

Mis à jour par Christian P. Momon il y a plus de 3 ans

#13

Mis à jour par François Poulain il y a plus de 3 ans

NB: Je ne sais pas si c'est mieux mais on peut brancher un redis sur etherpad.
https://github.com/ether/etherpad-lite/wiki/How-to-use-Etherpad-Lite-with-Redis

Etherpad utilise mysql pour une base clé/valeur. C'est vraiment un mauvais cas de figure pour sql. On peut facilement imaginer que l'usage d'une db clé/valeurs comme redis apporte du mieux en perfs.

#14

Mis à jour par François Poulain il y a plus de 3 ans

Sachant que à l'inverse, mysql est notoirement connu pour charger les IO disques ; là où redis est notoirement connu pour travailler d'abord en RAM.

#15

Mis à jour par Christian P. Momon il y a plus de 3 ans

François Poulain a écrit :

Etherpad utilise mysql pour une base clé/valeur. C'est vraiment un mauvais cas de figure pour sql.

+1

Sachant que à l'inverse, mysql est notoirement connu pour charger les IO disques

+1

là où redis est notoirement connu pour travailler d'abord en RAM.

–1 car j'avais cru comprendre que Redis chargeait TOUT en RAM. Extrait de https://fr.wikipedia.org/wiki/Redis :

Une des principales caractéristiques de Redis est de conserver l'intégralité des données en RAM.
Cela permet d'obtenir d'excellentes performances en évitant les accès disques, particulièrement coûteux sur ce plan.

Quand la taille des données est trop importante pour tenir en mémoire, Redis peut également utiliser de la mémoire virtuelle.

Afin d'assurer la conservation des données en cas d'incident — la mémoire vive étant volatile —
Redis offre la possibilité de « capturer » l'état de la base dans un fichier. Cette technique
ne conservant pas les modifications effectuées entre deux captures, il est par ailleurs possible
de les enregistrer afin de restaurer la base en cas d'incident. 

Donc :
  • Redis semble être plus un cache qu'une base de données :-/
  • faudrait attribuer 6 Go de RAM à la vm ?
  • faut accepter une persistance pas très garantie…

Je ne suis pas très rassuré. Et vous ?

#16

Mis à jour par François Poulain il y a plus de 3 ans

https://redis.io/topics/persistence

NB: je n'ai pas d'expérience en redis.

#17

Mis à jour par Quentin Gibeaux il y a plus de 3 ans

  • Version cible changé de Décembre 2020 à Janvier 2021
#18

Mis à jour par Quentin Gibeaux il y a environ 3 ans

  • Version cible changé de Janvier 2021 à Février 2021
#19

Mis à jour par François Poulain il y a environ 3 ans

J'ai sauvé la liste des sessions :

mariadb -u pad -prout etherpad -e 'select store.key from store where store.key like "sessionstorage:%"' > 20200129_sessionstorage.dat

#20

Mis à jour par François Poulain il y a environ 3 ans

Prochaine action vers la fin du mois : prendre des salves de clé et deleter les sessions.

#21

Mis à jour par Quentin Gibeaux il y a environ 3 ans

  • Version cible changé de Février 2021 à Mars 2021
#22

Mis à jour par François Poulain il y a environ 3 ans

Je fais ainsi :

cp 20200129_sessionstorage.dat 20200129_sessionstorage.sql
sed -i -e 's/^/DELETE FROM store WHERE store.key = "/' -e 's/$/";/' 20200129_sessionstorage.sql
mariadb -u pad -proot etherpad < 20200129_sessionstorage.sql

C'est long. :)

#23

Mis à jour par François Poulain il y a environ 3 ans

J'abandonne car un strace me dit au bout de plusieurs heures que j'en suis à 22k requetes sur 1 million et qu'elles ne passent pas.

recvfrom(3, "\7\0\0\1\0\1\0\2\0\0\0", 16384, MSG_DONTWAIT, NULL, NULL)                                                  = 11
sendto(3, "V\0\0\0\3DELETE FROM store WHERE store.key = \"sessionstorage:0Cq5jx8u1CswDjVgOVQM74a"..., 90, MSG_DONTWAIT|MSG_NOSIGNAL, NULL, 0) = 90
recvfrom(3, 0x55aaab9404d0, 16384, MSG_DONTWAIT, NULL, NULL)                                                            = -1 EAGAIN (Resource temporarily unavailable)
poll([{fd=3, events=POLLIN}], 1, -1)                                                                                    = 1 ([{fd=3, revents=POLLIN}])

Je vais essayer une autre stratégie.

#24

Mis à jour par François Poulain il y a environ 3 ans

C'est passé pendant l'apéro :

split ../20200129_sessionstorage.dat
for file in * ; do mariadb etherpad -e "DELETE FROM store WHERE store.key in ( $(cat $file | sed -e 's/^/"/' -e 's/$/"/') )"; done
#25

Mis à jour par François Poulain il y a environ 3 ans

Bof, pas convaincu :

MariaDB [etherpad]> select count(value) from store where store.key like 'sessionstorage:%'  ;
+--------------+
| count(value) |
+--------------+
|      1196501 |
+--------------+
1 row in set (17.254 sec)

MariaDB [etherpad]>
#26

Mis à jour par François Poulain il y a environ 3 ans

Curieux :

MariaDB [etherpad]> SELECT store.key FROM store WHERE store.key IN ( "sessionstorage:H3PYMvtn1IIMFHDRsfnNS01neEhSgwCJ" "sessionstorage:H3PfKEo0hZmMgAiR33qJyfk4pVkjkcOK" "sessionstorage:H3PiXecEu_KA8hCOPjnmyoo9Kw77Grer" );
Empty set (0.000 sec)

MariaDB [etherpad]> SELECT store.key FROM store WHERE store.key = "sessionstorage:H3PYMvtn1IIMFHDRsfnNS01neEhSgwCJ"  ;
+-------------------------------------------------+
| key                                             |
+-------------------------------------------------+
| sessionstorage:H3PYMvtn1IIMFHDRsfnNS01neEhSgwCJ |
+-------------------------------------------------+
1 row in set (0.001 sec)

#27

Mis à jour par François Poulain il y a environ 3 ans

Arf, il faut une virgule dans la syntaxe.

Donc la commande qui fonctionne :

for file in * ; do mariadb etherpad -e "DELETE FROM store WHERE store.key in ( $(cat $file | sed -e 's/^/"/' -e 's/$/"/' | tr '\n' ' ' | sed -e 's/" "/","/g') );" ; done

#28

Mis à jour par François Poulain il y a environ 3 ans

Victoire :

MariaDB [etherpad]> select count(value) from store where store.key like 'sessionstorage:%'  ;
+--------------+
| count(value) |
+--------------+
|        36462 |
+--------------+
1 row in set (0.120 sec)

#29

Mis à jour par François Poulain il y a environ 3 ans

À l'issue de ça le dump de la db, gzipé, fait encore 571M.

#30

Mis à jour par François Poulain il y a environ 3 ans

Bon : ce qu'on a gagné est rikiki :

(April) root@pad:~/20200129_sessionstorage# ls -lh /var/backups/mysql/
total 237M
-rw-r--r-- 1 root root 237M mars   6 05:43 etherpad.sql.bz2
-rw-r--r-- 1 root root  97K mars   6 05:43 mysql.sql.bz2
(April) root@pad:~/20200129_sessionstorage# /etc/rrsync.d/dump-mysql 
(April) root@pad:~/20200129_sessionstorage# ls -lh /var/backups/mysql/
total 210M
-rw-r--r-- 1 root root 210M mars   6 19:54 etherpad.sql.bz2
-rw-r--r-- 1 root root  97K mars   6 19:54 mysql.sql.bz2

#31

Mis à jour par Christian P. Momon il y a environ 3 ans

Belle différence quand même :

Clés sessionstorage Lignes Taille (octets)
Avant 1 135 045 98 751 237
Après 36 544 3 325 577

Bravo \o/

#32

Mis à jour par Quentin Gibeaux il y a environ 3 ans

  • Version cible changé de Mars 2021 à Avril 2021
#33

Mis à jour par Quentin Gibeaux il y a presque 3 ans

migration vers pgsql ?

#34

Mis à jour par Quentin Gibeaux il y a presque 3 ans

todo: migration vieux pad confinement

#35

Mis à jour par Quentin Gibeaux il y a presque 3 ans

  • Version cible changé de Avril 2021 à Mai 2021
#36

Mis à jour par Quentin Gibeaux il y a presque 3 ans

  • Version cible changé de Mai 2021 à Juin 2021
#37

Mis à jour par Quentin Gibeaux il y a presque 3 ans

  • Version cible changé de Juin 2021 à Été 2021
#38

Mis à jour par Quentin Gibeaux il y a plus de 2 ans

  • Version cible changé de Été 2021 à Septembre 2021
#39

Mis à jour par Quentin Gibeaux il y a plus de 2 ans

  • Version cible changé de Septembre 2021 à Été 2021
#40

Mis à jour par Quentin Gibeaux il y a plus de 2 ans

  • Statut changé de En cours de traitement à Fermé

todo déplacé dans un autre ticket

Formats disponibles : Atom PDF