Commit 4821e27f authored by Grégoire Métral's avatar Grégoire Métral
Browse files

Suite des corrections et nettoyages

parent 9e464faa
......@@ -30,11 +30,12 @@ et défini la variable comme numérique (largeur 4)
code_ego 224031: correspondrait à une personne entre le partenaire précédent et actuellement (probablement pas signalé parce que pas vécu en couple); corrigé qf_w1 en 4 (autre)
code_ego 716036: correspond manifestement au partenaire précédent -> enlevé les données après qf_w1
code_ego 716216: idem
15) code_ego 722063: n'a pas réussi l'exercice qf_ab3, mais a pourtant mis 22 secondes (qf_ab4); corrigé qf_ab4 en -7; idem avec code_ego 612143 et 723056, qui n'ont pas réussi l'exercice qf_ab6 mais ont mis 135 secondes à qf_ab7, et code_ego 723071, qui n'a pas réussi le même exercice qf_ab6 mais a mis 140 secondes (corrigés en -7 pour qf_ab7)
16) question AU1: recodé tous les cantons (+1) pour qu'il n'y ait pas de 0 (Genève = 1, Valais = 2, etc.); il y avait quelques différences avec la variable "canton" qui se trouve au début du fichier: corrigé les variables qf_au1 des code_ego 525001 et 525003 (canton Bâle -> Berne), et 615105 et 625051 (canton Berne -> Bâle); pour les absences de réponses à la question qf_au1 (valeur -2); adapté aussi les autres questions qui avaient été filtrées
17) corrigé quelques codes sauvages: code_ego 713114 (TI) répond à des question de GE; 621177 et 623035 (BS/BL) répondent à des questions de plusieurs autres cantons
18) question qa_a8 (plus haut niveau de formation): corrigé 2 codes "autres" en "secondaire supérieur"; dans les 2 cas (721075 et 726045, il s'agit de Tessinois/es ayant fait la "Verkehrsschule St Gallen" (fermée en 2001, l'école semblait préparer aux métiers des entreprises de transport); l'un a écrit le label en face de secondaire supérieur
19) question qa_b15: 8 personnes avaient répondu entre 2 cases, ce qui avait été codé en décimal (2.5, 3.5 etc.). Arrondi toutes les valeurs à l'entier supérieur. Rappel des valeurs originales:
15) incohérences dans les questions qf_z8 et qf_z9: 1 personne n'ayant pas été hospotalisée au cours de la dernière année a été hospitalisée 10 fois; trois personnes ayant été hospitalisées au cours de la dernière année l'ont été 0 fois; pas corrigé
16) code_ego 722063: n'a pas réussi l'exercice qf_ab3, mais a pourtant mis 22 secondes (qf_ab4); corrigé qf_ab4 en -7; idem avec code_ego 612143 et 723056, qui n'ont pas réussi l'exercice qf_ab6 mais ont mis 135 secondes à qf_ab7, et code_ego 723071, qui n'a pas réussi le même exercice qf_ab6 mais a mis 140 secondes (corrigés en -7 pour qf_ab7)
17) question AU1: recodé tous les cantons (+1) pour qu'il n'y ait pas de 0 (Genève = 1, Valais = 2, etc.); il y avait quelques différences avec la variable "canton" qui se trouve au début du fichier: corrigé les variables qf_au1 des code_ego 525001 et 525003 (canton Bâle -> Berne), et 615105 et 625051 (canton Berne -> Bâle); pour les absences de réponses à la question qf_au1 (valeur -2); adapté aussi les autres questions qui avaient été filtrées
18) corrigé quelques codes sauvages: code_ego 713114 (TI) répond à des question de GE; 621177 et 623035 (BS/BL) répondent à des questions de plusieurs autres cantons
19) question qa_a8 (plus haut niveau de formation): corrigé 2 codes "autres" en "secondaire supérieur"; dans les 2 cas (721075 et 726045, il s'agit de Tessinois/es ayant fait la "Verkehrsschule St Gallen" (fermée en 2001, l'école semblait préparer aux métiers des entreprises de transport); l'un a écrit le label en face de secondaire supérieur
20) question qa_b15: 8 personnes avaient répondu entre 2 cases, ce qui avait été codé en décimal (2.5, 3.5 etc.). Arrondi toutes les valeurs à l'entier supérieur. Rappel des valeurs originales:
114050: 4.5
221115: 1.5
224119: 3.5
......@@ -52,4 +53,15 @@ Corrections données proxy
2) qp_a11: le proxy de 616030 a répondu "150%"; corrigé en 100%
3) codifié les nationalités du champ "autre" et supprimé la variable
4) renommé la variable qa_a5_autre_txt en qa_a6 pour se conformer au jeu de données QAA+QFF
5) éliminé les textes de qa_a8_autre_txt lorsque c'était des précisions (p. ex. apprentissage -> "typographe"), redondant (p. ex. NSP -> "La proxy ne sait pas"), ou que cela pouvait être codé (p. ex. "Université en partie" -> secondaire supérieur)
6) recodé la question qa_m1 (l'échelle utilisée a dû partir de 1 plutôt que de 0 comme indiqué)
7) codé toutes les réponses de qa_m2 en fonction des codes utilisés pour le jeu de données QFF/QFF
8) recodé la question qa_c1 (il y avait 2=non plutôt que 0=non comme indiqué)
9) codé (ou éliminé si redondant) les indications dans qa_e2_autre_txt
10) pour code_ego 616226, corrigé qa_e5 1 -> -7 (car habite en EMS)
11) qa_e7*: beaucoup d'incohérences; corrigé 1 -> -3 pour qa_e7b si ego vit avec 1 seule personne et que qa_e7 = 1; corrigé 1 -> -4 pour qa_e7b si ego vit avec 2 personnes et que qa_e7 = 1 (on suppose qu'il n'y a pas de partenaires multiples); par ailleurs, certains ego ne donnent pas le nombre de personnes vivant dans le même logement, mais donnent des identités à qa_e7* (pas corrigé); enfin, certains ego disnt habiter avec 1 seule autre personne, mais donnent plusieurs réponses différentes en qa_e7* (pas corrigé)
12) qa_e9: pas de correction (on aurait pu mettre un filtre si qa_e5 = 1)
13) qf_x1_autre et qf_x3_autre: enlevé les libellés si qf_x1 était renseigné (en général, il s'agit de précisions sur l'emploi); dans de rares cas, renseigné qf_x1 avec le texte si qf_x1 = -2
14) qf_x2 et qf_x4: corrigé en -7 pour toutes les personnes non actives (quelques cas employés à 0% ou à 100%)
15) qa_i8_autre: corrigé deux réponses "Non" en "Oui, un peu" lorsque la maldie était mentionnée en qa_i9_autre_txt
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment