Commit f85fed04 authored by Grégoire Métral's avatar Grégoire Métral
Browse files

Suppression des fichiers de corrections détaillées

parent 3eaf8905
Corrections apportées à VLV1 (voir documentation, section "Variables construites et corrections")
=================================================================================================
1) recodé les lieux d'habitation (enfants, réseau social):
P-xxxx (codes pour pays, régions, continents): transformé en 8xxx (4 chiffres, de 8001 à 8619)
et défini la variable comme numérique (largeur 4)
2) ajouté toutes les nationalités non documentées pour les questions sur les nationalités (ego, mère, père, enfants, conjoint, précédent partenaire...)
corrections supplémentaires:
8238 -> ajouté (Tchécoslovaquie)
9998 -> ajouté (Apatride)
8256 -> ajouté (Kosovo, item de réponse donné)
8248 -> ajouté (Serbie, item de réponse donné)
8220 -> 8249 (Yougoslavie)
8577 -> 8244 (République tchèque, pour "qa_a4 - nationalité actuelle")
3) correction des codes sauvages:
ego 113155, variable qf_v4b, valeur 16498 -> -3
4) Réseau social: les sexes étaient définis par 0 = Homme, 1 = Femme alors que partout ailleurs nous avons 1 = Femme, 2 = Homme. Les données ne comportaient pas de 0, mais des 2. J'ai donc corrigé 0 -> 2 (Homme).
5) recodé les variables qa_b5 et qa_b10 pour intégrer dans la même variable le code de la commune si on est en Suisse (et donc supprimé les variables qa_b5b et qa_b10b)
6) repris et corrigé toute la codification de la variable qa_b10 en prenant les codes OFS plutôt que les codes postaux...
7) éliminé les quelques (rares) données dans les variables qa_b12 -> qa_b14 lorsque qa_b11 = 1, après vérification de la cohérence dans le fichier original (passées en -7)
8) section C: traité les incohérences en mettant -3 (NV) pour les questions où EGO n'a pas d'enfants, mais a des petits-enfants et arrière-petits-enfants (on pourra retrouver le code d'EGO dans ces cas)
9) corrigé qa_d1 pour 4 personnes (221132, 611186, 621044 et 723115), en fonction de la réponse à la question qa_d2
10) beaucoup d'incohérences dans les questions filtres de la section E:
filtre E1 "EMS" pas respecté – j'ai corrigé en mettant des INAP pour toutes les questions suivantes (jusqu'à E8)
11) variable qf_d2 (nb d'enfants): pas de valeur 2, mais beaucoup de valeurs 0; recodé tous les 0 en 2 si qa_c2 = 2
12) corrigé les 2 variables qa_c2 et af_d2 pour rendre la cohérence (souvent grâce au calendrier de vie); non corrigé: #121038 (pas d'enfants, mais considère enfant de sa compagne comme son fils)
13) ego #122157 (ligne 393): beaucoup de questions manquantes car remplies sur questionnaire II manuel; repris quelques-unes selon le questionnaire II manuel et recodé les réponses
14) corrigé les grands amours incohérents:
qf_w1: -2 -> 4 pour tous ceux qui ont des données dans les colonnes suivantes
code_ego 224031: correspondrait à une personne entre le partenaire précédent et actuellement (probablement pas signalé parce que pas vécu en couple); corrigé qf_w1 en 4 (autre)
code_ego 716036: correspond manifestement au partenaire précédent -> enlevé les données après qf_w1
code_ego 716216: idem
15) incohérences dans les questions qf_z8 et qf_z9: 1 personne n'ayant pas été hospotalisée au cours de la dernière année a été hospitalisée 10 fois; trois personnes ayant été hospitalisées au cours de la dernière année l'ont été 0 fois; pas corrigé
16) variables qf_aa3_* et qf_aa4_*: corrigé en -3 (NV) toutes les réponses hors de l'échelle
17) code_ego 722063: n'a pas réussi l'exercice qf_ab3, mais a pourtant mis 22 secondes (qf_ab4); corrigé qf_ab4 en -7; idem avec code_ego 612143 et 723056, qui n'ont pas réussi l'exercice qf_ab6 mais ont mis 135 secondes à qf_ab7, et code_ego 723071, qui n'a pas réussi le même exercice qf_ab6 mais a mis 140 secondes (corrigés en -7 pour qf_ab7)
18) question AU1: recodé tous les cantons (+1) pour qu'il n'y ait pas de 0 (Genève = 1, Valais = 2, etc.); il y avait quelques différences avec la variable "canton" qui se trouve au début du fichier: corrigé les variables qf_au1 des code_ego 525001 et 525003 (canton Bâle -> Berne), et 615105 et 625051 (canton Berne -> Bâle); pour les absences de réponses à la question qf_au1 (valeur -2); adapté aussi les autres questions qui avaient été filtrées
19) corrigé quelques codes sauvages: code_ego 713114 (TI) répond à des question de GE; 621177 et 623035 (BS/BL) répondent à des questions de plusieurs autres cantons
20) question qa_a8 (plus haut niveau de formation): corrigé 2 codes "autres" en "secondaire supérieur"; dans les 2 cas (721075 et 726045, il s'agit de Tessinois/es ayant fait la "Verkehrsschule St Gallen" (fermée en 2001, l'école semblait préparer aux métiers des entreprises de transport); l'un a écrit le label en face de secondaire supérieur
21) question qa_b15: 8 personnes avaient répondu entre 2 cases, ce qui avait été codé en décimal (2.5, 3.5 etc.). Arrondi toutes les valeurs à l'entier supérieur. Rappel des valeurs originales:
114050: 4.5
221115: 1.5
224119: 3.5
425025: 2.5
524025: 2.5
625073: 3.5
714211: 3.5
725102: 3.5
Corrections données proxy
=========================
0) remarque: les noms des variables ne suivent pas la numérotation du questionnaire proxy, mais reprennent les noms des variables correspondantes dans les questionnaires QAA et QFF; l'ordre est celui du questionnaire proxy
1) renommé les variables (orthographe ou pour se conformer au jeu de données QAA+QFF)
qa_a2b -> qa_a4
qa_a5_autre_txt -> qa_a6
qa_e2_autre_txt -> qa_e2
qa_e8_autre_txt -> qa_e8
qa_i9_aute_txt -> qa_i9_autre_txt
qa_aq7_* -> qf_aq7_*
2) qp_a9_autre et qp_a10_autre: supprimé tous les libellés pour lesquels une valeur pas "Autre" existait à la question précédente (il s'agissait généralement de précisions sur le métier); code adopté: -3 (NV)
3) qp_a11: le proxy de 616030 a répondu "150%"; corrigé en 100%
4) codifié les nationalités du champ "autre" et supprimé la variable
5) éliminé les textes de qa_a8_autre_txt lorsque c'était des précisions (p. ex. apprentissage -> "typographe"), redondant (p. ex. NSP -> "La proxy ne sait pas"), ou que cela pouvait être codé (p. ex. "Université en partie" -> secondaire supérieur)
6) recodé la question qa_m1 (l'échelle utilisée a dû partir de 1 plutôt que de 0 comme indiqué)
7) codé toutes les réponses de qa_m2 en fonction des codes utilisés pour le jeu de données QFF/QFF
8) recodé la question qa_c1 (il y avait 2=non plutôt que 0=non comme indiqué)
9) codé (ou éliminé si redondant) les indications dans qa_e2_autre_txt
10) pour code_ego 616226, corrigé qa_e5 1 -> -7 (car habite en EMS)
11) qa_e7*: beaucoup d'incohérences; corrigé 1 -> -3 pour qa_e7b si ego vit avec 1 seule personne et que qa_e7 = 1; corrigé 1 -> -4 pour qa_e7b si ego vit avec 2 personnes et que qa_e7 = 1 (on suppose qu'il n'y a pas de partenaires multiples); par ailleurs, certains ego ne donnent pas le nombre de personnes vivant dans le même logement, mais donnent des identités à qa_e7* (pas corrigé); enfin, certains ego disnt habiter avec 1 seule autre personne, mais donnent plusieurs réponses différentes en qa_e7* (pas corrigé)
12) qa_e9: pas de correction (on aurait pu mettre un filtre si qa_e5 = 1)
13) qf_x1_autre et qf_x3_autre: enlevé les libellés si qf_x1 était renseigné (en général, il s'agit de précisions sur l'emploi); dans de rares cas, renseigné qf_x1 avec le texte si qf_x1 = -2
14) qf_x2 et qf_x4: corrigé en -7 pour toutes les personnes non actives (quelques cas employés à 0% ou à 100%)
15) qa_i8_autre: corrigé deux réponses "Non" en "Oui, un peu" lorsque la maldie était mentionnée en qa_i9_autre_txt
16) qa_j2: 3 personnes ont indiqué un autre service, mais sans en indiquer la fréquence dans la variable qa_j1_autre; corrigé le texte de qa_j2 en -3 (NV)
17) qf_at8_sport1: une personne a indiqué "Exercices pour les jambes" sans préciser la fréquence dans la variable qf_at7: corrigé le libellé en -3 (NV); corrigé aussi d'autres libellés non sportifs (physiothérapie, Keine, jardinage, Früher Velofahren) en -3; une personne ne donne pas la fréquence en qf_at7 mais donne 2 sports (golf et natation): pas corrigé
18) le fichier regroupait également 30 variables construites ou recodées qui n'ont pas été conservées dans le fichier final
This diff is collapsed.
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment