dictionnaires pour recoder du texte en variables fermées
Posté : lun. févr. 25, 2019 9:55 am
Bonjour
J'utilise des dictionnaires pour regrouper des items et ainsi transformer des variables textuelles en variables fermées. Au fil des études, je suis amené à enrichir ces dictionnaires, et je me rends compte qu'à partir d'un certain moment, je ne peux plus ajouter de nouvelles données dans ceux-ci. J'ai beau déclarer que XXX=YYY=ZZZ,.... la dernière valeur ajoutée (ici par exemple ZZZ) est ignorée lors du recodage. Existe-t-il des limites de taille aux dictionnaires, et est-il possible de les modifier ?
En complément de cette première question, je souhaiterait savoir comment les mots de chaque item sont pris en compte lors du recodage. Par exemple, j'ai défini 2 catégories de regroupement pour obtenir la variable fermée, une catégorie FEDERATION et une catégorie ORGANISME DE FORMATION.
Si je déclare d'une part que FEDERATION=fédération départementale=..., d'autre part que ORGANISME DE FORMATION=fédération départementale des organismes de formation=..., lors du recodage, "fédération départementale des organismes de formation" appartient aux 2 catégories. Y-a-t-il un moyen de contourner cet obstacle ? Je constate que l'utilisation des underscore ne permet pas d’améliorer la situation, au contraire, les items sont alors carrément ignorés
Merci pour votre aide
J'utilise des dictionnaires pour regrouper des items et ainsi transformer des variables textuelles en variables fermées. Au fil des études, je suis amené à enrichir ces dictionnaires, et je me rends compte qu'à partir d'un certain moment, je ne peux plus ajouter de nouvelles données dans ceux-ci. J'ai beau déclarer que XXX=YYY=ZZZ,.... la dernière valeur ajoutée (ici par exemple ZZZ) est ignorée lors du recodage. Existe-t-il des limites de taille aux dictionnaires, et est-il possible de les modifier ?
En complément de cette première question, je souhaiterait savoir comment les mots de chaque item sont pris en compte lors du recodage. Par exemple, j'ai défini 2 catégories de regroupement pour obtenir la variable fermée, une catégorie FEDERATION et une catégorie ORGANISME DE FORMATION.
Si je déclare d'une part que FEDERATION=fédération départementale=..., d'autre part que ORGANISME DE FORMATION=fédération départementale des organismes de formation=..., lors du recodage, "fédération départementale des organismes de formation" appartient aux 2 catégories. Y-a-t-il un moyen de contourner cet obstacle ? Je constate que l'utilisation des underscore ne permet pas d’améliorer la situation, au contraire, les items sont alors carrément ignorés
Merci pour votre aide