You are here

Merging area-level census data with survey data in Statistics Canada Research Data Centres

TitleMerging area-level census data with survey data in Statistics Canada Research Data Centres
Year of Publication2006
AuthorsGonthier, D., Hotton T., Cook C., and Wilkins R.
Series TitleThe Research Data Centres Information and Technical Bulletin
Document Number1
Pages21 - 39
Date PublishedJuly
InstitutionStatistics Canada
Keywordsacquisition des données, administrative data, appariement des dossiers, census metropolitan areas, data capture, données administratives, enumeration areas, plan d'enquête, record linkage, régions métropolitaines de recensement, secteurs de dénombrement, survey design
Abstract

This article explains how to append census area-level summary data to survey or administrative data. It uses examples from datasets present in Statistics Canada Research Data Centres, but the methods also apply to external datasets. Four examples illustrate common situations faced by researchers: (1) when the survey (or administrative) and census data both contain the same level of geographic identifiers, coded to the same year standard ("vintage") of census geography; (2) when the two files contain geographic identifiers of the same vintage, but at different levels of census geography; (3) when the two files contain data coded to different vintages of census geography; (4) when the survey data are lacking in geographic identifiers, and those identifiers must first be generated from postal codes present on the file. The examples are shown using SAS syntax, but the principles apply to other programming languages or statistical packages. /// Dans cet article, nous expliquons comment joindre les données sommaires du recensement par région à des données d'enquête ou à des données administratives. Nous citons des exemples d'ensembles de données présents dans les Centres de données de recherche de Statistique Canada, mais les méthodes valent aussi pour des ensembles extérieurs. Par quatre exemples, nous illustrons des situations où se trouvent fréquemment les chercheurs: (1) cas où les données d'enquête (ou les données administratives) et les données du recensement contiennent des identificateurs géographiques qui se situent au même niveau et sont codés pour la même année de référence du découpage géographique aux fins du recensement; (2) cas où les deux fichiers contiennent des identificateurs géographiques pour la même année de référence, mais pour des niveaux différents de découpage géographique du recensement; (3) cas où les deux fichiers contiennent des données codées pour des années de référence différentes; (4) cas où les données d'enquête n'ont pas d'identificateurs géographiques, ceux ci devant d'abord être produits à partir des codes postaux du fichier d'enquête. Ces exemples sont présentés en syntaxe SAS, mais les principes s'appliquent à d'autres langages de programmation ou progiciels statistiques.

URLhttp://www.statcan.gc.ca/bsolc/olc-cel/olc-cel?catno=12-002-x20060019254&lang=eng
Document URLhttp://www.statcan.gc.ca/pub/12-002-x/12-002-x2006001-eng.pdf
Publication Type
RDC
Themes
Publication language(s)
English