Intresset för statistik har varierat genom tiderna vilket gör att tillgången på statistiska uppgifter varierar en hel del över tid. Det är egentligen inte förrän på 1800-talet som statistiska uppgifter började samlas in systematiskt, då huvudsakligen på uppdrag av staten. Således omfattar majoriteten av det historisk-statistiska källmaterialet som finns tillgängligt 1800-talet och framåt. Man talar ibland om den »förstatistiska« perioden respektive den »institutionaliserade statistiska« perioden, där den senare omfattar just 1800-talet och framåt. Under den förstatistiska perioden samlade man också in data, men inte i samma omfattning och framför allt inte genom systematiska undersökningar. I stället använde man andra tillgängliga sifferuppgifter (dvs sådana som samlats in med andra syften och metoder).

Medicinhistorisk statistik står att finna i såväl statliga som kommunala och privata arkiv. Men problemet är att historisk statistik generellt är mer eller mindre fragmenterad, precis som historiska data i allmänhet, och för att få en så komplett bild som möjligt av det man studerar får man använda de data som finns tillgängliga på bästa sätt. Detta innebär att man ofta får använda en kombination av flera olika datakällor, och kanske även kombinera med litteratur, i sin syntes och presentation av resultatet för att ge en så heltäckande bild som möjligt.

Ett exempel på användbart källmaterial är Statistiska centralbyråns (SCB) databaser. I databaserna kan t ex tabeller och Excel-filer hämtas med data om befolkningsstorlek (inklusive demografi) och dödsorsaker. Även SCB:s historiska publikationer kan vara av intresse. Från de historiska publikationerna kan data extraheras till en databas för att sedan analyseras. Bland SCB:s historiska publikationer finns såväl material med fokus på hälso- och sjukvård [1] som med ett mer allmänstatistiskt fokus [2]. Sådana publikationer får dock ses som litteratur snarare än källor då data redan är bearbetade på olika sätt och sammanställda i bl a tabellformat, men kan ändå ge viss information som kan vara användbar i den statistiska analysen. Denna typ av data finns även sammanställd i andra publikationer [3, 4]. Demografisk statistik finns även att hämta från Folkmängdsdatabasen [5].

Ett annat exempel på användbara källor är pro-vinsialläkarnas årsrapporter, som innehåller mycket information om såväl befolkningens allmänna hälsoläge som nativitet, mortalitet samt sjukdomsprevalens [6].  Dessa finns främst på landsarkiven men även i vissa fall på regionarkiven, medan äldre provinsialläkarrapporter finns på Riksarkivet. I Medicinhistoriska databasen finns olika typer av dokument som har digitaliserats/renskrivits (bl a provinsialläkarrapporter, årsberättelser från lasarett och protokoll från Medicinalstyrelsen) [7]. Dock krävs lite manuellt förarbete innan några statistiska beräkningar kan göras på denna typ av källor, dvs data måste överföras från respektive rapport till databas innan den analyseras. Enklare beräkningar kan självklart göras för hand för en deskriptiv sammanställning, men för mer omfattande beräkningar rekommenderas ett statistikprogram.

Det är dock inte alltid bara rent medicinska data (dvs uppgifter om sjukdom/diagnoser, läkemedel) som är av intresse för en medicinhistoriker, utan även demografi (t ex uppgift om befolkningsstorlek, nativitet, mortalitet) och social och ekonomisk statistik kan ge värdefull information då detta kan ses som ett indirekt mått på folkhälsa.

I historiska sammanhang ställs forskaren inte sällan inför det faktum att källmaterialet som finns tillgängligt är ganska stort. Om alla data finns lagrade i en databas så kan de analyseras antingen i sin helhet eller så kan ett urval enkelt göras, vilket i sig är ganska oproblematiskt. Men så är sällan fallet, och problem uppstår när mycket data finns och när data måste extraheras från olika källor, där kanske data till och med saknas under vissa perioder eller inte är direkt jämförbara av olika orsaker. I dessa fall kan oftast inte ett randomiserat urval göras utan man är i stället hänvisad till någon form av icke-randomiserat urval (t ex kvoturval, konsekutivt urval, bekvämlighetsurval). Detta leder i sin tur till att tolkningen av resultatet måste ske utifrån dessa metodologiska begränsningar.

De statistiska analysmetoderna i historisk forskning är i grunden desamma som vid andra medicins-ka forskningsstudier och används på samma sätt [8]. Man behöver inte begränsa sig till enbart deskriptiv statistik utan även analytisk statistik kan användas om datamaterialet tillåter detta. Den analytiska statistiken av materialet kan handla om såväl hypotestestning som olika former av sambandsanalyser och tidsserieanalyser. Men statistisk analys av historiska källor är inte helt oproblematisk, och det finns flera möjliga felkällor som man måste beakta. Man måste vara källkritisk och noga ta reda på hur data har samlats in och utifrån detta bilda sig en uppfattning om hur väl de kan användas i en rekonstruktion av verkligheten.  I första hand bör rådata användas, där forskaren själv kan göra sina analyser. Men finns inte rådata tillgängliga är man hänvisad till olika statistiska publikationer, vilket begränsar analysmöjligheterna. I dessa publikationer finns ibland uppgifter om hur data samlats in och eventuellt även analyserats, men finns inte detta sjunker användbarheten och validiteten ytterligare.

Då data alltid är insamlade av någon annan än forskaren själv ska man inte ha en övertro till siffrornas exakthet, och slutsatser kring skillnader mellan grupper och över tid kan lätt både under- och överskattas. Vid jämförelse mellan grupper, framför allt mellan olika tidsperioder, måste man säkerställa att data verkligen är jämförbara. Likaså bör förändringar som sker över tid beaktas, dvs hur saker mäts och definieras. Det är nämligen inte ovanligt att samma begrepp betyder olika saker över tid, t ex klassificering och benämningar av olika diagnoser eller gränsvärden för patologiska nivåer i olika prov. Förändring över tid gäller även förteckningar över yrkesverksamma. Som exempel kan tas att i vissa förteckningar registrerades alla yrkesutövare inom ett yrke, men över tid förändrades kraven på vem som skulle registreras och under en period skulle enbart skråanslutna arbetare inkluderades i statistiken. Vid okritiskt användande av statistiken ger detta sken av en yrkeskår i kris då antalet verksamma minskade drastiskt på kort tid. Sådana händelser gör att statistiska jämförelser är svåra att göra. Vid analys av sådan statistik måste data först korrigeras utifrån dessa förändringar innan analyserna görs, och resultatet måste tolkas utifrån dessa förutsättningar.

Precis som i övrig statistisk analys och tolkning måste även eventuella förväxlingsfaktorer identifieras för att erhålla valida resultat. Detta kan vara lite ext-ra svårt då det kräver ganska god kännedom om såväl datamaterialet som om tidsperioden som studeras.   

Historisk statistik kan alltså vara ett mycket bra komplement till de kvalitativa analyserna (som huvudsakligen används i medicinhistorisk forskning), och man bör komma ihåg att det finns större analysmöjligheter än enbart deskriptiv statistik. Med statistikens hjälp kan vi få såväl bättre förståelse av som överblick över det förflutna, men det kräver samtidigt att forskaren har kunskap om såväl dataanalyser och möjliga felkällor för att erhålla valida resultat utifrån datamaterialet.