Statistisk veiledning

Statistisk analyse er et viktig redskap i medisinsk forskning. Det brukes til å systematisere informasjon og gi beslutningsstøtte basert på datasett. Eller sagt med andre ord, fortelle historien som ligger skjult i dataene.

Fingre på tastatur.

Illustrasjonsfoto. Colourbox.com.

Kunnskap om og forståelse for dataanalyse bør være til stede i både planleggingen, gjennomføringen og sluttarbeidet av studien.

​Om seksjon for biostatistikk

Seksjon for biostatistikk ligger under Forskningsavdelingen og er en del av forskningsstøtten som tilbys ved SUS. Vår veiledningstjeneste i statistikk og metode er tilgjengelig for alle som driver forskningsarbeid ved SUS. Hovedregel for henvendelser om statistisk rådgivning er å sende en kort prosjektbeskrivelse samt beskrivelse av hva det søkes veiledning om. Alternativt har vi drop-in veiledning (Statistisk poliklinikk) mandager fra 13 til 15 (annonseres på Pulsen). Hjelp til selvhjelp er generelt et viktig mål, slik at forskerne selv lærer de metodene som brukes.

I samarbeid med Universitetet i Stavanger tilbyr vi to kurs i medisinsk statistikk: innføringskurset TN907 (blant annet beskrivende statistikk, tester, variansanalyse, lineærregresjon) og videregåendekurset TN908 (logistisk regresjon, overlevelsesanalyse, mixed models).

Helse Vest har også et regionalt kompetansesenter lokalisert ved Haukeland universitetssjukehus som tilbyr rådgivning i forsøksplanlegging, datainnsamling, databearbeiding og statistisk analyse. Tilbudet gjelder alle forskere i helseforetak i Helse Vest, men forskere i Helse Stavanger kan fortrinnsvis kontakte oss.

Seksjon for biostatistikk har kontorer i Forskertua, 2. etasje i Jan Johnsens gate 4 (gamle Maurtua barnehage). 

Generelle henvendelser vedrørende kurs og veiledning kan sendes til seksjonsleder Ingvild Dalen.

Det finnes en mengde litteratur, programvarer og nettsider som er gode hjelpemidler til å utføre statistisk analyse av medisinske data. Under følger en oversikt over statistikkressurser anbefalt av Seksjon for biostatistikk.

Statistikkressurser

Statistisk litteratur

Et stort utvalg lesestoff relatert til statistikk er tilgjengelig på markedet. Flere fagbøker egner seg som introduksjon til faget og som fordypning i enkelte emner. I tillegg byr markedet på guider og lærebøker for programvare for statistisk analyse. 

Generell medisinsk statistikk  og epidemiologi

  • Odd O. Aalen (red). Statistiske metoder i medisin og helsefag, 2. utgave. Gyldendal akademisk, 2018.

  • Marit B. Veierød, Stian Lydersen, Petter Laake (eds). Medical Statistics in Clinical and Epidemiological Research. Gyldendal akademisk, 2012.
  • Douglas G. Altman. Practical statistics for medical research. Chapman & Hall, 1991.
  • Per Magnus, Leiv S. Bakketeig. Epidemiologi, 4. utgave. Gyldendal akademisk, 2013. 

Fordypning i statistikkprogrammer

  • Julie Pallant. SPSS Survival Manual: A Step by Step Guide to Data Analysis using IBM SPSS. 7th edition. Open University Press, 2020.
  • Andy Field. Discovering Statistics Using IBM SPSS Statistics, 6th edition. SAGE Publications Ltd, 2024.
  • Alan C. Acock. A Gentle Introduction to Stata. 6th edition. Stata Press, 2023.
  • Andy Field, Jeremy Miles, Zoë Field. Discovering Statistics Using R. SAGE Publications Ltd, 2012.
  • Ewen Harrison, Riinu Pius. R for Health Data Science. CRC Press, 2021.
  • Babak Shahbaba, Biostatistics with R: An Introduction to Statistics Through Biological Data. Springer, 2012.
  • Edward Curry, Introduction to Bioinformatics with R: A Practical Guide for Biologists, 1st edition. Chapman and Hall/CRC, 2020. 

Programvare

Helse Vest har lisens på flere typer programvare for lagring og bearbeiding av innsamlede data. Hvilke programmer som bør benyttes vil til dels være avhengig av personlig preferanse og av studiens karakter. Biostatistikerne ved SUS har utstrakt erfaring med programmene SPSS, STATA og R, samt kjennskap til SAS, MatLab og Python.

SPS​​​S

IBM SPSS Statistics programpakken er brukervennlig og har god kvalitet med egnede manualer. Ved å kontakte Helse Vest IKT brukerstøtte gis det tilgang til alle programmene i statistikkpakken SPSS uten ekstra kostnad. Kurskatalogen til Helse Vest tilbyr et introduksjonskurs i SPSS. SPSS har et intuitivt grensesnitt med pek-og-klikk funksjoner og hurtigmenyer med kommandoene man ønsker å utføre. I tillegg er det mulig å få kommandoene i programmet som såkalt syntax, slik at de kan lagres og gjentas senere.

Ekstrapakker med utvidede funksjoner kan lastes inn til SPSS. For eksempel kan pakken Stats Power brukes til å finne nødvendig utvalgsstørrelse og teststyrke. AMOS er en annen tilleggspakke, som er velegnet til arbeid med strukturelle likningsmodeller, herunder konfirmerende faktoranalyse.

https://www.ibm.com/products/spss-statistics

STA​​​​TA

STATA – Data Analysis and Statistical Software er et veldokumentert program som har egen syntax for kommandoer og som i tillegg har noen pek-og-klikk funksjoner. Syntaxen til STATA er mer brukervennlig og effektiv sammenlignet med andre statistikkprogrammer. Programmet byr på flere muligheter enn SPSS og åpner opp for mer avansert statistikk; bl.a. har STATA muligheter for robuste metoder, inkl. robuste regresjonsmodeller og robuste standardfeil. Man kan også installere brukerutviklede programtillegg. Helse Vest tilbyr STATA i sin programvareportefølje med et begrenset antall lisenser. Lisensene kan utvides ved behov. Send mail til kkf@helse-vest.no for å søke om tilgang til STATA.

http://www.stata.com/ 

R og RStu​​​dio

R er et gratis, åpen kildekode-, kommandolinjeprogram som har et omfattende utvalg pakker med metoder for å visualisere og analysere ulike typer datasett. I likhet med STATA byr den på flere muligheter enn SPSS og egner seg derfor til mer avansert statistikk. Særlig nye statistiske metoder er tidlig tilgjengelig til R. Ulike brukerutviklede programpakker må lastes ned og installeres lokalt. Generelt er R basert på å skrive kommandoer og har dermed en brattere læringskurve enn SPSS.
RStudio kjører R i et mer brukervennlig oppsett.
 
For bioinformatikk, og for dataanalyse av genomiske data, transkriptomikk, proteomikk og andre større datasett, finnes det mange etablerte programpakker med gode tutorials innenfor Bioconductor og CRAN.
 

Ma​tLab

MatLab brukes som regel til (ikke-statistisk) matematikk, og har gode funksjoner for matriseregning. I tillegg er MATLAB et bra alternativ for bildebehandling. Programmet er tilgjengelig i programvareporteføljen for ansatte ved Stavanger Universitetssjukehus, men det krever en lisens som må kjøpes for hver enkelt bruker. I tillegg må flere av tilgjengelige pakker kjøpes utenom.

Pyth​on

Python er et gratis programmeringsspråk. På SUS er det tilgjengelig sammen med Anaconda som forenkler programmeringen (tilsvarende Rstudio for R). Python er ikke et statistikkprogram, men brukes til tyngre analyser i for eksempel genetiske analyser, kunstig intelligens, bildeanalyse, eller til å lage egne programmer eller apper. Flere moduler/biblioteker med programvare er tilgjengelig for spesifikke bruksområder. Programmet er gratis men krever programmeringskunnskap. Mange gode dataanalysepakker for eksempel Bioconda tilgjengelig.

Andre progr​​ammer

Det finnes flere andre programmer egnet til statistiske analyser enn de nevnt ovenfor. Statistica er lett å bruke og har visuelt flotte grafer. EpiData er en gratis tilgjengelig database fra WHO over folkehelse, epidemiologi og medisin fra hele verden som kan brukes til kliniske og epidemiologiske studier. EPI Info er laget for å utforme spørreskjema, lage databaser og utføre enkel statistisk analyse tilpasset epidemiologiske studier. S-Plus har et liknende programmeringsspråk som R, men har ikke en åpen kildekode og er ikke tilgjengelig i programvareporteføljen til Helse Vest.
 
Enkelte programmer er kun tilgjengelige ved Helse Bergen, deriblant SAS, Maple, MedCalc, SigmaPlot, Graphpad Prism og StatXact. Ved Helse Stavanger er det mulig å søke om tilgang til disse programmene via Helse Stavanger IKT. SAS, Maple, MedCalc og StatXact er veldokumenterte programmer for å utføre statistikk. SAS er et kommandolinjeprogram med en bratt læringskurve, men er velegnet for avansert statistikk og er det beste alternative for ekstremt store datasett. Maple kan også utføre mer avansert statistikk og er best på symbolsk algebra. MedCalc er designet for biomedisinsk forskning og er svært brukervennlig. Det er regnet for å være det enkleste programmet til å utføre ROC (Receiver Operating Characteristics) analyser. StatXact har etablert en nisje ved å tilby mange eksakte tester og metoder med svært effektive beregningsmåter. For å produsere figurer og grafer kan man ta i bruk Sigmaplot (for Windows) eller Graphpad Prism.
 

 

Hvilket pr​​ogram bør jeg velge?

For å bestemme hvilket statistikkprogram som er aktuelt for en studie, bør man ta i betraktning alle egenskapene til programmet. Nedenfor er det en tabell over fordelene og ulempene til hvert enkelt statistikkprogram (slik vi ser det). 
Oversikt over statistikkprogrammer
​Program ​ ​Fordeler ​Ulemper Tilgjengelighet
​SPSS ​Lett å læ​re og lett å bearbeide datasett ​Få robuste metoder. Begrenset fleksibilitet og kvalitet i grafiske fremstillinger. Begrenset utvalg av mer avanserte metoder.  ​Helse Vest​
​STATA ​Robuste metoder, brukervennlig ​ ​ ​Helse Vest
​R ​Åpen kildekode. Nesten ubegrenset antall tilgjengelige statistiske analyser. Gratis. Gode programmer for analyse av gen- og genekspresjonsdata og andre store datasett.  ​Bratt læringskurve. Varierende kvalitet på dokumentasjon. Problematisk med veldig store datasett.​ ​Helse Vest
​MatLab ​Matriseregning, matematikk, bildebehandling, maskinlæring. ​Dårlig på generell statistikk. Dyrt​.  ​Helse Bergen og Helse Stavanger. Lisenser må tilegnes for hver enkelt bruker​.
​Python ​Kunstig intelligens, lage egne små programmer eller apper, god til veldig store datasett, "Data Science". ​Bratt læringskurve. Litt færre statistikkprogrampakker enn R. ​Helse Vest
​Statistica ​Flotte grafer, lett å bruke  ​Relativt dyrt​  ​Helse Vest​

​​Oversikt over hvilke analyser som er tilgjengelige i SPSS, STATA, R, MatLab og SAS: http://www.stanfordphd.com/Statistical_Software.html

Ressurser​ på web

Flere nettsider ​inneholder relevant litteratur og guider til enkelte statistikkprogrammer, eller har verktøy som er nyttig når en utfører statistikk.

Artikkelserier, medisinsk statistikk

  1. JAMA Guide to Statistics and Methods
  2. Medical statistics (biomedcentral.com)
  3. Statistical notes in BMJ

Hjelpemidler for statistiske programmer

  • OARC Stats – Statistical Consulting Web Resources (ucla.edu) Veldig nyttige nettsider med opplæring og eksempler i flere statistikkprogrammer, inkl. SPSS, STATA, R og SAS.
  • CrossValidated. ​StackExchange har en egen avdeling, CrossValidated, hvor brukere kan legge ut spørsmål om statistikk og bruk av statistikkprogrammer. http://stats.stackexchange.com/
  • SPSS Tutorials.SPSS Tutorials er en oversiktlig nettside for å komme i gang med SPSS, eller for å lære mer om enkelte metoder innenfor programmet.
    http://www.spss-tutorials.com
  • Quick-R.​Et godt hjelpemiddel når en arbeider med R er Quick-R. Nettsiden går gjennom enkelte analyser steg-for-steg, og har en søkefunksjon for å finne metoden man er interessert i. http://www.statmethods.net/

Andre statistiske verktøy

  • En nettside med funksjoner for statistiske utregninger. Nettsiden inneholder ulike kalkulatorer og verktøy for tester, konfidensintervall og annet. http://vassarstats.net/
  • StatPages. En samleside for en rekke nyttige programmer til statistisk analyse som kan lastes ned gratis eller kjøres via nett. En finner f.eks. programmer for beregning av styrke og utvalgsstørrelse for en rekke standard hypoteser. ​http://statpages.org/
  • Gratis programvare for ulike beregninger innenfor epidemiologisk statistikk. https://www.openepi.com


Innsamling og lagringsløsninger for forskningsdata​

Kontakt

Biostatistikere:
Ingvild Dalen, PhD (fagsjef)
E-post: ingvild.dalen@sus.no

Anastasia Ushakova, PhD
Epost: anastasia.ushakova@sus.no

Hanne Brit Hetland, MSc
E-post: hanne.brit.hetland@sus.no

Jan Terje Kvaløy, PhD
E-post: jan.t.kvaloy@uis.no

Bjørn Henrik Auestad, PhD
E-post: bjorn.auestad@uis.no  

Bioinformatiker:
Marie Austdal, PhD
E-post: marie.austdal@sus.no    


 

Sist oppdatert 27.04.2023