| | 1 | = BBMRI-NL Catalogue Working Group 2012/04/02 = |
| | 2 | |
| | 3 | Att: Morris Swertz, Willem de Bruijn, Teun Oosterbaan, David van Enckvoort, Gerard van Grootheest, Eric Vermeulen, Annet Sollie |
| | 4 | |
| | 5 | Annet & Teun presenteren use case studie: |
| | 6 | |
| | 7 | * In opdracht van BBMRI-NL stuurgroep |
| | 8 | * Inventarisatie voor Catalogus / Biobank hub |
| | 9 | * 10 interviews: LL, NESDA, VU, etc |
| | 10 | * vandaag werkbespreking |
| | 11 | |
| | 12 | Vragen gesteld: |
| | 13 | * behoefte, belangen, voordelen nationale catalogus |
| | 14 | * wat kan je bieden |
| | 15 | * wat zou je vragen (use cases) |
| | 16 | * eigen initiatieven |
| | 17 | * best practices (weinig resultaten) |
| | 18 | |
| | 19 | == Intro == |
| | 20 | * belang van catalogus vooral voor grote studies (verder dan 1 cohort) |
| | 21 | * sommige heel sceptisch want kost zoveel energie om catalogus te vullen (vaak als zelf groot cohort) |
| | 22 | * knelpunten: |
| | 23 | * niet meer administratieve last (up to date zonder enorm veel energie) |
| | 24 | * daarom ingezoomed op gebruik (use cases) van nationale catalogus (vraagkant) |
| | 25 | |
| | 26 | == Resultaten == |
| | 27 | |
| | 28 | * gematched met de 5 catalogus nivo's |
| | 29 | * type variabelen waarover info nodig is (bijv: ziekte=ALS, risico factor=roken) |
| | 30 | * opvallend: |
| | 31 | * er is een kernset van variabelen die altijd terug komt |
| | 32 | * catalogus van nivo 1 (huidige catalogus) niet bruikbaar |
| | 33 | * met wil al snel geaggregeerde data |
| | 34 | * metadata is al direct nodig |
| | 35 | * 'hoe is de data verzameld?'= protocollen/vragenlijsten, volledigheid, beschikbaarheid samples |
| | 36 | |
| | 37 | == Refinement van nivo's == |
| | 38 | |
| | 39 | Zie sheets: counts over use cases. |
| | 40 | |
| | 41 | * level 1: list_coh = list of cohorts |
| | 42 | * level 2: var_coh = list of cohorts incl variables / metadata |
| | 43 | * level 3: agg_data = list of cohort incl aggr data per variable (e.g. num samples having ALS diagnosis) |
| | 44 | * level 3b: agg_dat_combinable = option to ask combinations (e.g. num samples having [ALS and <21y]) |
| | 45 | * level 4: ind_data = list of individuals incl values per variable |
| | 46 | * level 5: linked_data = all of above incl references (ttp?) to other data sets |
| | 47 | |
| | 48 | == Refinement van variables == |
| | 49 | |
| | 50 | Zie sheets. Geteld per use case. |
| | 51 | |
| | 52 | Bijv: |
| | 53 | * diagnosis (26x) |
| | 54 | * data_birth |
| | 55 | * date of dignosis |
| | 56 | * medication |
| | 57 | * genes measured |
| | 58 | * genotype data (=gwas) |
| | 59 | |
| | 60 | == Conclusion == |
| | 61 | |
| | 62 | Start with level 2/3 at national catalogi |
| | 63 | Start with level 3-5 for local catalogi |
| | 64 | * als BBMRI service? |
| | 65 | * ondersteuning van eigen geaggregeerde tools |
| | 66 | * pseudonimisatie service |
| | 67 | * organisatie |
| | 68 | |
| | 69 | == Discussion == |
| | 70 | |
| | 71 | >Kritiek over nut? |
| | 72 | >>Die scepsis is terecht voor de grote biobanken totdat weer wens is voor integratie. Daarnaast verwachten we dat behoefte gaat groeien zodra catalogus er is. |
| | 73 | |
| | 74 | >Angst meer werk opleveren? |
| | 75 | Onterecht omdat veel van de vragen nu door het systeem beantwoord kunnen worden ipv heel breed alle cohorten aanschrijven. |
| | 76 | |
| | 77 | >Waar komt angst vandaan voor vele werken? |
| | 78 | >>Veel mensen nu in hoofd lijst 1. Die vragen betekenen werk. Als je naar nivo 2 gaat dan ga je data dictionaries uploaden. |
| | 79 | |
| | 80 | >Level 3 vraagt heel erg veel van de organisatie? |
| | 81 | >>Want impliceert dat men intern een level 4 catalogus heeft. Maar in de praktijk hoeft dat niet natuurlijk op alle variabelen, of in complete detail (bijv: alleen geboortejaar). En dan zou het misschien wel kunnen om die centraal te zetten? |
| | 82 | |
| | 83 | >We willen niet dat iedereen erbij kunt |
| | 84 | >> Kun je deels technisch of procedureel afvangen. |
| | 85 | |
| | 86 | >herklassificeren hangt op goed klassen |
| | 87 | >>Bijvoorbeeld ziekte klassen zijn niet altijd goed (soms te fijn, soms te grof). |
| | 88 | |
| | 89 | >kunnen we deze gegevens eigenlijk delen |
| | 90 | >>wat wel altijd kan is: we hebben zoveel patienten, en van iedereen weten we welke diagnosen zijn gesteld, en hoeveel. Dat levert level 3 catalogus maar alleen per variabele. In hoeverre is er consent om te delen? (soms kan dat alleen per subcohort, bijv NESDA). Daarnaast dus ook aangeven in hoeverre dit onbekend is. |
| | 91 | |
| | 92 | == Wat zouden we moeten doen voor level 3 == |
| | 93 | |
| | 94 | >privacy van patienten en zorgverleners is gewaarborgd |
| | 95 | >> Kan door middel van het verbergen van te fijnmazige getallen (dwz 'getrunkeerde data') |
| | 96 | |
| | 97 | >niet iedereen kan erbij (per variabele) |
| | 98 | |
| | 99 | >verschillende catalogue naast elkaar? |
| | 100 | >> Bijvoorbeeld voor bepaalde ziekten. Dan hoef je niet alle variablen op te hoesten. |
| | 101 | |
| | 102 | >samenwerking internationaal |
| | 103 | >>Specifiek per ziekten, vooral als de populatie cases klein is. |
| | 104 | |
| | 105 | >synchronisatie? Hoe zorgen we dat data gaat vloeien tussen verschillende lokale en nationale catalogie |
| | 106 | >>hier lopen we direct tegenaan, bijvoorbeeld LifeLines, Credo: 'een keer goed verzamelen en dan vaak gebruiken' |
| | 107 | |
| | 108 | |
| | 109 | == Actieplan (wat deels ook in eindrapport kan komen?) == |
| | 110 | |
| | 111 | * Roadmap afschrijven (annet en teun) |
| | 112 | |
| | 113 | * Eerste stap: data dictionaries mappen op variabelen |
| | 114 | * Bijv: Date of Birth |
| | 115 | * Dit impliceert een simpel data uitwissel format |
| | 116 | |
| | 117 | * Pilot studie definieren met |
| | 118 | * Een paar biobanken (LifeLines, Mondriaan, PSI, Twin registry) |
| | 119 | * Een paar use cases (liefst gedreven door BBMRI-NL use cases) |
| | 120 | |
| | 121 | * In parallel een demo systeem opzetten |
| | 122 | * selectie van use cases maken om te demonstreren |
| | 123 | * Gesimuleerde data om te testen |
| | 124 | * Basis user interface om inzichtelijk te maken waar we op mikken |
| | 125 | * Een wiki met wireframes |
| | 126 | |
| | 127 | * Overzicht maken van bestaande systemen |
| | 128 | * Bijv pseudonimisatie bij Mondriaan |
| | 129 | |
| | 130 | * Governance |
| | 131 | * Hoe organiseren we dat netjes? |
| | 132 | * Hoe gaan we dit betalen (kan het uit bestaande fondsen? Wat moet er nog bij?) |
| | 133 | * Zijn er ook use cases die geld gaan genereren van BBMRI-NL (meaningful use)? |
| | 134 | |
| | 135 | * Poolings vraag |
| | 136 | * combineren en ontdubbelen van individuen in grote cohort |
| | 137 | |
| | 138 | * Verrijkings vraag |
| | 139 | * kunnen koppelen van individuen zodat je complementaire info aan elkaar kan knopen |
| | 140 | |
| | 141 | * Technische afspraak maken met participerende biobanken. |
| | 142 | * Dwz simpele technische interfaces voor |
| | 143 | * metadata |
| | 144 | * getrunkeerde data uitwisselen / federatief bevragen |
| | 145 | |
| | 146 | (nagekomen: weer een voorbeeld van cataloguing efforts @ http://epi.grants.cancer.gov/biospecimens.html) |
| | 147 | |