ox_brand
ResearchServices
Introduction to researchdata management
Slides provided by DaMaRO Project,University of Oxford
ResearchServices
WHAT IS RESEARCH DATAMANAGEMENT?
Introduction to researchdata management
Page 2
ResearchServices
What is data?
“A reinterpretable representation of information in a formalizedmanner suitable for communication, interpretation, or processing.”
Digital Curation Centre
Introduction to researchdata management
Page 3
Q:\Research Data Management\RDM_modules\pictures\binary2.jpg
C:\Temporary Internet Files\Content.IE5\53Y73X9U\MC900441492[1].png
C:\Temporary Internet Files\Content.IE5\53Y73X9U\MC900441506[1].png
C:\Temporary Internet Files\Content.IE5\53Y73X9U\MC900433865[1].png
Slide adapted fromthe PrePARe Project
ResearchServices
What is data?
Any information you use in yourresearch
Introduction to researchdata management
Page 4
Q:\Research Data Management\RDM_modules\pictures\binary2.jpg
C:\Temporary Internet Files\Content.IE5\53Y73X9U\MC900441492[1].png
C:\Temporary Internet Files\Content.IE5\53Y73X9U\MC900441506[1].png
C:\Temporary Internet Files\Content.IE5\53Y73X9U\MC900433865[1].png
Slide adapted fromthe PrePARe Project
ResearchServices
In small groups…
Introduce yourself
What sort of data do you use?
Where does it come from?
Are you creating new data?
Are you working with pre-existing data?
Where is your data stored?
Introduction to researchdata management
Page 5
ResearchServices
What is data management?
Data management is a general term covering how youorganize, structure, store, and care for the informationused or generated during a research project
It includes:
How you deal with information on a day-to-daybasis over the lifetime of a project
What happens to data in the longer term – what youdo with it after the project concludes
Introduction to researchdata management
Page 6
ResearchServices
Why spend time and effort on this?
So you can work efficiently and effectively
Save time and reduce frustration
Highlight patterns or connections that mightotherwise be missed
Because your data is precious
To enable data re-use and sharing
To meet funders’ and institutional requirements
Introduction to researchdata management
Page 7
ResearchServices
University of Oxford policy
Introduction to researchdata management
Page 8
Introduced July 2012Introduced July 2012
ResearchServices
University of Oxford policy
The full policy can be viewed on the University ofOxford Research Data Management website
Research data is the information needed ‘to support orvalidate a research project’s observations, findings oroutputs’
Research data should be:
Accurate, complete, identifiable, retrievable, andsecurely stored
Able to be made available to others
Introduction to researchdata management
Page 9
ResearchServices
University of Oxford policy
Research data should be retained for ‘as long as theyare of continuing value to the researcher and the widerresearch community’ – but a minimum of three years
Specific requirements from funders take precedence
Researchers are responsible for:
Developing and documenting clear data management procedures
Planning for the ongoing custodianship of their data
Ensuring that legal, ethical, and funding body requirements are met
Policy applies to University staff and doctoral students
Depositing relevant research data may ultimately become a conditionof award for doctorates
Introduction to researchdata management
Page 10
ResearchServices
Funders’ requirements
Funding bodies are taking an increasinginterest in what happens to research data
You may be required to make your datapublicly available at the end of a project
Check the small print in your grant conditions
Many funders require a data management planas part of grant applications
Oxford’s RDM website provides a summary ofrequirements
Introduction to researchdata management
Page 11
ResearchServices
DAY-TO-DAY DATAMANAGEMENT
Introduction to researchdata management
Page 12
ResearchServices
Introduction to researchdata management
Page 13
‘What a mess’ by .pst, via Flickr: http://www.flickr.com/photos/psteichen/3915657914/.
Can you find what youneed, when you need it?Can you find what youneed, when you need it?
ResearchServices
Questions to ask
Are you using the most appropriate software orother tools to store and analyse your data?
Do you have a system in place for dealing withnew data when you acquire it?
If so, is it realistic?
Are you recording all the necessary contextualinformation?
Are you using helpful, consistent file namingconventions? Is your file structure clear?
Introduction to researchdata management
Page 14
ResearchServices
File naming
Aim for concise but informative names
Ideally, you should be able to tell what’s in a filewithout opening it
Think about the ordering of elements within afilename
YYYY-MM-DD dates allow chronological sorting
You can force an order by adding a number atthe beginning of the name
Consider including version information
Introduction to researchdata management
Page 15
ResearchServices
File naming strategies – examples
Order by date:
2013-04-12_interview-recording_THD.mp3
2013-04-12_interview-transcript_THD.docx
2012-12-15_interview-recording_MBD.mp3
2012-12-15_interview-transcript_MBD.docx
Order by subject:
MBD_interview-recording_2012-12-15.mp3
MBD_interview-transcript_2012-12-15.docx
THD_interview-recording_2013-04-12.mp3
THD_interview-transcript_2013-04-12.docx
Order by type:
Interview-recording_MBD_2012-12-15.mp3
Interview-recording_THD_2013-04-12.mp3
Interview-transcript_MBD_2012-12-15.docx
Interview-transcript_THD_2013-04-12.docx
Forced order with numbering:
01_THD_interview-recording_2013-04-12.mp3
02_THD_interview-transcript_2013-04-12.docx
03_MBD_interview-recording_2012-12-15.mp3
04_MBD_interview-transcript_2012-12-15.docx
Introduction to researchdata management
Page 16
In retrospect I am not very happy with the method Iused for naming files. The biggest problem was withthe newspaper articles I downloaded… I named thefiles only based on the topic of the article, withoutmentioning the name of the periodical and the yearof publication, which would have been very usefullater, when I began writing the thesis.
– Doctoral student researching communication history
ResearchServices
Research Skills Toolkit
Website and hands-on workshops
A guide to software,University services,and other tools andresources forresearch
Requires SSO login
Introduction to researchdata management
Page 17
ResearchServices
IT Learning Programme
Over 200 different ITcourses
Covering software, skills,and new technologies
ITLP Portfolio offerscourse materials andother resources
Introduction to researchdata management
Page 18
ResearchServices
ORDS – Online Research DatabaseService
Specifically designed for academic research data
Cloud-hosted and automatically backed up
Web interface makes collaboration straightforward
If desired, databases can easily be made public
Designed to permit easy archiving
Currently recruiting early adopters –free use of system in return forfeedback
Contact ords@it.ox.ac.uk
Introduction to researchdata management
Page 19
ResearchServices
KEEPING YOUR DATA SAFE
Introduction to researchdata management
Page 20
ResearchServices
DON’T LET THIS BEYOU!DON’T LET THIS BEYOU!
Introduction to researchdata management
Page 21
Slide adapted fromthe PrePARe Project
ResearchServices
‘Fire’ by andrewmalone, via Flickr: http://www.flickr.com/photos/andrewmalone/2032844649/
What would happen to yourdata if there was fire inyour office, department orhome?What would happen to yourdata if there was fire inyour office, department orhome?
Introduction to researchdata management
Page 22
Slide adapted fromthe PrePARe Project
ResearchServices
Make multiple copies…
…and keep them in different places
Automate theprocess if you can
Introduction to researchdata management
Page 23
Slide adapted fromthe PrePARe Project
C:\Documents and Settings\oucs0042\Local Settings\Temporary Internet Files\Content.IE5\5S63W1MN\MC900432591[1].png
C:\Documents and Settings\oucs0042\Local Settings\Temporary Internet Files\Content.IE5\HC7RSUMC\MC900434845[1].png
ResearchServices
Example back-up plan
Back-up strategy for a recent postdoc researchproject:
Working data stored on personal laptop
Weekly back-up to external hard drive, and to twomemory sticks
Key files also sent as email attachments, orsaved to Dropbox
Post-project, data copied to DVDs for long-termstorage
Introduction to researchdata management
Page 24
ResearchServices
IT Services: Data Back-up on the HFS
HFS is Oxford’s central back-up and archivingservice
Free of charge to University staff andpostgraduates
Automated back-ups of machines connected toUniversity network
Copies kept in multiple places
Introduction to researchdata management
Page 25
ResearchServices
Think about your storage media…
Introduction to researchdata management
Page 26
tiff
C:\Documents and Settings\oucs0042\Local Settings\Temporary Internet Files\Content.IE5\UD2Z24HI\MP900302975[1].jpg
C:\Documents and Settings\oucs0042\Local Settings\Temporary Internet Files\Content.IE5\AJ5OZS44\MP900305748[1].jpg
… and about file formats
Slide adapted fromthe PrePARe Project
ResearchServices
In small groups…
What data management challenges have youencountered?
What strategies have you personally founduseful?
Be ready to feed back to the group
Introduction to researchdata management
Page 27
ResearchServices
DOCUMENTATION ANDMETADATA
Introduction to researchdata management
Page 28
ResearchServices
Documentation and metadata
Documentation is the contextual informationrequired to make data intelligible and aidinterpretation
A users’ guide to your data
Metadata is similar, but usually more structured
Conforms to set standards
Machine readable
Introduction to researchdata management
Page 29
ResearchServices
Q:\Preservation\PrePARe Project\Work\Training\pictures\linearb2.jpg
Make material understandable
What’s obviousnow might notbe in a fewmonths, years,decades…
Adapted from ‘Clay Tablets with Linear B Script’ by Dennis, via Flickr: http://www.flickr.com/photos/archer10/5692813531/
MAKE SUREYOU CANUNDERSTANDIT LATER
Q:\Preservation\PrePARe Project\Work\Training\linearA.jpg
Introduction to researchdata management
Page 30
Slide adapted fromthe PrePARe Project
ResearchServices
Make material verifiable
Detailing yourmethods helpspeople understandwhat you did
And helps make yourwork reproducible
Conclusions can beverified
http://farm5.staticflickr.com/4065/4588700881_4a065edc73_z.jpg
Image by woodleywonderworks , via Flickr:
Introduction to researchdata management
Page 31
Slide adapted fromthe PrePARe Project
ResearchServices
You may wish to re-use yourown data later on
Or you may wish to make itavailable for others to use
Provide context to minimizethe risk of misunderstandingor misuse
Good metadata makes iteasier to locate relevant data
Make material reusable
Introduction to researchdata management
Page 32
Slide adapted fromthe PrePARe Project
ResearchServices
Who created it, when and why
Description of the item
Methodology and methods
Units of measurement
Definitions of jargon,acronyms and code
References to related data
Documentation – what to include
C:\Temporary Internet Files\Content.IE5\53Y73X9U\MC900434804[1].png
?
M. Farinelli et al.(2012) PLoS ONE7(3): e34047
Q:\Preservation\PrePARe Project\Work\Training\pictures\ruler.jpg
Introduction to researchdata management
Page 33
Slide adapted fromthe PrePARe Project
ResearchServices
Metadata – data about data
A formal,structureddescriptionof a dataset
Used byarchivesto createcataloguerecords
Page 34
Introduction to researchdata management
ResearchServices
Missing metadata – or the riddle of thesixth toe
This painting showsGeorgiana, Duchess ofDevonshire as Diana
… or Cynthia
She has six toes – butno one knows why
Introduction to researchdata management
Page 35
File:Georgiana Cavendish, Duchess of Devonshire as Diana.jpg
ResearchServices
WHAT HAPPENS AT THE ENDOF THE PROJECT?
Introduction to researchdata management
Page 36
ResearchServices
Data archiving
Data generated during a research project isvaluable
Don’t leave it languishing on your hard drive
Consider depositing it in an archive or repository
A number of national disciplinary archives exist
DataBib provides a catalogue: http://databib.org/
Oxford will soon have its own data archive
If possible, make it available for others to re-use
Introduction to researchdata management
Page 37
ResearchServices
Why share data? Reputation
Get credit for high qualityresearch
Recognition for contributionto research community
Open data leads to increasedcitations
Of the data itself
Of associated papers
Introduction to researchdata management
Page 38
Slide adapted fromthe PrePARe Project
ResearchServices
Why share data? Reuse
Reduces duplication ofeffort
Allows public researchfunding to be used moreeffectively
Contexts not currentlyenvisaged
Extend research beyondyour discipline
Q:\Preservation\PrePARe Project\Work\Training\Green_Binary_Reuse_symbol_B.jpg
Introduction to researchdata management
Page 39
Slide adapted fromthe PrePARe Project
ResearchServices
Why share data? Be a trailblazer!
A paradigm shift in how research outputs areviewed is occurring
Data outputs are of increasing importance –and are likely to become even more so
Major journals are increasinglylooking to publish datasetsalongside articles
Be at the forefront of animportant shift in theacademic world
Introduction to researchdata management
Page 40
C:\Documents and Settings\oucs0042\Local Settings\Temporary Internet Files\Content.IE5\5S63W1MN\MC900149882[1].wmf
ResearchServices
Introduction to researchdata management
Page 41
Video by NYU Health Sciences Libraries: http://www.youtube.com/watch?v=N2zK3sAtr-4
ResearchServices
Data sharing – concerns
Ethical concerns
Confidential or sensitive data
Legal concerns
Third party data
Professional concerns
Intended publication
Commercial issues (e.g. patent protection)
Introduction to researchdata management
Page 42
C:\Documents and Settings\oucs0042\Local Settings\Temporary Internet Files\Content.IE5\5S63W1MN\MP900309625[1].jpg
ResearchServices
Q:\Preservation\PrePARe Project\Work\Training\pictures\redact.jpg
EMBARGOED
Redact or embargo if there is good reason
Planning ahead can reduce difficulties
Data sharing – concerns
Introduction to researchdata management
Page 43
Slide adapted fromthe PrePARe Project
ResearchServices
Data licensing
A licence clarifies the conditions for accessingand making use of a dataset
User knows what’s allowed without asking furtherpermission
Doesn’t exclude possibility of specific requests togo beyond the terms of the licence
For databases, structure and content may becovered by separate rights
Introduction to researchdata management
Page 44
ResearchServices
Data licences - examples
Creative Common licences
Widely used and recognized
Six different flavours, plus CC0 public domain dedication
Open Data Commons
Specifically designed for datasets
Recognizes the structure/content distinction
Introduction to researchdata management
Page 45
ResearchServices
Data licensing - guidance
‘How to License Research Data’
A guide from the Digital Curation Centre
Introduction to researchdata management
Page 46
ResearchServices
DATA MANAGEMENTPLANNING
Introduction to researchdata management
Page 47
ResearchServices
Data management plans
A document which may be created in the earlystages of a project
While planning, applying for funding, or setting up
An initial plan may be expanded later
Details plans and expectations for data
Nature of data and its creation or acquisition
Storage and security
Preservation and sharing
Introduction to researchdata management
Page 48
ResearchServices
Exercise
Using the resources available, have a go atdrafting a data management plan for your ownresearch
If there are questions you can’t answer at thisstage, make a note of
What you need to find out
Decisions you need to make
Introduction to researchdata management
Page 49
ResearchServices
Digital Curation Centre
A national serviceproviding advice andresources
Create a datamanagement planusing the DMP onlinetool
Introduction to researchdata management
Page 50
DMP Online - The DCC Data Management Planning Tool
ResearchServices
‘In preparing forbattle, I have alwaysfound that plans areuseless but planningis indispensable.’
Dwight D. Eisenhower
Introduction to researchdata management
Page 51
File:Dwight D. Eisenhower, official Presidential portrait.jpg
ResearchServices
UNIVERSITY SERVICES
Introduction to researchdata management
Page 52
ResearchServices
DataBank and DataFinder
Two new University of Oxford services
Scheduled to launch later in 2013
Introduction to researchdata management
Page 53
ResearchServices
DataBank
University of Oxford’s institutional data archive
Long term preservation for datasets without anothernatural home
In some cases, may a suitable home for DPhil data
Datasets will be assigned DOIs
Will work alongside ORA, the University archive forresearch publications
Possible to link publications in ORA to datasets in DataBank
Depositors can opt to make datasets publicly available,embargoed for a fixed period, or hidden
Introduction to researchdata management
Page 54
ResearchServices
DataFinder
A catalogue of datasets
Information on the nature, location, and availability of the data
Will harvest metadata from DataBank and othercompatible data stores
So anything in DataBank will have a record in DataFinder
Researchers depositing data elsewhere stronglyencouraged to add a record to DataFinder
Should provide a substantial resource for researchersseeking datasets for reuse
Introduction to researchdata management
Page 55
ResearchServices
FURTHER INFORMATION ANDRESOURCES
Introduction to researchdata management
Page 56
ResearchServices
Research data management website
Oxford’s centraladvisory website
Covers datamanagementplanning, back-up andsecurity, data sharingand archiving, funderrequirements, etc.
University policy isavailable
Introduction to researchdata management
Page 57
ResearchServices
IT Services: Support for Research
Can assist with technical aspects of researchprojects at all stages of the project lifecycle
But the earlier you seek advice, the better
Includes the DaMaRO (Data ManagementRollout at Oxford) Project
For more information, emailresearchsupport@it.ox.ac.uk
Introduction to researchdata management
Page 58
ResearchServices
Research Data MANTRA
Free onlineinteractivetraining modules
Aimed atpostgraduatesand early careerresearchers
Introduction to researchdata management
Page 59
ResearchServices
Any questions?
Ask now, or email us ondamaro@oucs.ox.ac.uk
Introduction to researchdata management
Page 60
ResearchServices
Rights and re-use
This slideshow is part of a series of research data managementtraining resources prepared by the DaMaRO Project at theUniversity of Oxford
With the exception of clip art used with permission fromMicrosoft, the slideshow is made available under a CreativeCommons Attribution Non-Commercial Share-Alike License
Parts of this slideshow draw on teaching materials produced bythe PrePARe ProjectDATUM for Health, and DataTrainArchaeology
Within the terms of this licence, we actively encourage sharing,adaptation, and re-use of this material
Introduction to researchdata management
Page 61