Zpět na hledáníBinaryCIF and CIFTools-Lightweight, efficient and extensible macromolecular data management (2020)výskyt výsledku
Identifikační kód | RIV/00216224:14740/20:00117701 |
---|---|
Název v anglickém jazyce | BinaryCIF and CIFTools-Lightweight, efficient and extensible macromolecular data management |
Druh | J - Recenzovaný odborný článek (Jimp, Jsc a Jost) |
Poddruh | J/A - Článek v odborném periodiku je obsažen v databázi Web of Science společností Thomson Reuters s příznakem „Article“, „Review“ nebo „Letter“ (Jimp) |
Jazyk | eng - angličtina |
Vědní obor | 10608 - Biochemistry and molecular biology |
Rok uplatnění | 2020 |
Kód důvěrnosti údajů | S - Úplné a pravdivé údaje o výsledku nepodléhající ochraně podle zvláštních právních předpisů. |
Počet výskytů výsledku | 1 |
Počet tvůrců celkem | 7 |
Počet domácích tvůrců | 3 |
Výčet všech uvedených jednotlivých tvůrců | Jaroslav Koča (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 4347374, orcid: 0000-0002-2780-4901, researcherid: E-4460-2012) David Sehnal (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 1274740, orcid: 0000-0002-0682-3089) Radka Svobodová (státní příslušnost: CZ - Česká republika, domácí tvůrce: A, vedidk: 3876500, orcid: 0000-0002-3840-8760) Sebastian Bittrich (státní příslušnost: CZ - Česká republika) Stephen K. Burley (státní příslušnost: CZ - Česká republika) Alexander S. Rose (státní příslušnost: CZ - Česká republika) Sameer Velankar (státní příslušnost: CZ - Česká republika) |
Popis výsledku v anglickém jazyce | 3D macromolecular structural data is growing ever more complex and plentiful in the wake of substantive advances in experimental and computational structure determination methods including macromolecular crystallography, cryo-electron microscopy, and integrative methods. Efficient means of working with 3D macromolecular structural data for archiving, analyses, and visualization are central to facilitating interoperability and reusability in compliance with the FAIR Principles. We address two challenges posed by growth in data size and complexity. First, data size is reduced by bespoke compression techniques. Second, complexity is managed through improved software tooling and fully leveraging available data dictionary schemas. To this end, we introduce BinaryCIF, a serialization of Crystallographic Information File (CIF) format files that maintains full compatibility to related data schemas, such as PDBx/mmCIF, while reducing file sizes by more than a factor of two versus gzip compressed CIF files. Moreover, for the largest structures, BinaryCIF provides even better compression-factor ten and four versus CIF files and gzipped CIF files, respectively. Herein, we describe CIFTools, a set of libraries in Java and TypeScript for generic and typed handling of CIF and BinaryCIF files. Together, BinaryCIF and CIFTools enable lightweight, efficient, and extensible handling of 3D macromolecular structural data. |
Klíčová slova oddělená středníkem | Structural Biology;Molecular Graphics;Data Curation |
Stránka www, na které se nachází výsledek | https://doi.org/10.1371/journal.pcbi.1008247 |
DOI výsledku | 10.1371/journal.pcbi.1008247 |
Odkaz na údaje z výzkumu | - |
Údaje o výsledku v závislosti na druhu výsledku
Název periodika | PLoS Computational Biology |
---|---|
ISSN | 1553-734X |
e-ISSN | 1553-7358 |
Svazek periodika | 16 |
Číslo periodika v rámci uvedeného svazku | 10 |
Stát vydavatele periodika | US - Spojené státy americké |
Počet stran výsledku | 13 |
Strana od-do | 1-13 |
Kód UT WoS článku podle Web of Science | 000585163600006 |
EID výsledku v databázi Scopus | 2-s2.0-85094682973 |
Způsob publikování výsledku | A - Open Access |
Předpokládaný termín zveřejnění plného textu výsledku | - |
Ostatní informace o výsledku
Předkladatel | Masarykova univerzita / Středoevropský technologický institut |
---|---|
Dodavatel | MSM - Ministerstvo školství, mládeže a tělovýchovy (MŠMT) |
Rok sběru | 2021 |
Specifikace | RIV/00216224:14740/20:00117701!RIV21-MSM-14740___ |
Datum poslední aktualizace výsledku | 19.05.2021 |
Kontrolní číslo | 192310769 ( v1.0 ) |
Odkazy na výzkumné aktivity, při jejichž řešení výsledek vznikl
Projekt podporovaný MŠMT v programu EF | EF16_013/0001777 - ELIXIR-CZ: Budování kapacit (2017 - 2021) |
---|---|
Projekt podporovaný MŠMT v programu LM | LM2018131 - Česká národní infrastruktura pro biologická data (2020 - 2022) |