Верховна Рада України
Портал відкритих даних

Порівняння форматів

Форматів даних існує дуже багато (як і способів та підходів для формування, зберігання та використання даних), і вони не обмежуються перерахованими (CSV, JSON та XML). Кожний з них призначений для того або іншого випадку в залежності від складності інформаційних систем, обсягів даних, частоти оновлення, вимог до безперебійного та швидкого доступу тощо.

Якщо порівнювати тільки 3 формати, то можна скласти таблицю характеристик, де саме використання формату виграє або програє. Рівень кожної характеристики суб’єктивно* визначається кількістю балів від 0 до 10.

Характеристика формату CSV JSON XML
1. Табличні дані 10 3 5
2. Великі дані (Big Data) 10 0 2
3. Структура описана в файлі формату 2 10 10
4. Можна описати складну структуру 1 10 10
5. Можна вкладати файли 0 1 10
6. Кілька способів представлення даних 3 5 10
7. Легко читається людиною 10 10 7
8. Швидко обробляється програмою 10 8 4
9. Потокова обробка (не в пам’яті) 10 0 5
10. Не містить зайвої інформації 9 3 1
11. Малий розмір вихідних даних 10 6 3
12. Використовується в API 5 10 8
Загалом 80 66 75

* Значення можна трактувати як:

 •  0 – не використовується, або дуже мала вірогідність
 •  1 – теоретично можливо
 •  2 – інколи використовується
 •  3 – можна вважати, що використовується
 •  4 – використовується, але з обмеженнями
 •  5 – використовується
 •  6 – частіше використовується
 •  7 – нормально використовується
 •  8 – дуже гарно використовується
 •  9 – відмінно використовується, за виключенням деяких випадків
 • 10 – відмінно використовуєтьсявгору