Порівняння форматів
Форматів даних існує дуже багато (як і способів та підходів для формування, зберігання та використання даних), і вони не обмежуються перерахованими (CSV, JSON та XML). Кожний з них призначений для того або іншого випадку в залежності від складності інформаційних систем, обсягів даних, частоти оновлення, вимог до безперебійного та швидкого доступу тощо.
Якщо порівнювати тільки 3 формати, то можна скласти таблицю характеристик, де саме використання формату виграє або програє. Рівень кожної характеристики суб’єктивно* визначається кількістю балів від 0 до 10.
| Характеристика формату | CSV | JSON | XML |
|---|---|---|---|
| 1. Табличні дані | 10 | 3 | 5 |
| 2. Великі дані (Big Data) | 10 | 0 | 2 |
| 3. Структура описана в файлі формату | 2 | 10 | 10 |
| 4. Можна описати складну структуру | 1 | 10 | 10 |
| 5. Можна вкладати файли | 0 | 1 | 10 |
| 6. Кілька способів представлення даних | 3 | 5 | 10 |
| 7. Легко читається людиною | 10 | 10 | 7 |
| 8. Швидко обробляється програмою | 10 | 8 | 4 |
| 9. Потокова обробка (не в пам’яті) | 10 | 0 | 5 |
| 10. Не містить зайвої інформації | 9 | 3 | 1 |
| 11. Малий розмір вихідних даних | 10 | 6 | 3 |
| 12. Використовується в API | 5 | 10 | 8 |
| Загалом | 80 | 66 | 75 |
* Значення можна трактувати як:
- 0 – не використовується, або дуже мала вірогідність
- 1 – теоретично можливо
- 2 – інколи використовується
- 3 – можна вважати, що використовується
- 4 – використовується, але з обмеженнями
- 5 – використовується
- 6 – частіше використовується
- 7 – нормально використовується
- 8 – дуже гарно використовується
- 9 – відмінно використовується, за виключенням деяких випадків
- 10 – відмінно використовується
