Hadoop-рішення для захисту даних великих обсягів
Fìz.-mat. model. ìnf. tehnol. 2021, 33:23-27
DOI:
https://doi.org/10.15407/fmmit2021.33.023Ключові слова:
технологія Hadoop, обробка даних, дані великих обсягів, Big Data, безпека даних, захист інформаціїАнотація
Досліджено одну з проблем даних великого обсягу – забезпечення захисту в процесі накопичення та обробки. Розглядається випадок застосування технології Hadoop в її останній модифікації Apache Hadoop 3.3.0. Пропонується рішення з посиленням захисту оброблюваних даних й підключенням інструментів Apache Knox Gateway, Apache Ranger та Apache Atlas. Передбачена можливість застосування даних, отриманих в результаті роботи локальних баз, електронних архівів, систем управління базами та даних окремих користувачів. Особливостями рішення є також застосування приватної хмари й криптографічних алго-ритмів. Наведено приклад реалізації захищеного рішення до розв’язання задачі глибинного аналізу на прикладі паралельної версії задачі пошуку асоціативних правил при роботи з неструктурованими даними великих обсягів.