大数据体系统计报告

随着互联网技术的不断发展,"大数据"一词不断出现在人们的日常生活之中,与之相关的产业也不断蓬勃发展,各种大数据商业平台随之涌现。

大数据相关应用服务

Hadoop生态系统
Nosql数据库和搜索引擎

大数据=大曝光?

由于使用/开发人员的安全意识薄弱,很多"大数据"相关的应用服务直接部署在互联网之中,并且没有任何安全访问措施,因一旦被攻击者发现或者利用,就可能造成大量数据的“大曝光”。

互联网中可能“曝光”的大数据相关应用统计

名称 数量
Maprecuce 763
HDFS 1247
Hive 1149
spark 4910
Hbase 899
Zookeeper 8226
Ambari 879
Cassandra 2752
Mongodb 46230
Couchdb 3870
Redis 56890
Solr 422
elasticsearch 9304

暴露在互联网中的“大数据”普遍存在访问控制不足的问题:

任何人通过浏览器就能访问到某些应用的web界面,获取配置信息、操作日志和存储数据等敏感信息;或者利用某些应用的客户端程序直接连接对应的服务端,通过提供的控制命令对服务端数据进行添加、删除、读取等操作。

操作图示

如何提高大数据的安全

不直接部署在外网

提高安全的方法