大数据
云计算高端架构师:nginx服务器
Nginx:是一个高性能HTTP和反向代理服务器、IMAP、POP3、SMTP邮件代理服务器。特点:高并发响应性能非常好,官方Nginx处理静态文件并发5w/s;负载均衡及反向代理性能非常强;可对后端服务进行健康检查;支持PHPcgi方式和FastCGI方式;可以...[详细]
2021-01-12 10:24 分类:云计算Hive数据仓库实战
Hive作为大数据平台Hadoop之上的主流应用,公司一般都是用它作为公司的数据仓库,分布式机器学习的训练数据和数据处理也经常用它来处理,下面介绍下它的常用功能。[详细]
2020-12-09 09:49 分类:自动化基于云原生的大数据实时分析方案实践
1方案介绍大数据处理技术现今已广泛应用于各个行业,为业务解决海量存储和海量分析的需求。但数据量的爆发式增长,对数据处理能力提出了更大的挑战,同时对时效性也提出了更高的要求。实时分析已成为企业大数据分析中最关键的术语,这意味...[详细]
2020-12-02 09:32 分类:云计算10万级etl批量作业自动化调度工具Taskctl之轻量级Web应用版/开源etl工具
什么是批量作业:批量处理是银行业整个信息后台最为重要的技术形态,也是银行核心信息资产数据的分享、传输、演化的重要技术手段。有调查指出,全球70%的数据是经过批量处理得以再次使用,可见批量处理在整个信息生态中的技术占比与重要性...[详细]
2020-12-01 13:03 分类:Linux内存数据库解析与主流产品对比(三)
在上一篇文章《内存数据库解析与主流产品对比(二)》中,我们从数据组织和索引的角度介绍了内存数据库的特点和几款产品的技术实现。本文将继续解析内存数据库,从并发控制、持久化和查询处理的角度介绍几款技术,带来更多维度、更细致的...[详细]
2020-11-26 10:26 分类:路由交换内存数据库解析与主流产品对比(二)
在上一篇文章《内存数据库解析与主流产品对比(一)》中,我们介绍了基于磁盘的数据库管理系统相关知识,并简述了内存数据库的技术发展。本篇文章将从数据组织和索引的角度来介绍内存数据库的特点,并介绍几款产品实际的技术实现。[详细]
2020-11-26 10:23 分类:路由交换Fluid 0.4 新版本正式发布:支持数据预热,优化小文件场景
为了解决大数据、AI 等数据密集型应用在云原生计算存储分离场景下,存在的数据访问延时高、联合分析难、多维管理杂等痛点问题,南京大学 PASALab、阿里巴巴、Alluxio 在 2020 年 9 月份联合发起了开源项目 Fluid。近期 Fluid 0.4 版本正式...[详细]
2020-11-20 09:24 分类:云计算