运维开发网

大数据

0
  • 基于云原生的大数据实时分析方案实践

    1方案介绍大数据处理技术现今已广泛应用于各个行业,为业务解决海量存储和海量分析的需求。但数据量的爆发式增长,对数据处理能力提出了更大的挑战,同时对时效性也提出了更高的要求。实时分析已成为企业大数据分析中最关键的术语,这意味...[详细]

    2020-12-02 09:32 分类:云计算
  • 10万级etl批量作业自动化调度工具Taskctl之轻量级Web应用版/开源etl工具

    什么是批量作业:批量处理是银行业整个信息后台最为重要的技术形态,也是银行核心信息资产数据的分享、传输、演化的重要技术手段。有调查指出,全球70%的数据是经过批量处理得以再次使用,可见批量处理在整个信息生态中的技术占比与重要性...[详细]

    2020-12-01 13:03 分类:Linux
  • 【编测编学】如何做好大数据测试

    大数据测试干货[详细]

    2020-11-27 08:29 分类:Python
  • 内存数据库解析与主流产品对比(三)

    在上一篇文章《内存数据库解析与主流产品对比(二)》中,我们从数据组织和索引的角度介绍了内存数据库的特点和几款产品的技术实现。本文将继续解析内存数据库,从并发控制、持久化和查询处理的角度介绍几款技术,带来更多维度、更细致的...[详细]

    2020-11-26 10:26 分类:路由交换
  • 内存数据库解析与主流产品对比(二)

    在上一篇文章《内存数据库解析与主流产品对比(一)》中,我们介绍了基于磁盘的数据库管理系统相关知识,并简述了内存数据库的技术发展。本篇文章将从数据组织和索引的角度来介绍内存数据库的特点,并介绍几款产品实际的技术实现。[详细]

    2020-11-26 10:23 分类:路由交换
  • Fluid 0.4 新版本正式发布:支持数据预热,优化小文件场景

    为了解决大数据、AI 等数据密集型应用在云原生计算存储分离场景下,存在的数据访问延时高、联合分析难、多维管理杂等痛点问题,南京大学 PASALab、阿里巴巴、Alluxio 在 2020 年 9 月份联合发起了开源项目 Fluid。近期 Fluid 0.4 版本正式...[详细]

    2020-11-20 09:24 分类:云计算
  • CDH6.3.2集群搭建

    一.CDH简介官网:https://www.cloudera.com/CDH,全称Cloudera'sDistribution,includingApacheHadoop。是Hadoop众多分支中对应中的一种,由Cloudera维护,基于稳定版本的ApacheHadoop构建,提供了Hadoop的核心(可扩展存储、分布式计...[详细]

    2020-11-14 12:11 分类:Linux
  • 如何高效定义和验证restful请求的参数

    go-zero针对文本的序列化和反序列化主要在三个地方使用http api请求体的反序列化http api返回体的序列化配置文件的反序列化1. http api请求体的反序列化在反序列化的过程中的针对请求数据的数据格式以及数据校验需求,go-zero实现了自己的...[详细]

    2020-10-21 08:33 分类:编程语言
  • 面试:BigDecimal一定不会丢失精度吗?

    前言我们都知道浮点型变量在进行计算的时候会出现丢失精度的问题。如下一段代码:System.out.println(0.05 + 0.01); System.out.println(1.0 - 0.42); System.out.println(4.015 * 100); System.out.println(123.3 / 100); 输出...[详细]

    2020-10-09 08:57 分类:编程语言
  • HAProxy详解

    HAProxy详解[详细]

    2020-10-02 12:13 分类:Linux