国内服务器

大数据领域中RabbitMQ的高效配置指南

在大数据场景中（如实时日志采集、用户行为分析、订单流处理），系统每天需要处理数千万甚至数亿条消息。普通消息队列可能在高并发下出现"堵车"（延迟飙升）、“丢件”（消息丢失）或&quo...

国内服务器

4个月前

430

Apache Flink+Apache Iceberg（协作关系）

Flink + Iceberg 的组合实质上是将数据湖的存储能力与流计算的实时能力深度融合实时化：让数据湖“活”起来，支持秒级数据新鲜度服务化：数据湖不再只是存储，而是可直接服务业务的数据平台一体化...

国内服务器

4个月前

430

Flink 实时计算 x SLS 存储下推：阿里云 OpenAPI 网关监控平台实践

本文由潘伟龙（阿里云可观测）、阮孝振（阿里云开放平台）撰写，介绍阿里云OpenAPI网关实时监控体系的构建实践。面对TB级日志、多维分析、秒级告警等挑战，采用Flink+SLS云原生方案，创新分层聚合...

国内服务器

4个月前

430

PyFlink JAR、Python 包、requirements、虚拟环境、模型文件，远程集群怎么一次搞定？

Flink Python 依赖管理最佳实践本文总结了 Flink Python 作业中管理依赖的关键方法：总原则：混用 DataStream 和 Table API 时，优先通过 DataStre...

国内服务器

4个月前

430

Java 大视界 — Java 大数据在智能医疗健康档案数据分析与个性化健康管理中的应用（410）

本文基于 2023 年 6 月省级智能医疗健康档案项目（覆盖 380 万糖尿病患者），详解 Java 大数据（Flink 1.15.2+HBase 2.4.17+Spark 3.3.0）在健康档案数据...

国内服务器

4个月前

430

【大数据】Spark Executor内存分配原理与调优

我们都知道 Spark 能够有效的利用内存并进行分布式计算，其内存管理模块在整个系统中扮演着非常重要的角色。为了更好地利用 Spark，深入地理解其内存管理模型具有非常重要的意义，这有助于我们对 Sp...

国内服务器

4个月前

430

Flink原理与实战（java版）#第11章Flink的应用（第三节Table & SQL 连接器之Hive（二））

介绍Hive作为Table API和SQL的外部连接器使用，并且结合实际应用中会使用kafka作为数据源进行介绍。

国内服务器

4个月前

430

Java 大视界 — Java 大数据在智能医疗远程康复数据管理与康复方案个性化定制实战（430）

Java大数据在智能医疗远程康复中的应用本文介绍了Java大数据技术在智能医疗远程康复系统中的实战应用。针对远程康复行业面临的四大痛点——数据异构分散、方案同质化、实时性与安全性矛盾、合规压力大，作...

国内服务器

4个月前

430

IntVar() Python 中 tkinter 库的核心组件

IntVar() 是 Python tkinter 库的专属组件，用于界面控件和整数数据的双向绑定，而非普通的整数变量；核心方法是 get()（取值）和 set()（赋值），不能像普通变量那样直接用 ...

国内服务器

4个月前

430

Flink-DataWorks第四部分：数据同步（第60天）

本文主要详解了DataWorks的数据同步，为第四部分：由于篇幅过长，分章节进行发布。后续： 数据开发。

国内服务器

4个月前

430

标签云