国内服务器

从调度到实时：Linux 下 DolphinScheduler 驱动 Flink 消费 Kafka 的实战指南

是指挥官。负责 Flink 作业的提交（Submit）。负责作业的启停控制负责依赖管理（例如：只有当 Kafka 集群健康或前置 ETL 完成后，才启动 Flink）。负责告警与监控（作业失败重试、延...

国内服务器

4周前

190

Pandas——如何更改DataFrame中的值

我们可以利用索引或者标签确定需要修改值的位置。4.在DataFrame中添加一列。如何更改DataFrame中的值。的那些行在地市字段中全都设为全省。2.运用loc、iloc更改值。1.构造DataF...

国内服务器

4周前

170

ZooKeeper ZAB 协议阶段深度解析：从选举到同步的完整流程

ZAB 协议是 ZooKeeper 专门设计的一种支持崩溃恢复的原子广播协议。它将分布式系统的复杂问题分解为多个有序的阶段，确保在任何情况下数据的一致性和可靠性。fill:#333;important...

国内服务器

4周前

120

大数据ETL工具比较：Sqoop vs Flume vs Kafka

大数据时代，数据分散在各类数据库、服务器日志、IoT设备中，如何高效“搬运”“整合”数据是分析的第一步。本文聚焦结构化数据迁移、日志收集、实时数据流处理三大典型ETL场景，对比Sqoop、Flume...

国内服务器

4周前

200

从 CDC 到实时数据流Flink SQLServer CDC Connector 实战

SQLServer CDC Connector是Flink提供的Source连接器，通过SQL Server自带的CDC功能与Debezium实现数据捕获。使用时需先在SQL Server端启用CDC...

国内服务器

4周前

160

RabbitMQ 的配置文件位置及常见配置项

RabbitMQ配置文件主要位于/etc/rabbitmq/rabbitmq.conf（Linux/macOS）或C:\Program Files\RabbitMQ Server\rabbitmq.c...

国内服务器

4周前

120

Flink流处理：多源传感器数据实时处理，基于Scala使用Flink从不同数据源（集合、文件、Kafka、自定义 Source）读取传感器数据

这段代码展示了如何使用Apache Flink进行流处理，主要功能是从多种数据源（集合、文件、Kafka、自定义Source）读取传感器数据，并进行简单的处理和输出。代码结构包括数据源读取、数据处理...

国内服务器

4周前

120

cv_resnet101_face-detection_cvpr22papermogface部署教程：WSL2环境下CUDA驱动配置要点

本文介绍了如何在星图GPU平台上自动化部署👁️cv_resnet101_face-detection_cvpr22papermogface镜像，快速搭建高性能人脸检测环境。该镜像基于ResNet101...

国内服务器

4周前

120

黑马头条日记 | Kafka Stream流式计算 —— 助你实时计算热点文章

我们上一篇定时计算热点文章使用的是XXL-JOB，这个方案有几个明显的不足。第一个不足就是每一次计算评分都是把最近5天全部文章拉出来一起评分，这种全量扫描在很多情况下是没必要的，比如说那些评分数据不变...

国内服务器

4周前

150

Kafka Leader 和 Follower 深度解析：副本协同的奥秘与数据一致性保障

在 Kafka 的分布式架构中，副本机制是实现高可用和数据持久化的基石。而副本机制的核心，就是Leader（领导者）和Follower（追随者）这两个角色的精妙分工与协作。它们之间的关系就像一支交响乐...

国内服务器

4周前

160

标签云