beixibaobao

帅气的我简直无法用语言描述!

kafka_2.13-4.1.1集群安装

本文详细介绍了在CentOS8系统上安装kafka_2.13-4.1.1集群的完整流程。主要内容包括:1)环境准备,包括关闭防火墙、安装JDK21、创建kafka用户和配置目录权限;2)Kafka集群...
2周前
120

基于大数据的泄漏仪设备监控系统

随着信息技术的飞速发展,大数据技术已经成为推动社会进步和经济发展的重要力量。大数据技术是指从海量、复杂、多源的数据中,通过高效的数据处理和分析,提取有价值信息、发现数据间规律和关联的技术体系。以下将从...
2周前
80

026、流式计算:Kafka与Spark Streaming实时处理

序列化:用Kryo,别用Java原生序列化。配置时记得注册自定义类:并行度:Kafka分区数和Spark分区数最好保持1:1或整数倍关系。曾经设了60个Kafka分区,Spark却只有10个core...
2周前
110

基于Spark+爬虫+Echarts的地区天气数据分析系统设计与实现

今天带来的是基于Spark+爬虫+Echarts的西南天气数据分析系统设计与实现,本研究基于Spark大数据技术,对西南地区气象数据进行多维度分析。通过Python爬虫采集多源气象数据,利用Spark...
2周前
100

将 Logstash Pipeline 从 Azure Event Hubs 迁移到 OTel Collector Kafka Receiver

本文介绍了将Logstash pipeline从Azure Event Hubs插件迁移到OpenTelemetry Collector Kafka receiver的详细指南。主要内容包括:配置转换...
2周前
130

RabbitMQ 消息 TTL 配置:消息过期时间设置全攻略(两种方案+流程图+实战代码)

在实际业务场景中,很多消息并非需要永久保存,比如订单超时未支付自动取消、验证码过期失效、临时通知过期等。RabbitMQ 提供的TTL(Time-To-Live)过期时间功能,正是用来解决这类“限时处...
2周前
150

十五、Zookeeper【待完善】

Zookeeper主要应用于大数据开发中的,统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等场景。该框架相当于大数据框架中的润滑剂。是大数据大数据开发工程师要会的框架之一。
2周前
100

RabbitMQ 虚拟主机(vhost)全面解析:是什么、作用、使用场景+实战配置

在 RabbitMQ 中,Virtual Host(vhost,虚拟主机)是一个非常核心且容易被新手忽略的概念。它类似于操作系统的用户空间,也类似于 MySQL 的数据库,是 RabbitMQ 实现资...
2周前
100

Cursor vs Claude Code vs Codex:三款 AI 编程工具深度对比

市面上最热门的三款 AI 编程工具——Cursor、Claude Code、GitHub Copilot/Codex,到底有什么区别?该怎么选?Cursor→ AI 原生 IDE,改造你的编辑器→ 终...
2周前
180

Qdrant 向量数据库完全指南:从入门到 Spring AI/LangChain4J 集成实践

Qdrant(读音:quadrant)是一个用 Rust 编写的开源向量相似度搜索引擎,专门用于存储、搜索和管理向量嵌入(Vector Embeddings)。它提供了高性能的向量搜索能力,支持过滤...
2周前
90