MGeo与Flink流式计算集成实现实时地址校验 MGeo是由阿里巴巴开源的一款面向中文地址领域的预训练语义匹配模型,其核心目标是解决“不同表述、相同地点”的实体对齐问题。领域适配性强:针对中国行政区划结构(省-市-区-街道-小区)进行建模优化细粒度... 国内服务器 1个月前150
技术架构系列 – 详解Kafka 查找时,先通过二分法确定消息所在的Segment,再在内存中的索引文件里进行二分查找,找到最接近的索引条目,最后在。在传统的数据从磁盘发送到网络的过程中,数据需要在操作系统内核空间和用户空间之间多次拷... 国内服务器 4周前170
Elasticsearch 9.3.0 日志分类功能完整终于知道了 空间级权限:在 Kibana 空间(Space)内拥有机器学习功能「完全访问」或「只读访问」权限的用户,可查看该空间内所有可见的异常检测作业结果——即使他们没有源索引的访问权限。日志分类的核心入口是... 国内服务器 1个月前170
大数据领域数据产品的金融应用案例分析 数据整合是基础:没有全量数据,模型就是“瞎子”——比如设备数据能帮你识别“盗刷者用新手机登录”;实时性是关键:欺诈交易要在3秒内拦截,否则钱已经转走了;模型要可解释:风控人员需要知道“为什么预警”(比... 国内服务器 4周前160
SelectDB数据库,新一代实时数据仓库的全面解析与应用 SelectDB是一款基于Apache Doris的新一代实时数据仓库解决方案,具备实时极速、融合统一、弹性架构和开放生态四大核心特性。它采用云原生存算分离架构,支持秒级数据更新、毫秒级查询响应,在T... 国内服务器 1个月前170
大数据领域实用BI工具的使用心得分享 当你面对TB级别的销售数据、用户行为日志或供应链台账时,是否曾像面对一本“乱码书”一样无从下手?BI(商业智能)工具就是大数据时代的“数据翻译官”——它能将晦涩的原始数据转化为直观的图表、可交互的 d... 国内服务器 4周前190
Java 大视界 — Java 大数据机器学习模型在电商商品推荐系统中的冷启动问题攻克与个性化推荐强化 解析 Java 大数据如何攻克电商推荐冷启动,强化个性化,附某区域电商实战案例,新用户点击率提升 206%,GMV 增长 75%。 国内服务器 1个月前260
深度解析Sarama:如何构建高性能Go语言Kafka客户端完整指南 在现代微服务架构中,消息队列已成为系统解耦和数据流转的核心组件。然而,当开发者面对**高吞吐量**、**低延迟**和**数据一致性**的严苛要求时,传统的Kafka客户端往往难以满足复杂的业务场景。特... 国内服务器 4周前130
Flink 实时计算 x SLS 存储下推:阿里云 OpenAPI 网关监控平台实践 本文由潘伟龙(阿里云可观测)、阮孝振(阿里云开放平台)撰写,介绍阿里云OpenAPI网关实时监控体系的构建实践。面对TB级日志、多维分析、秒级告警等挑战,采用Flink+SLS云原生方案,创新分层聚合... 国内服务器 1个月前160