2025,在AI星河中遨游,于CSDN星畔留痕

AI4天前发布 beixibaobao
3 0 0

目录

  • 一、写在前面
  • 二、与AI一起熬过的日月星辰
  • 三、与CSDN一起喝过的咖啡
  • 四、写在最后

一、写在前面

一斤代码二两酒,三笔写山水,两语道冷暖,四时看花开花落。———— 小马过河R

大家好,我是“小马过河R”,一名把诗意泡在咖啡里写bug的编码攻城狮。

曾经也是一名文刊编辑部成员,爱写作,爱编程,2022年开始从服务端架构转为涉猎NLP领域,经历了2023年初Chatgpt问世的变革之后便一直专注于AI领域LLM的研究和应用落地。曾在2020年成为简书创作者,2023年成为阿里云专家博主,2025年很荣幸入围博客之星TOP300,这也是笔者第一次参与CSDN博客之星的主题创作。撰写这篇文章的时候我大抵是恍惚的,因为昨天晚上我还在调优智能问答Agent 提示词的漩涡中焦头烂额。

说起来很是喜欢侯捷老师的《左手程序右手诗》,如果说在技术追求中蕴藏的哲学思考和艺术美感是属于程序员的浪漫,那么经过美酒咖啡洗礼的味蕾便是攻城狮感性与理性的五味杂陈。偶尔提上一斤代码,再倒开壶里二两酒,闲时提笔写写山水道世间冷暖,抬头看花开花落,岂不美哉?!

在这里插入图片描述

二、与AI一起熬过的日月星辰

都说2025年是AI应用落地井喷的一年,在这波席卷全球的AI浪潮中,小马有幸落地了智能问答、AIGC短视频、AI生图、AI编码等业务场景应用,在提效和内容创新上贡献了应有的业务价值。

说起来要从2022年说起,那年小马开始研究基于RAG + Bert的智能问答应用,小马和团队翻阅了大量的相关书籍和教程,最终业务落地。这种将 QA 对语料经过小模型 Embedding 后再基于 Vector 数据库相似度语义匹配召回的方案在当时似乎也显得格外亮眼。

然而 “好景不长”,2023年初Chatgpt横空出世,最新一代AI模型GPT-4在2023年3月14日首发,其涌现的能力再次见证了大模型的可行性和无限性,再次掀起了AI浪潮,业界有人称之为“Chatgpt革命”。此时的RAG + Bert智能问答架构就显得多少有点差强人意,被推翻已然成了历史的大势所趋。全世界都在学习大模型,大模型越来越国际化。

古人云,“磨刀不误砍柴工”,于是小马开始学习NLP,开始学习人工智能基础。对于机器学习算法基础啃得津津有味,渐渐开始明白原来AI中的预测算法模型权重参数就是以前数学上的线性回归函数求导推导出来的函数系数;解决分类问题可以用逻辑回归;贝叶斯可以通过概率生成数据来完成分类;K均值算法可以用来聚类;深度学习的神经网络有CNN、RNN、GAN等等,分别解决着不同的场景需求。一次无意间的遇见,有幸阅读了《深入浅出Embedding》一书,领悟了万物皆可 Embedding 的神奇之处。

慢慢得也开始自己总结一些心得。小马认为AI的本质就是统计学和概率学,模型训练的原理通俗理解就是在大量已知的(x,y)训练数据集语料下,寻找出y=ax+b中的ab系数,这些系数就是模型的权重参数。

古人又有云,“纸上得来终觉浅”,于是小马开始尝试模型的微调训练。起初是对Chatglm模型进行总结能力的特定任务微调,后来也对千问模型进行了QLora微调。在此期间也深刻学习了学习率(Learning Rate)、批次大小(Batch Size)、训练轮数(Epochs)、梯度下降、Loss曲线、过拟合与欠拟合等的概念和原理,在实操中得到了更深的巩固。之后也面临着模型评估的问题,找到了BLEU、Rouge算法与人工反馈的结合最终解决方案。

于是,智能问答最终以RAG + LLM的方案升级落地,在质量和体验上完成了质的飞跃。这看似很简单的一个主流架构,然而面对垂直领域的场景,在各个细节上需要不断打磨是完全免不了的,已经数不清那些在深夜里抬头仰望星空的岁月。如何解决长语料的匹配问题、如何解决召回数据过多对模型token的影响、如何解决多轮对话下的语料匹配召回问题、如何解决无法获取垂直动态数据的问题等等问题总是填满着每一个细节。

2025年的AgentMCP已经日益成熟。于是结合这些主流能力,问答系统加入了Agent ReAct策略,前置采用多路召回结合重排模型精排的方案,后置采用Agent决策自动调用MCP工具获取缺失语料,带上指代消解模型对多轮问题的重组,完美解决了问答系统的各种缺陷,垂直领域问答应用的准确率已经接近98%。

2025年也是AIGC短视频爆发的一年,百度、抖音、可灵、即梦等等各大视频生成平台雨后春笋般屹立。小马总结了视频生产流程:剧本编写 -> 分镜 -> 文生图 -> 图生视频 -> 剪辑 -> 配音,以及总结了一份提示词技巧:提示词 = 主体(主体描述)+ 场景(场景描述)+ 运动(运动描述)+ 影视级美学控制(包含光源、光线环境、景别、视角、镜头、运镜等) + 画面风格(如赛博朋克、3D卡通、像素、二次元、油画等),这套机制屡试不爽,凭借它生产的内容在短视频平台已经涨粉千员。

无独有偶,2025年的AI生图也是一大热点,前段时间谷歌的Nano banana火遍全球,小马和小伙伴们也是通过Comfyui复刻了这一能力,生产的手办图片内容在社区传播火热。Comfyui蕴含的生产潜力的确值得好好研究。

“从前车马慢,一生只够爱一人。从前模型能力差,辅助编码只能瞎指挥。”,显然这后一句是小马加的,小马说的正是 AI编码Copilot。这也是2025年一个炙手可热的话题,随着AI模型能力不断地增强,聪明的程序员当然不会放过让AI为自己打工的机会。小马尝试的基于Spec工作流模式的辅助编码模式非常高效,基于Spec的工作流是一种以结构化文档为核心的软件开发方法,它将开发过程系统地划分为需求分析、技术设计和任务拆分三个阶段,旨在提升AI辅助编程的工程化水平、可追溯性和协作效率。基于Spec的AI编码辅助,确实可以解决AI抽盲盒的困境,将软件开发周期流程拆解,人工与AI交互并干预到每一步的确认,确保生成的代码可控。

总之,对于小马而言,2025年是发散的、是充满收获的一年,智能问答、AIGC短视频、AI生图、AI编码,每一个与AI一起熬过的日月星辰都刻画着它们的痕迹和脚印,闪闪发光。

三、与CSDN一起喝过的咖啡

2025年是与AI驰骋沙场最多的一年也是与CSDN相伴最多的一年,回望创作历程今年共创作了近百篇关于AI的文章。回想起那些场景,在每一场酣畅淋漓的问题解决之后自己都会习惯性地冲上一杯浓浓的咖啡打开CSDN谱写篇章,每一次的键盘敲击声仿佛都充满着胜利的喜悦和自豪。如果还能时不时听到几下嗦溜咖啡的声音,那说明这篇文章小马一定觉得写的甚是满意。

说起来小马的业余爱好除了跑步之外还有两个,一个是写作,另一个还是写作。虽说小马是一名理科生,但是对于那些文绉绉的文字毫无抵抗力。以前一直在某书创作,也写过文采斐然的作品。去年的某个夜晚,小马在编写一篇常规技术文之后在某书发表遭到审核未通过的拦截,这种对技术文不友好的机制不得不让小马另寻他处,这便是小马与CSDN正式结缘的机缘。从此爱上了CSDN Markdown的简洁和社区浓郁的技术氛围,正所谓“术业有专攻”,技术类的文章还得是技术类的平台来做。

“赠人玫瑰,手有余香。”,坚持写文章的益处不仅是利于他人,对于自己也是一种总结能力和表达思维的锤炼。在每一次编写文章的时候,小马都会要求自己将知识体系化整理和总结输出,在此过程中自己也得到了学习提升和巩固。有一次小马收到了读者感谢的私信,在那一瞬间,小马觉得这文章写的还蛮有成就感的。当然,不得不承认那些小勋章也是小马创作的快乐之一,今年累计也有三十好几的勋章个数入账。

都说这个世界上第一快乐的人是不用对别人负责的人,第二快乐的人是从不回头看的人。虽然小马做不到,但是也很快乐。回顾2025年的每一篇文章都是经过实践后的成文,哪怕是原理剖析也是先经过自己理解后再成文,如此便觉得踏实。小马认为未经作者验证直接搬运的内容是对读者不负责任的行为,也希望大家能以此共勉。今年9月,小马过河R的博客通过了平台的人工智能领域新星创作者身份认证,也算是自己对自己的一个肯定,问心无愧。

“你工作不忙吗?怎么还有时间写文?”,类似这样的问题小马也经常收到身边小伙伴的提问,这已经司空见惯了,甚至刚开始的时候免不了自己还会问自己。是的,工作的繁忙很多时候就会给我们没有时间的借口。但是除了那些真的忙的时间之外,是否还有很多时间只是被忙的假象所迷惑,“时间是挤出来的” 这个道理小马觉得说得简单做得难。年终的时候小马也整理了一下今年的战果,呵,不知不觉这一年中已经获取了将近二十来个AI小证书。昨天还拿到了个人第五个半马完赛奖牌。

“我倒是也想写文章,但是我都不知道要写什么?”,这个问题并不难。其实每天进步一点点是小马的小确幸也是小马的自我要求,当你每天都在要求自己进步的时候,你所沉淀的内容一定是涌涌不断的,思路只会取之不尽用之不竭。

2025年CSDN一路见证了每一步成长的脚印。

四、写在最后

新篇已然铺开。

2025年,我们见证了AI从“能用”到“好用”的跃进,也亲历了技术从实验室走向千行百业的落地浪潮。对我而言,这一年是“躬身入局”的一年——在智能问答的迭代中理解语义的深邃,在AIGC的流程里触摸创作的边界,在ComfyUI的节点间看见工程化的魅力,在Spec工作流中重新审视人与机器协作的范式。

这些探索背后,始终离不开两个支撑:一是持续学习与复盘的习惯,二是乐于分享与交流的初心。前者让我在技术浪潮中保持清醒,后者让我在CSDN这样的平台上遇见了许多同路人。写作,对我而言从来不只是输出,它更是思考的磨刀石、知识的凝结核。每一次落笔,都是对某个技术细节的再度追问;每一次发布,都是向社区的一次真诚回响。

“AI不会替代人,只会淘汰不会使用AI的人。”,技术之路,道阻且长。AI的进化不会止步,未来的挑战也许会更加复杂——伦理的边界、技术的可控、创意的归属、人机协同的深层模式……但正是这些开放的问题,让我们保持好奇,保持敬畏,保持推动车轮向前的动力。

感谢CSDN,提供了一个让技术人相遇、相知、相长的园地。
感谢每一位读者,你们的每一次阅读、讨论与反馈,都是这条路上珍贵的星光。
也感谢自己,在每一个寻常或非比寻常的日子里,没有放下笔,也没有停下思考。

2025,是结束,也是开始。
我们下一行代码再见。

© 版权声明

相关文章