智能运维(AIOps)系列之五:误区总结
智能运维是一套复杂的人工智能解决方案,也是一个庞大的系统工程。除了涉及到 业务、产品、技术 之外,还涉及到 管理/组织架构 和 产品运营。
接下来介绍的几点,都是实际工作中遇到的问题
人工智能的误区
人工智能教训总结:https://blog.csdn.net/micklongen/article/details/121030011
现阶段,很多人对人工智能都抱有理想化的情况,比如说能 自动学习 等等。
自动化学习都包含哪些技术
- 迁移学习
- 两个维度,四种情况
- 数据域:源域,目标域
- 任务类型:源任务,目标任务
- 两个维度,四种情况
- 元学习
- 模型的参数自调整
- 针对初始化参数
- 针对学习率
- 针对网络结构
- 等等
- 模型的参数自调整
- 预训练模型
- 经典例子:BERT
- 总结
- 现阶段,比较成功的应该是预训练模型;其他的几种类型,限制条件都比较大;
行业发展现状
- 推荐系统
- 基于专家系统/知识工程的算法:推荐系统数据冷启动问题;
- 基于物品内容的算法:推荐系统物品等启动问题;
- 协同过滤算法(用户/物品):挖掘用户新的兴趣点;
- 智能问答
- 通用的智能问答系统,目前还处于研究阶段;
- 一般情况下,智能问答相关的技术,用在推荐引擎,可能效果会更好一些;
为什么要重点提出这些
人工智能从一开始,目标就是为了开发出一个通用的系统,但是几十年发展下来,越来越倾向于解决垂直领域的问题,甚至是垂直领域中的一个问题,目的就是为了落地。
智能运维从2016年开始提出,一开始也是期望一个算法或者几个算法就是无监督的解决特定的问题(比如说KPI),到最新的发展阶段,已经抛弃的这些思路,开始倾向于深入业务去解决问题。
推荐系统,智能问答也是。
智能运维在开始阶段,不要把资源浪费在寻找通用的算法或者解决方案,而是应该深入业务,解决业务中的一个痛点或者几个痛点,以点带面。
我个人认为,智能运维落地并不难,就像推荐系统,最简单的思路就是热点推荐,是个开发人员都能做。
智能运维需要尽快通过落地,积累数据,深入了解业务,以及跟用户产生互动,才有机会往更加深远的领域发展。
管理/组织架构
- Leader:leader 是整个项目落地的关键。因此 leader 最好是一个懂技术的人。如果 leader
是业务出身,不懂技术,那么带来的最大问题就是:- a. 很容易想当然,觉得实现一个功能没什么大不了的;
- b. 就算把功能实现了,也没有能力体系化,产品化,只是孤立的把一个功能看成是一个功能;
- c. 大部分业务,还是很排斥学习技术;
- 偏工程领域的工程师;
- 算法工程师
- 最好要有产品经理:智能运维还是蛮新颖的东西,不像监控已经很成熟了。如何让用户有好的产品体验,决定了项目成熟周期的长短、甚至是成败。
产品运营
- 收集初期目标用户的需求;
- Demo开发,确认;
- Demo产品化;
- 验证产品的有效性:可以通过混沌工程
- 建立用户的反馈机制
- 产品文档,测试用例
- 产品使用答疑群:可以把目标用户、潜在的目标用户拉到群里
- 平时跟用户多沟通,了解用户的使用体验;