AI技术要实现应用,首先数据要达到一定的体量,此外算力也要能支持大规模的模型训练,而后算法方面需要达到一定的精度,端侧算力也要具备一定的推理能力。
之所以目前只有消费互联网公司在大规模应用AI算法技术,主要是在这三方面消费互联网公司都更具优势。
——朱鹏飞 天津大学智能与计算学部副教授
近日,知名人工智能学者吴恩达发表文章,阐述了他对于人工智能在传统行业中应用缓慢的理解。无论是刷短视频时的个性化推荐,还是外卖配送时的耗时预估,或者是移动支付时的人脸识别,以算法为代表的AI技术在消费互联网行业被应用得“得心应手”。然而提到传统行业,人们却很难快速想起非常成熟的应用人工智能的典型案例。为何AI技术在传统行业的应用速度和范围远不如消费互联网等行业?
消费互联网行业应用AI更具优势
“AI技术的应用主要取决于数据、算力和算法。”天津大学智能与计算学部副教授朱鹏飞介绍,首先数据要达到一定的体量,这是应用的基础,此外算力也要能支持大规模的模型训练,而后算法方面需要达到一定的精度,端侧算力也要具备一定的推理能力。
之所以目前只有消费互联网公司在大规模应用AI技术,主要是在这三方面消费互联网公司都更具优势。
前些年短视频并没有现在这么火爆,例如发展初期的淘宝,也并没有很强的用户黏性。而随着推送越来越精准,用户的体验感也得到了极大的提升,最终呈现井喷式的用户增长。
“精准推送主要依赖于算法精度的提升,而算法精度的提升又离不开海量的数据作为基础。”朱鹏飞解释,在这个单一的场景中,算法模型需要不断进化,终身学习。由于不是封闭数据环境,总有新的数据加入,算法模型需要不断通过学习进行调整、迭代升级,使其精度越来越高,形成一个良性循环。
“与此同时,虽然目前消费互联网行业在算法精度上已经上升到一定的高度,但相比一些传统行业的应用场景,消费互联网行业对于AI算法精度接受的阈值都比较低。比如短视频、淘宝偏好推荐、百度热搜关键词,只需要达到用户产生黏性的目的,只要有一定准确性,用户都可以接受。”朱鹏飞表示,相比之下,在很多传统行业,对于技术精度的要求就高得多。比如基于视觉的AI技术在人脸识别方面的应用,在高铁站、飞机场核实身份,1∶1的比对准确度要高达99.99%甚至更高才可以进行应用。
在算力方面,目前云端算力已经可以支持大规模模型训练和推理,比如短视频、淘宝推荐等。但在大量传统行业应用场景中,智能终端上的端侧算力还无法满足推理的实时性和准确性要求。
“相比于社交网络和电商系统,传统行业应用场景的封闭生态系统使得云端算力无法得到有效应用。”朱鹏飞举例说,以智能无人系统巡检为例,电力巡检、管道巡检、交通巡检、河道巡检以及光伏巡检等要求搭载在无人机和机器人上的算力满足实时巡检要求,由于视频分析的模型复杂度较高,端侧往往无法实现精准高效的实时推理,轻量级网络在满足实时性的同时损失了识别精度。由于算法精度达不到使用要求,使得在很多场景中无法实现AI技术的应用。
传统行业应用AI面临三大挑战
吴恩达认为,在AI应用方面,消费互联网行业之外的其他行业都面临着三大挑战:数据集很小;定制化成本很高;从验证想法到部署生产的过程很长。
对此,朱鹏飞也深有感触,他以传统制造业为例进行了分析。
“传统制造企业在制造向智造转型的过程中,数据是一个很突出的问题。”朱鹏飞介绍,首先在数据的获取方面存在一定难度。传统制造企业的数据是封闭的,因为很多传统企业并不是新型信息化设备,没有传感器收集实时数据,也没有数据中心,因此数据零散,缺失严重,很难获取像消费互联网企业里那种海量、高质量的数据。
其次,行业内部各个工厂的数据很多具有商业价值,因此工厂都严格保密,这导致数据不流通,没有办法进行共享,进而形成了数据孤岛效应,影响了AI算法模型的优化。
“我们在开发一个AI算法模型的时候,因为数据的保密性,往往得到的数据都是经过‘脱敏’的,这也严重地影响了我们的判断。而传统行业的企业中,又缺乏具有AI算法模型开发能力的技术人员,因此双方在合作研发过程中也存在着很高的壁垒。”朱鹏飞说。
此外,传统行业中的数据来源并不像消费互联网领域那样来自单一场景,复杂的业务场景导致数据往往很“脏”,必须进行“清洗”,去掉大量无效信息,AI算法模型才能高效率的学习以提高精度。“这就像我们教小朋友知识,只讲知识点,小朋友们才能学得快,如果在知识点中夹杂着大量无用的信息,小朋友无从分辨,学习效率肯定降低。”朱鹏飞介绍,而给数据标注“知识点”的工作是巨大而繁琐的,需要企业有专人去做,要花费很多时间精力。
“传统制造业要想获得高质量的数据,就必须对生产设备进行信息化、智能化的改造。”朱鹏飞表示,这种改造需要企业投入大量的时间和精力,还会增加生产成本,这也成为AI在传统制造业中应用的壁垒。
高质量数据是应用前提
过去这10年,大部分AI的研发和应用是“以软件为中心”驱动的。在海量数据的支撑下,不断优化软件和算法,来获得更高的算法精度。在传统行业无法提高数据质量和数量的情况下,吴恩达认为,传统行业应该采用“以数据为中心”的模式,把重点放在获得质量更好、匹配度更高的数据上。
“在这种思路下,传统行业也涌现了一些不错的应用案例。比如医学领域的影像识别AI系统,可以帮医生‘看’CT影像片子,对肿瘤等病变加以识别,辅助医生做出判断。”朱鹏飞介绍,由于很多数据都由专业的放射科医生在影像片子上进行了标注,因此数据比较准确,AI算法模型在学习的过程中进步很快。目前很多影像识别系统的准确率都能达到90%以上,由于是辅助医生,最后还需医生做医疗决策,但这个水平的准确率在很大程度上降低了医生的工作强度。
“尽管传统行业有了一些应用AI技术的成功案例,但是要想更好地和AI结合,还得在提高数据质量方面下功夫。”朱鹏飞建议,首先对于已经积累了海量数据的传统行业,在保证数据安全的前提下,主动开放数据。挖掘数据中蕴藏的价值,和需求关联起来,会有很大的发展空间。其次,对于新兴行业,比如新能源汽车等,在构建智能工厂规划的时候,就把获取数据、智能化的因素考虑进去。
不过朱鹏飞强调,在传统行业用好AI技术的同时,也不要滥用AI技术,在应用前做好评估,如果不能提高生产效率,对行业整体有所提升,那么盲目强行使用AI技术,就是对资源的浪费。“比如一些应用场景需要AI算法达到99%以上的精度才可以使用,通过评估,现有模型算法只能达到90%的精度,那么这个场景就没必要强行上马AI技术了。”
“总而言之,对于AI技术的应用要数据先行,有高质量的数据再谈应用,没有好的数据很难有好的应用。”朱鹏飞说。(陈 曦)
- 降准仍有一定空间,房地产市场回归常态
- 陈吉宁:鼓励多元主体参与街区更新和商圈升级
- 5G基础设施建设高效推进,北京已累计建成5G基站4521个
- 新房促销加大分流 北京二手房怎么走
- 议价空间仍在 北京二手房要反弹?
- 市场量价齐跌 租金指数环比下跌1.3%
- 越南队将帅齐表态:大年初一主场战胜中国队为球迷献
- 格雷格·哈迪vs谢尔盖·斯皮瓦克转移到UFC 272举行
- 马卡罗内:国米赛季目标是赢意甲和意杯 利物浦并非
- 现役球员中谁让你想起了自己?麦迪:乔治和杜兰特
- 队记:休赛期绿军管理层曾提出激进举措 史蒂文斯选
- 佩服!场均轰25+10+7,赛季已斩获4次三双,他身高
- 国产汤普森!第2阶段三分92中45领跑全联盟!杜锋该
- 同意吗?老詹无法拿到MVP,皮尔斯给出预测:湖人战
- 33秒20,博尔特接班人复出首秀创300米pb,他才是当
- 险象环生!交易威少+解雇主教练沃格尔,湖人距离崩
- 吹早了!直通赛4-2樊振东的大黑马惨遭一轮游,球迷
- 阿尔特塔:比赛延期的规则一开始就应明确,我们会捍
- 三分帅!原帅9记三分创赛季新高 生涯第4次单场至少
- 小红书,凭什么成为吸引运动员的新赛道?
- 天津7年不胜北京纪录被打破,北京名宿怒批雅尼斯:
- 官方:中央陆军先租后买签下里尔中场亚兹齐,米兰曾
- 时隔8天!郭艾伦发文道歉,高诗岩用表情包回应,球
- 安帅:库尔图瓦明天不会出场;贝尔将随队出征
- 拉波尔塔出席亨托葬礼:从他身上我领悟到了皇马巴萨
- 真拼了!米切尔被撞成脑震荡,沃格尔有苦衷,湖人不
- 助力北京冬奥会 中国冰雪大篷车开入赣州古街
- 马丁内斯:梅西是我最好的队友,他激励我成为更好的
- CBA又一小姚明陨落!6战5场0分
- 4中0单场1分!CBA最差大外援是他?
- 西甲一周资讯|皇马西超杯夺冠;费兰-托雷斯巴萨首
- 2022年卡塔尔世界杯球票开始预售,最低票价约70元人
- 【封面独家】教授诗人向以鲜为“诗圣”作传 44万字
- 北京冬奥会的雪为什么是人造的?
- 《年年有戏》打造“戏曲大观园” 朱迅李思思王冰冰
- 马刺为什么要放走这名冠军射手?
- 每体:阿劳霍希望涨薪续约,未来几周对于达成协议非
- 3-1!林高远拒爆冷,国乒球星进8强+怒吼庆祝,刘国
- 记住失败,也忘记失败
- 3-1迎来开门红!单局轰11-4,林高远表现强势,晋级
- 阿尔维斯:希望梅西在巴萨退役!哪怕梅西38岁我也会
- 2022格莱美音乐奖颁奖典礼推迟至四月 将首次在拉斯
- 战国对襟袍服是啥样的?来成博欣赏华夏服饰之美
- 拼命三年270万,躺赢六年1.24亿,他就是球迷最酸的
- 专家:掘金交易后的薪资低于税线150万美元 绿军高
- 美国CNN关注威姆斯遭辽蜜种族歧视:被骂滚出中国
- 解除停赛请求被驳回 韩短道速滑冠军无缘北京冬奥会
- 封面独家|“广告大师”叶茂中生前遗作曝光 曾想用
- 下午3点!国足29人名单呼之欲出,郑智新身份确认,
- 顾长卫《刺猬》首曝预告 葛优王俊凯演忘年交结成最
- 国文物局局长会议以电视电话会形式在京召开
- 改善攻击力!皇马送1亿先生赴巴黎,决心购当世两大
- 字母哥,又一座DPOY?
- 忘恩负义!欧文爆粗回应骑士球迷,后者:没勒布朗你
- 3笔交易失败!湖人完了,芭比Q了
- 科尔:库明加会多打小球阵容的中锋 库里在场上安排
- 自主滑雪机器人助力“科技冬奥” 实现自主快速稳
- 文字里的庭院只剩路牌,老房要有生命的“留”
- 契合书斋趣味者,皆可作为“花器”
- 建设全球顶尖学术机构,文化设施要跟上
- 京剧大家口传心授,出人出戏相辅相成
- 自得其乐的“表情”漫笔,与为人熟知的历史大画一脉
- 上音校园将拆除围墙 助力上海文化品牌建设
- 用心用情讲好红色故事,原创领域不断涌现“中国红”
- 网络苦“水军”久矣 治理“水军”要打到“七寸”
- 深入挖掘辽宁长城文化内涵成基础
- 考古学国家急需高层次人才培养专项”启动 加强人
- 明确规定保护管理人制度 全时段全领域保护
- 北京市新闻出版局公布2021年北京市实体书店扶持项目
- 皇马队史最差引援!西媒统计阿扎尔本赛季的西甲数据
- 退役了!帕森斯坑了三支球队,9年的NBA生涯他赚到多
- 孙兴慜:富安健洋和南野拓实都十分出色,同来自亚洲
- 北青:国足明日对抗赛后圈定25+4人名单 郑智身份
- 王蔷张帅领衔出战 五名中国女将均晋级澳网次轮
- 总台20余位主持人梦幻跨界 《年年有戏》打造沉浸式
- 新青年·上封面丨从影视到舞台 演员沈佳妮:挑战自
- 舍得酒业发布2021年年度业绩预增公告 净利润同比
- 中青宝公司披露《关于公司全资子公司股权收购暨关联
- 全渠道布局,“伟哥”白热化竞争市场
- 酒鬼酒发布业绩预告 实现盈利87300万元-94300万元
- 味知香年夜饭礼盒销售火热 半成品菜新鲜吗?
- 沪媒:41岁郑智拍了球员定妆照,可能为国足出场
- 找找状态!沃克复出13中6得到19分 末节命中3记三分
- 非遗产业从事者惠施祥的“希望投递站”|口述民俗·
- 英媒:小贝旗下的迈阿密国际有意引进苏亚雷斯
- 准三双!兰德尔15投6中&罚球11中9得到21分9板9助2断4帽
- 湖人主帅沃格尔遭受质疑,惨败爵士后险被解雇,现在
- 微软发布声明:现金收购动视暴雪
- 降准仍有一定空间,房地产市场回归常态
- 小制作的新可能 国产剧迎新“开端”
- 英国自动驾驶技术初创公司Wayve宣布完成一轮2亿美元
- 一起教育科技发布2021年第三季度财报 净收入同比
- 外媒:LG显示主要供应苹果的iPhone和iPad
- 苹果新处理器M2、M1 Quadra曝光 20核CPU+64核GPU
- 11/12代酷睿无法播放4K蓝光 不再支持SGX指令集
- 从抽签分组预测冠军!马龙进死亡之组,陈梦女单夺冠
- 英超:布伦特福德遭遇2连败状态低迷,曼联队内不和
- 第二阶段后最有可能下课的5位主帅:阿的江在列,徐
- 莫雷诺太狠了!连续6场被弃用,武磊太苦了,队友创
- 此前网友让豪斯让出4号 后者近日回击:睡前在下半
- 凯塔世界波,几内亚1-2不敌津巴布韦小组第二出线
- 沙特媒体:亚冠冠军利雅得新月有意签下莫德斯特
- 北京2022年冬奥会和冬残奥会记者培训及誓师仪式举行
- 【转会】AC米兰看中热刺中后卫遭尤文图斯抢劫,买个
- 西班牙人平之不武?对手2球被吹+漏判点球,新帅暴
- 澳网正赛第二日,张帅王欣瑜闯过首轮