产业智能化的百度经验:飞桨结合智能云,让AI赋能千行万业

  • 时间:
  • 浏览:2
  • 来源:大发1分快3

10月17日-19日,2019年中国计算机大会(CNCC2019)在苏州举办,本届大会以“智能+引领社会发展”为主题,10000家机构的代表、100000余人参展参会。百度首席技术官王海峰在会上发表题为《深度1学习平台支撑产业智能化》的演讲,分享了百度关于深度1学习技术推动人工智能发展及产业化应用的思考,并深度1解读百度飞桨深度1学习平台的优势,以及与百度智能云结合助力产业智能化的成果。

 以下为演讲实录:

     各位专家,各位来宾我们我们我们我们我们我们我们我们我们我们我们我们 上午好!非常荣幸有可能性参加世界计算机大会,非常感谢中国计算机研究会及大会的邀请。今天我跟我们我们我们我们我们我们我们我们我们我们我们我们 分享的题目是《深度1学习平台支撑产业智能化》。

    我们我们我们我们我们我们我们我们我们我们我们我们 都知道,从18世纪1000年代开使,人类可能性经历了三次工业革命。第一次工业革命为我们我们我们我们我们我们我们我们我们我们我们我们 带来了机械技术,第二次带来了电气技术,第三次带来了信息技术。我们我们我们我们我们我们我们我们我们我们我们我们 回顾这三次工业革命的历史会发现,驱动每一次工业革命的核心技术一定会非常强的通用性。确实它可能性是从某还还有一个多行业开使,比如机械技术最开使从纺织等行业开使,但最后一定会应用于生产生活的方方面面,有非常强的通用性。除了通用性以外,這個 技术一定会推动人类进入还还有一个多新的工业大生产阶段,而支撑這個 工业大生产的技术有哪几块特点:标准化、自动化、模块化。而我们我们我们我们我们我们我们我们我们我们我们我们 现在正位于第四次工业革命的开端,人工智能则是新一轮科技革命和产业变革的还还有一个多核心驱动力量。人工智能会推动我们我们我们我们我们我们我们我们我们我们我们我们 人类社会逐渐进入智能时代。

    回顾人工智能技术的发展,人工智能技术的发展阶段有所以分类维度,我理解至少都可不可否归结为:最早期更多一定会在用人工的规则,我26年前进入這個 行的以后,确实也是在用人工规则来开发机器翻译系统;以后逐渐开使机器学习,尤其是统计机器学习,在很长的一段时间里占主流地位,也产生了很大的影响,带来了所以应用产业的价值;深度1学习是机器学习的还还有一个多子方向,现在,深度1学习逐渐成为新一代人工智能最核心的技术。

     举哪几块例子,文字识别OCR技术早期是用规则+机器学习的措施来做,那以后,还还有一个多OCR技术系统可能性会分为几每种,从区域检测、行分割、字分割、单字识别、语言模型解码、后除理等一步步做下来。加入深度1学习技术后,我们我们我们我们我们我们我们我们我们我们我们我们 开使使用大数据进行训练,而且阶段目标也很明确,我们我们我们我们我们我们我们我们我们我们我们我们 找到一些深度1学习的形态学 ,這個 以后还还有一个多OCR系统就繁杂到只必须检测、识别还还有一个多过程,典型的基于深度1学习的OCR系统共以后我原来。随着深度1学习技术进一步发展,我们我们我们我们我们我们我们我们我们我们我们我们 开使在OCR里边进行多任务的联合训练、端到端学习、形态学 复用/互补,這個 以后,甚至這個 个阶段所以 用区分了,所以 一体化地就把还还有一个多文字识别的任务给做了。

     我们我们我们我们我们我们我们我们我们我们我们我们 再看机器翻译。26年以后我进入人工智能领域所以 在做机器翻译,当时我们我们我们我们我们我们我们我们我们我们我们我们 用数以万计的规则写出还还有一个多翻译系统,其中包括所以语言专家的工作。20多年以后,我们我们我们我们我们我们我们我们我们我们我们我们 做的這個 系统曾得到全国比赛的第一,而且這個 系统想继续发展,进入还还有一个多大规模产业化的阶段,仍然面临着所以问题。比如说人工规则费时费力,而且随着规则的增加,冲突也没法严重,挂一漏万,总爱好难把所有的语言问题都覆盖到。以后,统计机器翻译在机器翻译领域位于最主流技术的地位,像百度翻译八年以后上线的第还还有一个多版本的系统,确实所以 统计机器翻译。统计机器翻译的过程当中,仍然要一步一步来做,比如说先做统计的词对齐,而且做短语的提取,再做形态学 的对齐等等,其中也涉及到人工形态学 的提取、定向的优化,仍然很繁杂。至少四年多以后,百度上线了世界上第还还有一个多大规模的、基于神经网络的翻译产品,这以后我们我们我们我们我们我们我们我们我们我们我们我们 都可不可否进行端到端的学习了。当然了,原来还还有一个多神经网络,可能性说是深度1学习的系统,一定会它的缺陷之处,现在真正在线上跑的、每天服务数以亿计人的翻译系统,确实是以神经网络的机器翻译措施为主体,一并融合了一些规则、统计的技术。

    刚才说起,随着深度1学习的发展,這個 技术没法标准化、自动化。我们我们我们我们我们我们我们我们我们我们我们我们 都可不可否就看深度1学习有还还有一个多怪怪的要的特点,所以 通用性。我们我们我们我们我们我们我们我们我们我们我们我们 以后做机器学习的以后,有非常多的模型我们我们我们我们我们我们我们我们我们我们我们我们 都耳熟能详,比如说SVM、CRF等等。深度1学习总爱出现以后,我们我们我们我们我们我们我们我们我们我们我们我们 发现,几乎我们我们我们我们我们我们我们我们我们我们我们我们 就看的各种问题它都能很不错的除理,甚至能得到目前最佳的除理效果,这和以后的模型各有擅长不一样,它具有很强的通用性。

    深度1学习位于的位置,一方面它会向下对接芯片,像我们我们我们我们我们我们我们我们我们我们我们我们 开发的深度1学习框架,也会跟各个芯片厂商联合进行优化,前天我们我们我们我们我们我们我们我们我们我们我们我们 还跟华为芯片一并做了还还有一个多联合优化的发布;向上它会承接各种应用,不管是各种模型,还是真正的产品。所以我们我们我们我们我们我们我们我们我们我们我们我们 认为深度1学习框架会是智能时代的还还有一个多操作系统。

     我们我们我们我们我们我们我们我们我们我们我们我们 真正把深度1学习大规模产业化的以后,也会面临一些要除理的问题,比如说,开发原来还还有一个多深度1学习的模型可能性是系统,实现起来很繁杂,开发速度很低,也很不容易;而在训练的以后,我们我们我们我们我们我们我们我们我们我们我们我们 在真正工业大生产中用的這個 模型,比如说百度的产品,一定会非常庞大的模型,进行超大的模型训练很困难;到了部署阶段,必须考虑推理速度是一定会够快,以及部署成本是一定会可控合理。

    针对这哪几块方面,我们我们我们我们我们我们我们我们我们我们我们我们 开发了百度的深度1学习平台“飞桨”,英文我们我们我们我们我们我们我们我们我们我们我们我们 叫PaddlePaddle。我们我们我们我们我们我们我们我们我们我们我们我们 认为它可能性符合标准化、自动化、模块化的工业大生产形态学 。

    飞桨底层的核心框架包括开发、训练、预测。开发既都可不可否支持动态图,也都可不可否支持静态图;训练都可不可否支持大规模的分布式训练,也都可不可否支持這個 工业级的数据除理;一并都可不可与否不同版本部署在服务器上、在端上,以及做非常高效的压缩、安全加密等等。核心框架之上有所以基础模型库,比如说自然语言除理的基础模型库、计算机视觉的基础模型库等等。一并也会提供一些开发的套件,再往上会有各种工具组件,比如说网络的自动训练、迁移学习、强化学习、多任务学习等等。此外,为了真正支撑各行各业的应用,我们我们我们我们我们我们我们我们我们我们我们我们 提供所以使用者不必须理解底层這個 技术、都可不可否直接调用的服务平台。比如EasyDL,所以 都可不可否定制化训练和服务的,基本上都可不可否不必了解深度1学习身前的原理,零门槛就都可不可否用它来开发一些人的应用;AIStudio则是还还有一个多实训平台,所以大学也在用原来的平台上课、学习;当然,还包括端计算模型生成平台。

    飞桨是还还有一个多非常庞大的平台,我们我们我们我们我们我们我们我们我们我们我们我们 着重在四方面发力、且具有领先性的技术。

    首先从开发的深度1,我们我们我们我们我们我们我们我们我们我们我们我们 提供还还有一个多开发便捷的深度1学习框架;而从训练的深度1,都可不可否支持超大规模的训练;从部署的深度1,都可不可否进行多端、多平台的高性能推理引擎的部署;一并提供所以产业级的模型库。

    从开发的深度1,飞桨提供还还有一个多开发便捷的深度1学习框架。一方面,我们我们我们我们我们我们我们我们我们我们我们我们 知道這個 软件系统一定会所以进程员在写,进程员有一些人写进程的习惯,我们我们我们我们我们我们我们我们我们我们我们我们 這個 组网式的编程范式与进程员的开发习惯非常一致,进程员开发起来会很有速度,而且也很容易上手;另外还还有一个多方面是设计网络形态学 ,深度1学习发展所以年,多数深度1学习的系统网络一定会人类专家来设计的,而且,设计网络形态学 是很专、很不容易的一件事情。所以,我们我们我们我们我们我们我们我们我们我们我们我们 开发网络形态学 的自动设计。现在机器自动设计的网络,在所以状况下可能性比人类专家设计的网络得到的效果还好。

     原来方面,大规模训练面临的挑战。飞桨支持超大规模的形态学 、训练数据、模型参数、流式学习等等。我们我们我们我们我们我们我们我们我们我们我们我们 开发的这套系统现在可能性都可不可否支持万亿级参数模型,不止是能支持原来的训练,一并都可不可否支持实时的更新。

     说到多端多平台,飞桨能很好的支撑从服务器到端、不同的操作系统之间,甚至不同框架之间的无缝衔接。这里是一些具体的数据,我们我们我们我们我们我们我们我们我们我们我们我们 都可不可否就看,我们我们我们我们我们我们我们我们我们我们我们我们 通用架构的推理,它的速度是非常快的。一并,刚才我提到的跟华为的公司协作 ,我们我们我们我们我们我们我们我们我们我们我们我们 针对华为的NPU做了定向的优化,使它的推理速度得到进一步的提升。

     另外一方面,所有這個 基础框架,与真正的开发应用之间还有一步,我们我们我们我们我们我们我们我们我们我们我们我们 定向地为不同的典型应用提供所以官方的模型库,比如说语言理解的、增强学习的、视觉的等等。飞桨的這個 模型一定会大规模的应用中得到过验证,一并我们我们我们我们我们我们我们我们我们我们我们我们 也在一些国际的比赛中测试了這個 模型,夺得了所以个第一。

     刚才讲的是基本的框架模型等等,一些人面,我们我们我们我们我们我们我们我们我们我们我们我们 还有完备的工具组件,以及面向任务的开发套件,以及产业级的服务平台。

     举哪几块例子,比如说语言理解,我们我们我们我们我们我们我们我们我们我们我们我们 知道现在语言理解,我们我们我们我们我们我们我们我们我们我们我们我们 也都基于深度1学习框架来做,像百度的ERNIE。一方面,我们我们我们我们我们我们我们我们我们我们我们我们 现在用的深度1学习技术是从海量的数据里进行学习,而且它没法知识作为前提。百度开发了还还有一个多非常庞大的,有10000多亿个事实的知识图谱,我们我们我们我们我们我们我们我们我们我们我们我们 用知识来增强基于深度1学习的语言理解框架,就产生了ERNIE。一些人面,我们我们我们我们我们我们我们我们我们我们我们我们 又加入了持续学习的技术,从而让ERNIE有还还有一个多非常好的表现。下面浅淡蓝色的线是现在SOTA最好的结果,我们我们我们我们我们我们我们我们我们我们我们我们 用ERNIE+百科知识——我们我们我们我们我们我们我们我们我们我们我们我们 知识图谱一定会所以来源——加在以后,我们我们我们我们我们我们我们我们我们我们我们我们 都可不可否就看有很明显的提升。我们我们我们我们我们我们我们我们我们我们我们我们 更高兴地就看,持续加入不同的知识,比如加入对话知识、篇章形态学 知识等等,這個 系统还都可不可否进一步提升它的性能。

     这是前面讲的一系列套件之一,都可不可否零门槛进入的定制化训练和服务平台。我们我们我们我们我们我们我们我们我们我们我们我们 這個 平台,希望能降低门槛,帮助各行各业来加速整个技术创新。现在共以后我這個 状况呢?现在我们我们我们我们我们我们我们我们我们我们我们我们 可能性服务了1000多万的开发者,其中包括超过6.7万个企业。在這個 平台上,我们我们我们我们我们我们我们我们我们我们我们我们 一些人训练了可能性有16.9万个模型。

     飞桨深度1学习开源开放平台跟百度的智能云一定会很好的结合,依托云服务更多的客户,让AI都可不可否赋能各行各业。这里有一些例子,比如说在农业,我们我们我们我们我们我们我们我们我们我们我们我们 帮助水培蔬菜的智能种植;在林业,帮助病虫害的监测识别;以及公共场所的控烟、商品销售的预测、人力资源系统的自动匹配、制造业零件的分拣,以及地震波、藏油预测,以及更广泛地覆盖通讯行业、地产、汽车等等领域,各行各业都基于這個 平台都得到了智能化的升级。

    比如水培蔬菜智能种植,我们我们我们我们我们我们我们我们我们我们我们我们 通太浅度1学习平台支持它进行长势分析、水培方案的精调、环境的控制,使产量得以提高,一并成本得以降低。智能虫情监测也是一样,系统的识别准确率可能性至少人类专家的水平,而且监控的周期也从一周缩短到一小时。

    精密零件智能分拣的案例中,我们我们我们我们我们我们我们我们我们我们我们我们 真正用這個 深度1学习系统的以后,还是有不少事情要做,比如说如保选者分拣的模型,里边也会涉及一些数据的标注,尤其是一些错误case的积累等等,而且在飞桨平台上进行训练升级。

    这是还还有一个多工业安全生产监控的例子,昨天在原来会上,有还还有一个多来宾问我,我们我们我们我们我们我们我们我们我们我们我们我们 怪怪的想在一些场景下,监控一些不当的环节,比如说生产环境里打手机、抽烟、跃过护栏等等。這個 都都可不可否通过飞桨的平台自动实现。

    在一些的行业中,比如国家重大工程用地的检测,健康智慧司法,以及AI眼底筛查一定会应用飞桨,还有所以温度的案例,比如AI寻人,还还有一个多孩子4岁的以后离家走失,27年以后,通过人脸比对技术,又帮助這個 家庭把孩子找回来了,实现了家庭的团聚。截止到今年6月,百度AI寻人可能性帮助6700个家庭团圆。除此之外,还有AI助盲行动、AI助老兵圆梦等等這個 案例。

     回到深度1学习,刚才我说,各行各业一定会从其中受益,实现一些人的智能化升级。这是还还有一个多第三方的报告,我们我们我们我们我们我们我们我们我们我们我们我们 都可不可否就看,深度1学习给不同的行业一定会带来提升,平均共以后我62%的水平。

     这所以 我今天要分享的。百度的飞桨深度1学习平台非常想要跟我们我们我们我们我们我们我们我们我们我们我们我们 一并,帮助我们我们我们我们我们我们我们我们我们我们我们我们 实现一些人行业的智能化升级,推动人工智能的发展,谢谢我们我们我们我们我们我们我们我们我们我们我们我们 !

本文属于原创文章,如若转载,请注明来源:产业智能化的百度经验:飞桨结合智能云,让AI赋能千行万业http://news.zol.com.cn/729/7299014.html

news.zol.com.cn true http://news.zol.com.cn/729/7299014.html report 8775 10月17日-19日,2019年中国计算机大会(CNCC2019)在苏州举办,本届大会以“智能+引领社会发展”为主题,10000家机构的代表、100000余人参展参会。百度首席技术官王海峰在会上发表题为《深度1学习平台支撑产业智能化》的演讲,分享了百度关于深度1学习技术推动人工智能发展及...