上海2017年4月1日电 /美通社/ -- 近期,由七牛云组织的的架构师小组交流会在线上举行,Polarr 联合创始人宫恩浩、搜狗大数据总监高君、七牛云 AI 实验室负责人彭垚参加了活动,讨论中三位分享人对深度学习框架选型、深度学习的未来趋势展开了交流和探索。
分享开始,Polarr 联合创始人宫恩浩介绍了Polarr(国内叫泼辣修图),Polarr在美国是做图片大数据的,有云端,也有手机端,PC 端,Polarr通过 App 收集数据,建立优化的算法,我们在云端提供图片整理、图片选择、图片信息的识别,把识别的模型通过压缩手段,把整个深度学习放在手机的 App,实现图片裁定、识别、选择、渲染,在这当中会应用到很多深度学习的功能开发。随后介绍了自己在网络压缩方面的做法:首先,要找到一个最适合的架构,这部分得根据具体的应用、性能要求来定。其次,是网络压缩,在不改变模型效果前提下尽量减少模型参数。最后,是模型编码,Polarr 有在做想把图像识别的 Network 放在手机上,那么首先基于模型压缩。具体实现的方法是:每步迭代的时候,一部分把小的部分变成零,然后不断迭代优化,最终模型还有一些优化,会小很多。然后同时还可以在手机上 Network 优化编码,我实验的时候权重也可以从原来的 32 位 float,变成 16 位,就是少了一半,或者是变成 8 位的话做了 encoding 就会小很多,基于这些(优化模型结构,阈值让模型稀疏,编码来减少存储)就可以不断进行压缩。
搜狗大数据总监高君给大家分享了在广告领域深度学习的应用案例。他表示,搜狗从用户端的产品来讲,有两个产品与深度学习有较强关系,一个是语音识别,应用在输入法,用于语音输入转文本,另一个是图像搜索。搜狗推荐是以推荐结构化数据和推荐非结构化数据两种都有的模式,对于搜索广告来讲,它是有一个明确的查询词,你可以理解为是一个结构化。假设把文本理解为结构化,那么对于展示类的广告就很复杂了,为了提高线上的 CTR,需要明确用户的兴趣,那么处理用户兴趣的过程中,它的数据差异非常大,肯定会用到搜索,但是也会用到它站内的一些浏览的行为,比方说我们拿到客户站内所有的数据,它整个数据的来源很复杂。所以对于展示类广告来讲,可以认为所有的处理的数据基本都是异构的,可以理解为是个非结构化的问题。
最后,七牛云 AI 实验室负责人彭垚分享了七牛AI 方面的战略,他表示,七牛是一个以云存储起家的公司,在七牛云平台上面有广泛的图像、视频、音频的数据,富媒体客户非常多,所以七牛云AI 实验室的主要职责是对大量的富媒体数据去做分析,并做一些内容审核,识别等相关领域的应用,以服务我们平台上面的客户。包括像视频分析之类的,包括一些视频通用检测的一些功能,我们会致力于解决我们平台上客户的实际问题来投入这方面的研究,主要是视频分析领域,因为我们存储上面视频非常多,视频的细粒度检测也是其中的一个重点方向。
深度学习是人工智能发展的一个里程碑,虽然深度学习已经在语音识别、图像识别、预测分析、机器翻译等领域小试身手,从三位专家分享的技术方向来看还深度学习的技术处在初级阶段。谁也不能保障深度学习在未来是否能够成为人工智能最基础的方法,或许会有新的更好的技术替代深度学习,但是可以肯定的是,人工智能的梦想不再遥远,机器将在不久的将来像人类一样思考。
关键词: