深度学习应用大盘点

发表于编程 2016-11-25 16:04 阅读量: 2,670

当首次介绍深度学习时，我们认为它是一个要比机器学习更好的分类器。或者，我们亦理解成大脑神经计算。

第一种理解大大低估了深度学习构建应用的种类，而后者又高估了它的能力，因而忽略了那些不是一般人工智能应用的更现实和务实的应用。

最好最自然的理解应该是从人机交互角度来看待深度学习应用。深度学习系统似乎具备近似于生物大脑的能力，因此，它们可以非常高效地应用于增强人类或者动物已经可以执行的任务上。此外，需要重视的一点是，深度学习系统与传统的符号计算平台非常不同，正如人类与计算机的计算方式不同一样，深度学习也是如此。

使用深度学习构建应用甚至可以如我们畅想的科幻小说一般。下面我们来分享基于深度学习开发出来的一些不可思议的应用程序：

➤盲人看照片

http://www.wired.com/2015/10/facebook-artificial-intelligence-describes-photo-captions-for-blind-people/

Facebook开发的一个移动应用，可以让盲人或者视力障碍者像正常人一样浏览照片。

➤实时语音翻译

http://blogs.skype.com/2014/12/15/skype-translator-how-it-works/

微软的Skype能够将语音实时翻译成不同的语言。

➤自动回复电子邮件

http://www.wired.com/2015/11/google-is-using-ai-to-create-automatic-replies-in-gmail/

Google的Mail可以代替您自动回复电子邮件。

➤目标识别

http://www.slideshare.net/CdricDeltheil1/moodstocks-mobile-image-recognition-paris-tech-talks-6

Moodstocks（已经被Google收购）推出的智能手机图像识别应用程序Moodstocks Notes，可通过照片识别书籍、CD、海报、传单和酒标等对象。

➤照片定位

https://www.technologyreview.com/s/600889/google-unveils-neural-network-with-superhuman-ability-to-determine-the-location-of-almost/

Google能够根据照片进行拍摄场景定位。

➤照片整理

https://www.youtube.com/watch?v=JuFtW1PSYAU

Google相册可以自动整理分类到常见的主题下面。

➤分类照片

http://engineeringblog.yelp.com/2015/10/how-we-use-deep-learning-to-classify-business-photos-at-yelp.html

Yelp可以根据业务分支对照片进行分类。

➤自动驾驶

https://arxiv.org/pdf/1604.07316v1.pdf

自动驾驶技术应该是深度学习领域最为大家所知的应用了。

➤音乐作曲

http://web.mit.edu/felixsun/www/neural-music.html

可以基于不同的作曲家风格进行音乐组成。

➤绘画

https://nucl.ai/blog/neural-doodles/

可以基于著名的艺术家绘画风格创建。

➤新材料

http://www.nature.com/articles/srep02810

利用深度学习发现新材料。

➤玩电子游戏

http://www.wired.co.uk/article/google-deepmind-atari

Google DeepMind能够创建视频游戏系统，通过观看游戏学习如何玩得很好。

➤Go系统

http://www.scientificamerican.com/article/how-the-computer-beat-the-go-master/

Google DeepMind创建了一个Go播放系统，能够通过对抗自己来学习新的策略。

➤脸部识别

https://cmusatyalab.github.io/openface/

这个就无需解释了。

➤标题党

https://larseidnes.com/2015/10/13/auto-generating-clickbait-with-recurrent-neural-networks/

一种RNN训练，生成吸引眼球的标题。

➤黑白照片变彩色

http://demos.algorithmia.com/colorize-photos/

将黑白照片自动转换成彩色：http://richzhang.github.io/colorization/。

➤文本图像实时翻译

https://research.googleblog.com/2015/07/how-google-translate-squeezes-deep.html

Google的一个移动应用，可将照片中的文字翻译成您可以理解的文字。

➤键盘

http://www.slashgear.com/swiftkey-neural-alpha-predicts-what-youll-type-08408912/

Swiftkey正在构建一种移动键盘，让输入更加简单方便。

➤预测未来

http://news.mit.edu/2016/teaching-machines-to-predict-the-future-0621

看看MIT这些伙计是怎么说的。

➤三维物体分类

http://3dshapenets.cs.princeton.edu/

➤手势识别

https://engineering.purdue.edu/cdesign/wp/deephand-robust-hand-pose-estimation/

使用不同的手势，对没有屏幕的设备进行交互。

➤拍照自动微笑

https://www.engadget.com/2016/06/27/twitter-bot-plasters-creepy-smiles-on-celebrities-faces/

SmileVector可以把一张照片的人，自动转换成微笑的表情的照片。

➤人类对话

https://research.googleblog.com/2016/05/chat-smarter-with-allo.html

例如Google开发的进行自动对话回复的邮件。

➤增强现实——脸部追踪

http://research.baidu.com/happy-halloween-baidu-research-introduces-faceyou/

百度开发的一个应用，能够基于深度学习技术进行面部追踪。

➤仓库优化

https://devblogs.nvidia.com/parallelforall/optimizing-warehouse-operations-machine-learning-gpus/

一个深度学习系统，在仓库中用最佳的方式拿取和放置物品，这种系统明显快于传统的研究方法，并且效率更高。

➤图片搜索

https://news.developer.nvidia.com/using-sketches-to-search-for-products-online

将图像进行视觉搜索查询。

➤Prosetheses控制

http://arxiv.org/pdf/1602.05702v3.pdf

通知脑电图描记器参与提取记录中语音混合物在神经转向听力假肢中的应用。

➤流体模拟

http://cims.nyu.edu/~schlacht/CNNFluids.htm

利用卷积网络创建快速且高度逼真的流体模拟。

➤个性化

http://blogs.aws.amazon.com/bigdata/post/TxGEL8IJ0CAXTK/Generating-Recommendations-at-Amazon-Scale-with-Apache-Spark-and-Amazon-DSSTNE

亚马逊使用深度学习技术来驱动其个性化功能。

➤脑肿瘤检测

https://arxiv.org/abs/1505.03540

在2013年BRATS测试数据集上的报结果表明，802,368参数网络比已发布的最先进的技术改进了超过30倍。

➤省电

http://www.bloomberg.com/news/articles/2016-07-19/google-cuts-its-giant-electricity-bill-with-deepmind-powered-ai

Google正在使用DeepMind人工智能子公司的技术，以大幅节省其数据中心的电力功耗。

➤整理货架

http://www.theverge.com/2016/7/5/12095788/amazon-picking-robot-challenge-2016

类似上面的仓库优化，亚马逊研究人员基于深度学习技术分析3D扫描，让机器人对物品进行整理。

➤摄取街景

http://forum.openstreetmap.org/viewtopic.php?id=55220

Facebook正在利用深度学习技术，从卫星图像上创建更加准确的地图。

➤语音识别

https://www.technologyreview.com/s/537101/deep-learning-machine-solves-the-cocktail-party-problem/

通过声音进行识别。

➤红外彩色化

http://arxiv.org/abs/1604.02245v3

用户可以更加快速准确地理解已经被着色的红外图像。

➤3D设计

http://www.creativeai.net/posts/CjrYHppotnFXbeWW8/learning-semantic-deformation-flows-with-3d-convolutional

现实中的3D打印技术。

➤图合成

https://arxiv.org/pdf/1606.03073v1.pdf

将草图合成真实的面部图像。

➤临床事件预测

http://arxiv.org/pdf/1511.05942v9.pdf

一个RNN训练，8年时间从来自26万患者和14805名医生的EHR数据，该神经网络进行多标签预测（每次诊断或药物类别作为一个标签），该系统可以执行召回鉴别诊断率高达79%，明显高于基线。

➤皮肤评价和建议

http://www.glossy.co/making-it-personal/olay-built-a-skin-evaluation-tool-to-help-drugstore-shoppers

使用深度学习来确定客户的“皮肤年龄”，确定问题领域，并提供旨在解决这些问题的产品方案。

➤生物信息学

http://www.mdpi.com/1422-0067/17/8/1313/htm

药物设计，虚拟筛选（VS），定量结构——活性关系（QSAR）研究，蛋白质结构预测和基因组学（和其他组学）数据挖掘。

除了以上列举的40个应用，作者在原文中还列举了其它领域基于深度学习的应用，大家可以前往原文查看。

原文：40 Ways Deep Learning is Eating the World

作者:Carlos E. Perez > 翻译：Daisy >责编：仲培艺

博客地址：http://blog.yoqi.me/?p=671

喜欢 0

深度学习应用大盘点

这篇文章还没有评论

发表评论点击取消回复