天问
大数据
AI
数学
编程
随笔
行业
项目
.
天问
大数据
AI
数学
编程
随笔
行业
项目
.
天问的个人博客
专注前沿科技
在这里更好地写作和阅读
提笔写篇文章
Power by:
上海芝舟信息科技有限公司
天问 · 专注前沿科技
业界 | 百度提出Deep Speaker:可用于端到端的大规模说话人识别
选自Baidu.Research 作者:Chao Li、Ajay Kannan 和 Zhenyao Zhu 机器之心编译 参与:吴攀 对话常常涉及到多个说话人,在这样的场景中,机器需要具备识别不同说话人的能力才能发挥更大的价值。近日,百度的一篇论文提出一种新的端到端的基于神经网络的说话人识别系统 Deep Speaker,实验表明该系统显著...
2017/07/03
ML
0
资源 | 清华大学发布珠算:一个用于生成模型的Python库
选自Github 机器之心编译 参与:吴攀 5 月 27-28 日,机器之心主办的第一届全球机器智能峰会(GMIS 2017)将在北京 898 创新空间举行。在峰会第一天下午的「机器学习」主题 Session 上,清华大学副教授朱军将分享演讲《珠算:贝叶斯深度学习的 GPU 库(ZhuSuan: a GPU Library with Bayesian Deep Lear...
2017/07/03
ML
0
资源 | 从文本到视觉:各领域最前沿的论文集合
选自GitHub 作者:Simon Brugman 机器之心编译 参与:吴攀 深度学习已经在语音识别、机器翻译、图像目标检测和聊天机器人等许多领域百花齐放。近日,GitHub 用户 Simon Brugman 发布了一个按任务分类的深度学习论文项目,其按照不同的任务类型列出了一些当前最佳的论文和对起步有用的论文。机器之心对...
2017/07/03
ML
0
一周论文 | Seq2Seq有哪些不为人知的有趣应用
引言 Seq2Seq 于 2013年、2014 年被多位学者共同提出,在机器翻译任务中取得了非常显著的效果,随后提出的 attention 模型更是将 Seq2Seq 推上了神坛,Seq2Seq+attention 的组合横扫了非常多的任务,只需要给定足够数量的 input-output pairs,通过设计两端的 sequence 模型和 attention 模型,就可以训练...
2017/07/03
ML
0
教程 | 初学文本分析:用Python和scikit-learn实现垃圾邮件过滤器
选自kdnuggets 机器之心编译 参与:王宇欣、吴攀 本文介绍了如何通过 Python 和 scikit-learn 实现垃圾邮件过滤的。对比和分析了两个分类器的结果:多项式朴素贝叶斯和支持向量机。 文本挖掘(text mining,从文本中导出信息)是一个广泛的领域,因为不断产生的巨量文本数据而已经得到了普及。情绪分...
2017/07/03
ML
0
资源 | Facebook开源人工智能框架ParlAI:可轻松训练评估对话模型
选自GitHub 机器之心编译 参与:吴攀、晏奇 Facebook 近日在 GitHub 上开源了一个可用于在多种开放可用的对话数据集上训练和评估人工智能模型的框架 ParlAI,机器之心在本文中对这一项目的 README.md 内容进行了编译介绍。项目地址如下: 官网地址:http://parl.ai GitHub:https://github.com/...
2017/07/03
ML
0
业界 | 谷歌开源深度学习街景文字识别模型:让地图随世界实时更新
选自Google Blog 作者:Julian Ibarz 机器之心编译 参与:李泽南、晏奇 谷歌地图的街景功能拥有 800 亿张高分辨率图片,而且这个数字还在以每天百万的速度不断增加。街景图片是获取准确地理信息的绝佳渠道,而利用深度学习从图片中获取信息,并实时更新地图地址内容正是谷歌研究团队努力的目标。 每...
2017/07/03
ML
0
TensorFlow数据读取机制
TensorFlow读取机制图解 首先需要思考的一个问题是,什么是数据读取?以图像数据为例,读取数据的过程可以用下图来表示: 假设我们的硬盘中有一个图片数据集0001.jpg,0002.jpg,0003.jpg……我们只需要把它们读取到内存中,然后提供给GPU或是CPU进行计算就可以了。这听起来很容易,但事实远没有那么简单。事实上,我们必...
2017/06/30
python
0
4127
数学-计算机专业招聘信息20170628
今天在拉钩网爬了1124个数学-计算机相关职位,数据如下: [table id=6 /] 由于数据量太大,故表格中只有50条 信息,查看完整结果可以点下面下载我整理好的pdf文件。 点我下载
2017/06/28
爬虫
0
集搜客xml合并到csv
集搜客还是很好用的,完全浏览器打开,一步一步打开网页,搜集数据。这种爬虫,往往很难封杀。 集搜客有一些问题,就是不是本地化工具,规则,算法在云端。也就是该公司的核心技术,可以理解。最大的一个问题就是数据默认保存为xml,很多其他爬虫会保存到excel,sql server,hdfs中。那么我最近做了个工具,可以将xml结...
2017/06/28
python
0
点击查看更多