2016 年人工智能的研究领域,发生了两件大事。
一是MIT 的教授,人工智能研究的先驱者,Marvin Minsky 去世。紧接着三天后,谷歌公开发表论文,宣布以深度学习技术为基础的电脑程序 AlphaGo成功问世, 并在后续的人类挑战中战胜了世界冠军李世石,引发全球哗然。
曾被认为是竞技领域计算最复杂的项目围棋也被机器攻略,这让人们心里多少有些失落,但也充分的认识到了人工智能无限发展的可能。
尤其是互联网时代,智能AI的前沿技术将为我们提供更多的新思路。
什么是机器学习
机器学习是人工智能的一个分支,简单来说,机器学习就是通过算法,使得机器从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测。
机器学习的发展大致经历了两次浪潮:浅层学习(Shallow Learning)和深度学习(Deep Learning)。
深度学习在学术界升温很快。现在Google、微软、百度等知名企业争相在此投入资源,因为它们都看到了在大数据时代,海量数据背后所承载的丰富信息与未知的秘密。
深度学习与大数据
深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。
所以“深度模型”是手段,“特征学习”是目的。利用大数据来学习特征,能更好刻画数据丰富的内在信息。
所以,在未来的几年里,我们将看到越来越多的例子:在很多的大数据应用中,运用更强大的深度模型,从大数据中发掘出更多有价值的信息和知识。
机器学习在内容安全领域的应用
语音识别
语音识别系统最早采用的是混合高斯模型(GMM)。这种模型由于估计简单,很适合海量数据训练而被广泛应用,但这种模型在能力上还稍有缺陷。
2011年微软宣布基于深度神经网络的识别系统取得重大突破,彻底改变了语音识别原有的技术框架。在实际线上服务时,能够无缝地和传统的语音识别技术相结合,大幅度提升了语音识别系统的识别率。
图像识别
图像是深度学习最早尝试的应用领域。目前已经可以成功应用于自然图像识别和人脸识别等问题上,深度学习的不但大大提升了准确性,而且避免了人工特征抽取的时间消耗,从而大大提高了计算效率。
自然语言处理
除了语音和图像,深度学习的另一个应用领域问题是自然语言处理(NLP)。但深度学习在NLP上取得的进展没有在语音图像上那么令人影响深刻。
一个很有意思的悖论是:语言是完全由人类大脑产生和处理的符号系统,但模仿人脑结构的人工神经网络却似乎在处理自然语言上没有显现明显优势?
这个问题还需要科学家们进一步研究,相信还有更多的未知供我们探索。
“大数据+深度模型”时代来临
云净网,中国大数据人工智能公司
为您提供最专业的内容安全解决方案